o ß—¦i>ã@srUddlmZmZmZddlZddlmmZddlm Z ddl mZgZee ed<ejjGdd„dƒƒZdS)é)ÚDictÚListÚOptionalN)ÚTensor)Ú2_scripted_functional_optimizer_deprecation_warningÚ__all__c@s‚eZdZ ddeededededed ed ededed efdd„Zdedeefdd„Z deeefdd„Z dS)Ú_FunctionalSGDç{®Gáz„?çFÚparamsÚlrÚmomentumÚ dampeningÚweight_decayÚnesterovÚmaximizeÚforeachÚfusedÚ_allow_empty_param_listcCs|tdd||||dœ|_||_||_||_| |_tj t tj t ttj ffi¡|_t |ƒdkr7| s7tdƒ‚d|i|_dS)Né)Ú stacklevel)rr rrrz%optimizer got an empty parameter listr)rÚdefaultsrrrrÚtorchÚjitÚannotaterrÚstrÚstateÚlenÚ ValueErrorÚparam_group)Úselfrrr rrrrrrr©r!úd/home/ubuntu/transcripts/venv/lib/python3.10/site-packages/torch/distributed/optim/functional_sgd.pyÚ__init__s ü$z_FunctionalSGD.__init__ÚparamÚgradc Cs|jd}|jd}|jd}|jd}|g}g}g} d} |durK| |¡|jr+d} ||jvr5i|j|<|j|}d|vrD| d¡n| |d¡t ¡tj|| ||||||j|j | |j |jddd Wdƒn1sqwY|j|}|d }|dur‰||d<dSdS)z[Similar to self.step, but operates on a single parameter and its gradient. rr rrFNTÚmomentum_buffer©rr rrrrÚhas_sparse_gradrrÚ grad_scaleÚ found_infr)rÚappendÚ is_sparserrÚno_gradÚFÚsgdrrrr) r r$r%rr rrrÚmomentum_buffer_listÚgradsr(rr&r!r!r"Ú step_param;sR òÿ ÿz_FunctionalSGD.step_paramÚ gradientscCs€|jd}g}g}g}|jd}|jd}|jd}|jd} t|ƒt|ƒkr:tddt|ƒ›dd t|ƒ›ƒ‚d } t||ƒD]7\}}|durx| |¡| |¡|jrXd} ||jvrbi|j|<|j|} d| vrq| d¡qA| | d¡qAt ¡t j||||||| |j|j | |j|jddd Wdƒn1sŸwYt|ƒD]\}}|j|} ||}|dur½|| d<q¨dS)Nrrrr rzEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: FTr&r')rrrrÚzipr+r,rrr-r.r/rrrrÚ enumerate)r r3rÚparams_with_gradr1r0rrr rr(r$ÚgradientrÚiÚpr&r!r!r"Ústepmsn ÿþÿ € òÿ €üz_FunctionalSGD.stepN) r r r r FFFFF)Ú__name__Ú __module__Ú__qualname__rrÚfloatÚboolr#rr2r:r!r!r!r"rsBõþýüûúùø ÷ ö õ!2r)ÚtypingrrrrÚtorch.optim._functionalÚoptimÚ_functionalr.rÚ,torch.distributed.optim._deprecation_warningrrrÚ__annotations__rÚscriptrr!r!r!r"Ús