o #’×iã@sfUddlmZmZmZddlZddlmmZddlm Z gZ eeed<ej jGdd„dƒƒZdS)é)ÚDictÚListÚOptionalN)ÚTensorÚ__all__c@s‚eZdZ ddeededededed ed ededed efdd„Zdedeefdd„Z deeefdd„Z dS)Ú_FunctionalSGDç{®Gáz„?çFÚparamsÚlrÚmomentumÚ dampeningÚweight_decayÚnesterovÚmaximizeÚforeachÚfusedÚ_allow_empty_param_listcCsr||||dœ|_||_||_||_| |_tj ttj tt tj ffi¡|_t|ƒdkr2| s2t dƒ‚d|i|_dS)N)rrr rrz%optimizer got an empty parameter listr )ÚdefaultsrrrrÚtorchÚjitÚannotaterrÚstrÚstateÚlenÚ ValueErrorÚparam_group)Úselfr rrr rrrrrr©rúd/home/ubuntu/SoloSpeech/.venv/lib/python3.10/site-packages/torch/distributed/optim/functional_sgd.pyÚ__init__sü$z_FunctionalSGD.__init__ÚparamÚgradc Cs|jd}|jd}|jd}|jd}|g}g}g} d} |durK| |¡|jr+d} ||jvr5i|j|<|j|}d|vrD| d¡n| |d¡t ¡tj|| ||||||j|j | |j |jddd Wdƒn1sqwY|j|}|d }|dur‰||d<dSdS)z[Similar to self.step, but operates on a single parameter and its gradient. rrr rFNTÚmomentum_buffer©rrrr rrÚhas_sparse_gradrrÚ grad_scaleÚ found_infr)rÚappendÚ is_sparserrÚno_gradÚFÚsgdrrrr) rr!r"rrr rr Úmomentum_buffer_listÚgradsr%rr#rrrÚ step_param6sR òÿ ÿz_FunctionalSGD.step_paramÚ gradientscCs€|jd}g}g}g}|jd}|jd}|jd}|jd} t|ƒt|ƒkr:tddt|ƒ›dd t|ƒ›ƒ‚d } t||ƒD]7\}}|durx| |¡| |¡|jrXd} ||jvrbi|j|<|j|} d| vrq| d¡qA| | d¡qAt ¡t j||||||| |j|j | |j|jddd Wdƒn1sŸwYt|ƒD]\}}|j|} ||}|dur½|| d<q¨dS)Nr rrrr zEthe gradients passed in does not equal to the size of the parameters!zParams length: z. zGradients length: FTr#r$)rrrrÚzipr(r)rrr*r+r,rrrrÚ enumerate)rr0r Úparams_with_gradr.r-rrrr r%r!ÚgradientrÚiÚpr#rrrÚstephsn ÿþÿ € òÿ €üz_FunctionalSGD.stepN) rr r r FFFFF)Ú__name__Ú __module__Ú__qualname__rrÚfloatÚboolr rr/r7rrrrrsBõþýüûúùø ÷ ö õ 2r)ÚtypingrrrrÚtorch.optim._functionalÚoptimÚ_functionalr+rrrÚ__annotations__rÚscriptrrrrrÚs