o ¢ig.ã@s$UddlZddlmZddlmZmZmZmZmZm Z ddl mZddlm Z ddlmZmZeeefZeeeeefZeeeeefZdd d dœZeeeeeeffed<d dddededd dœZeeeeeeffed<e d¡edfedededede eedƒedd dœdedededededededefdd„ƒZe d¡edfededededede eedƒd d œdedededededededefd!d"„ƒZe d#¡edede eedƒd d$œdededededef d%d&„ƒZGd'd(„d(eƒZ gd)¢Z!dS)*éN)Údefaultdict)ÚDictÚListÚOptionalÚTupleÚUnionÚcasté)Ú get_array_ops)Úregistry)ÚFloatsXdÚ GeneratorçTçð?)ÚL2ÚL2_is_weight_decayÚ grad_clipÚSGD_DEFAULTSgü©ñÒMbP?gÍÌÌÌÌÌì?g+‡ÙÎ÷ï?g:Œ0âŽyE>rr)Ú learn_rateÚbeta1Úbeta2ÚepsrrrÚ ADAM_DEFAULTSzRAdam.v1rrrrr)rrrrrrÚuse_averagesrcCst||||||||dd S)NT)rrrrrrrÚ use_radam©Ú Optimizer)rrrrrrrr©rúD/home/ubuntu/.local/lib/python3.10/site-packages/thinc/optimizers.pyÚRAdamó÷rzAdam.v1)rrrrrrrcCst||||||||dd S)NF)rrrrrrrrr)rrrrrrrrrrrÚAdam8r r!zSGD.v1)rrrrc Cst||||dd|dS)Nr)rrrrrrr)rrrrrrrrÚSGDQs ùr"c@speZdZUdZeeefed<eeefed<eeeefed<ee e fed<eeefed<eeefed<eed<eed <eed <eed<eed<eed <e ed<e ed<eeeeed<gd¢Zed ededededddddœd ed ededededede de de fdd„Zdd„Zdd„Zddœd eee fd!ed"ed#efd$d%„Zd&d'„Zd(d)„Zd*S)+rz”Do various flavours of stochastic gradient descent, with first and second order momentum. Currently support 'vanilla' SGD, Adam, and RAdam. Úmom1Úmom2ÚaveragesÚ schedulesÚ nr_updateÚ last_seenrrÚb1Úb2rrrrÚ _radam_buffer)r#r$r%r&r'r(rrr)r*rrrrr+rrTF)rrrrrrrrrc Cs¤i|_i|_|ri|_nd|_i|_ttƒ|_ttƒ|_| d|¡| d|¡| d|¡| d|¡| d|¡| d|¡||_ | |_ dd „td ƒDƒ|_dS)al Initialize an optimizer. learn_rate (float): The initial learning rate. L2 (float): The L2 regularization term. beta1 (float): First-order momentum. beta2 (float): Second-order momentum. eps (float): Epsilon term for Adam etc. grad_clip (float): Gradient clipping. use_averages (bool): Whether to track moving averages of the parameters. use_radam (bool): Whether to use the RAdam optimizer. L2_is_weight_decay (bool): Whether to interpret the L2 parameter as a weight decay term, in the style of the AdamW optimizer. Nrrr)r*rrcSsg|]}gd¢‘qS))NNNr)Ú.0Ú_rrrÚ ºsz&Optimizer.__init__..é ) r#r$r%r&rÚintr'r(Ú_set_attr_or_schedulerrÚranger+) ÚselfrrrrrrrrrrrrÚ__init__Žs" zOptimizer.__init__c Cs’t|tttfƒrt|||ƒdSt|tƒrt|ƒ}||j|<zt||t|ƒƒWdSt t fyH}zd|›dt|ƒ›d|›}t|ƒ‚d}~ww)NzInvalid schedule for 'z' (z) ) Ú isinstanceÚfloatÚboolr0ÚsetattrÚlistÚiterr&ÚnextÚ StopIterationÚ TypeErrorÚtypeÚ ValueError)r3ÚnameÚvalueÚeÚerrrrrr1¼s €þzOptimizer._set_attr_or_schedulec CsN|j ¡D]\}}zt|ƒ}Wntyt||ƒ}Ynwt|||ƒqdS)N)r&Úitemsr;r<Úgetattrr8)r3ÚkeyÚschedulerArrrÚstep_schedulesÉsÿûzOptimizer.step_schedulesr)Úlr_scalerFÚweightsÚgradientrIcCsNt|ƒdkr ||fSt|ƒ}|j|d7<|j|}|jdkr+|js+||j|7}|jr5| ||j¡}|jrE| ||||||¡\}}n'|j dkr\|j dkr\| ||||||¡\}}n|j dkrct‚|||j |8}|d9}|jdkr„|jr„|||j |j|8}|jdur£||jvr™|j|jdd|j|<| |j|||¡||fS)z•Call the optimizer with weights and a gradient. The key is the identifier for the parameter, usually the node ID and parameter name. r rrNÚfloat32)Údtype)Úlenr r'rrrÚ clip_gradientrÚ_radamr)r*Ú_adamÚNotImplementedErrorrr%ÚallocÚshapeÚupdate_averages)r3rFrJrKrIÚopsÚnr_updrrrÚ__call__Ñs8 ÿ ÿ zOptimizer.__call__cCsº||jvr| |j¡|j|<||jvr| |j¡|j|<| ||j¡}| ||j¡}|j||j||j|dœ} |j|j|jg|j d|j dœ} d}| d| d}} | d\}}| |9} | d||d 7} ||9}|d||7}| d d7<| dt| d dƒ}| d |d kr™|d|d }}na| d |d <|| d }d d|d}|d | d |d|}||d<|dkrçt d||d|d|d |||d ¡d|| d }n|rôdd|| d }nd}||d <|dkr+| dd kr|| d| d|7}|j | ¡| d}||| d||7}n$|d krO| dd krD|| d| d|7}||| d|7}| ||j¡| ||j¡fS)N)ÚstepÚexp_avgÚ exp_avg_sqr)ÚlrÚbetasrÚweight_decayÚbufferTrZr[r]r érYr_r/rééréÿÿÿÿr^r\r)r#Úalloc1fÚsizer$Ú reshape1fr'rr)r*rr+r0ÚmathÚsqrtÚxpÚ reshape_frT)r3rVrJÚgradrIrFrWÚ weights_1DÚgradient_1DÚstateÚgroupÚdegenerated_to_sgdrZr[rrÚbufferedÚN_smaÚ step_sizeÚbeta2_tÚ N_sma_maxÚdenomrrrrPús„ ý ûÿþýüûúÿø þzOptimizer._radamcCsø| ||j¡}| ||j¡}||jvr| |j¡|j|<||jvr*| |j¡|j|<|j|} |j|} |j}|j}d||} d||}|j|d| }|j}| ||| | |||||¡\}}} } | |j|<| |j|<| ||j¡| ||j¡fS)Nrgà?)rfrer#rdr$r)r*rrÚadamrjrT)r3rVrJrKrIrFrWrlrmr#r$r)r*Úfix1Úfix2r\rrrrrQHs, ÿ þzOptimizer._adamN)Ú__name__Ú __module__Ú__qualname__Ú__doc__rÚKeyTrÚ__annotations__rÚstrr r0r6r7rÚ __slots__rÚ FloatOrSeqr4r1rHrrXrPrQrrrrresv õþüûúùø ÷ ö õ. ú þýü ú)Nr)r!rr"rrr)"rgÚcollectionsrÚtypingrrrrrrÚbackendsr ÚconfigrÚtypesrr r0r€r~r6r‚ÚIntOrSeqrr7rrÚ optimizersrr!r"ÚobjectrÚ__all__rrrrÚs¼ ý ùÿ÷ÿýüûúùø ÷ÿ÷ÿýüûúùø ÷úÿýüûú