o }o™iôã@sddlZddlZddlmZddlmZddlmZddl m Z ddlmZddl mZddlmZdd lmZdd lmZddlmZdd „ZedkreƒZiZdd„edƒDƒed<eddedZeejddddeddZe jj jj!dddddddd d d!ddd"Z"e jj jj#e"ejd#Z ej$d$d$ej%d%d&d'Z&ed(d)Z'e'gZ(ej)d*d*ej*d+Z+ed,d-d%d*d d.Z,ee,d/Z-ej.d0krÄe j. /¡Z.ndZ.ej0ej1ej2d1e&e(d$d2d3ej3d4d5d6 Z4ej5duréeej6ej5d7d8Z7ndZ7eej6d%ej8e7d9Z9ee e+ee4e.e9e-d:dSdS);éN)ÚWandbLogger)ÚOptimizerConfig)Ú lightning)Úllm)Úfinetune)ÚSquadDataModule)Úget_nmt_tokenizer)Ú NeMoLogger)ÚModelCheckpoint)ÚMegatronOptimizerModulecCsªtjdd}|jdtdd|jdtdd|jdtd d d|jdtdd d|jdtdd|jdtdd|jdtddd|jdtdd|jdtdd| ¡S)Nz%Train a small T5 model using NeMo 2.0)Údescriptionz --devicesz%Number of devices to use for training)ÚtypeÚhelpz--max-stepszNumber of steps to train forz--peftÚnoneznone | lora)r Údefaultrz --data-dirzdirectory to finetuning dataz--experiment-dirz-directory to write results and checkpoints toz--experiment-namezname of experimentz--wandb-projectzwandb project namez--checkpoint-pathzPath to checkpoint dirz--index-mapping-dirz$directory to write index mappings to)ÚargparseÚArgumentParserÚadd_argumentÚintÚstrÚ parse_args)Úparser©rú`/home/ubuntu/.local/lib/python3.10/site-packages/tests/collections/llm/megatron_t5_finetuning.pyÚget_args"srÚ__main__cCsg|]}d|›d‘qS)z r)Ú.0ÚirrrÚ 6srédÚadditional_special_tokensÚmegatronÚBertWordPieceCase)Úspecial_tokensié€éé)Údataset_rootÚ seq_lengthÚseq_length_decÚmicro_batch_sizeÚglobal_batch_sizeÚ tokenizerÚnum_workerséiié@g¸…ëQ¸Ž?gš™™™™™¹?gñhãˆµøä>)Ú num_layersÚencoder_num_layersÚhidden_sizeÚffn_hidden_sizeÚnum_attention_headsÚkv_channelsÚinit_method_stdÚhidden_dropoutÚattention_dropoutÚlayernorm_epsilonÚmake_vocab_size_divisible_byÚmax_position_embeddings)r-éFÚlog_all)Útensor_model_parallel_sizeÚpipeline_model_parallel_sizeÚpipeline_dtypeÚckpt_load_optimizerÚckpt_load_strictnessiˆ)Úevery_n_train_stepsT)Úresume_if_existsÚresume_ignore_no_checkpointÚresume_from_pathÚadamgñhãˆµøô>)Ú optimizerÚlrÚuse_distributed_optimizerÚbf16Úweight_decay)ÚconfigÚloraÚgpuéé2z bf16-mixed)Ú precision) ÚdevicesÚ max_stepsÚacceleratorÚstrategyÚ callbacksÚlog_every_n_stepsÚlimit_val_batchesÚval_check_intervalÚpluginsÚall)ÚnameÚprojectÚ log_model)r^Úuse_datetime_versionÚlog_dirÚwandb)ÚmodelÚresumeÚdataÚtrainerÚpeftÚlogÚoptim):rÚtorchÚlightning.pytorch.loggersrÚmegatron.core.optimizerrÚnemorÚnlÚnemo.collectionsrÚnemo.collections.llm.apirÚnemo.collections.llm.t5.datarÚ3nemo.collections.nlp.modules.common.tokenizer_utilsrÚnemo.lightningr Ú nemo.lightning.pytorch.callbacksr Ú%nemo.lightning.pytorch.optim.megatronrrÚ__name__Úargsr$Úranger-Údata_dirrfÚt5rdÚT5ConfigÚ t5_configÚT5ModelÚMegatronStrategyÚfloat32rWÚcheckpoint_callbackrXÚ AutoResumeÚcheckpoint_pathreÚ opt_configÚoptrhÚLoRAÚTrainerrTrUÚMegatronMixedPrecisionrgÚ wandb_projectÚexperiment_nameÚwandb_loggerÚexperiment_dirÚnemo_loggerrrrrÚsÚ ýù ôûÿýûÿ ÷ ýü ù