#!/bin/bash #export TPU_IP_ADDRESS=10.8.195.90; #export XRT_TPU_CONFIG="tpu_worker;0;$TPU_IP_ADDRESS:8470" #export TPU_NAME="grpc://$TPU_IP_ADDRESS:8470" export XRT_WORKERS="localservice:0;grpc://localhost:40934" export XRT_DEVICE_MAP="CPU:0;/job:localservice/replica:0/task:0/device:XLA_CPU:0|GPU:0;/job:localservice/replica:0/task:0/device:XLA_GPU:0" #export PYTHONPATH=$SCRATCH/:${PYTHONPATH} #export PYTHONPATH=/gpfsscratch/rech/imi/usc19dv/lib/python3.7/site-packages:${PYTHONPATH} module load pytorch-gpu/py3/1.8.0 py=python3 #root_dir=$SCRATCH/data root_dir=data exp=$1 ####aistpp_60hz #data_dir=${root_dir}/scaled_features #hparams_file=aistpp_60hz/${exp} ####aistpp_20hz #data_dir=${root_dir}/aistpp_20hz #hparams_file=aistpp_20hz/${exp} ####moglow_pos #data_dir=${root_dir}/moglow_pos #hparams_file=moglow_pos/${exp} ####dance_combined #data_dir=${root_dir}/dance_combined #data_dir=${root_dir}/dance_combined2 data_dir=${root_dir}/dance_combined3 hparams_file=dance_combined/${exp} echo $exp #echo $RANK #echo $LOCAL_RANK echo $SLURM_PROCID export LOCAL_RANK=$SLURM_LOCALID # export的作用:为了使用户定义的变量在所有的子 Shell 环境中能够继续使用, # 减少重复设置工作,可以通过内部命令 export 将指定的变量导出为全局变量。 $py training/train.py --data_dir=${data_dir} \ --max_epochs=1000\ --hparams_file=training/hparams/${hparams_file}.yaml \ --experiment_name=$exp\ --workers=$(nproc) \ --gpus=-1 \ --accelerator=ddp \ ${@:2} #NOTE: can override experiment_name, and any of the options above #--batch_size=32 \ #--plugins=deepspeed \ #--precision=16 \ #--gradient_clip_val=0.5 \ #--sync_batchnorm \ #--lr_policy=LinearWarmupCosineAnnealing \ #--auto_lr_find \ #--do_tuning \ #--learning_rate=7e-5 \ #--batch_size=84 \ #--num_nodes=4 \ #--output_lengths=3 \ #--dropout=0.1 \ #--vae_dhid=128 \ #--optimizer=madgrad \ #--learning_rate=1e-3 \ #--use_x_transformers \ #--use_rotary_pos_emb \ #--batch_size=84 \ #--lr_policy=reduceOnPlateau \ #--learning_rate=1e-4 \ #--use_pos_emb_output \ #--flow_dist=studentT \ #--gradient_clip_val=1 \ #--flow_dist=studentT \ #--fix_lengths \ #--use_x_transformers \ #--use_rotary_pos_emb \ #--output_lengths="3" \ #--scales="[[16,0]]" \ #--residual_scales="[[16,0]]" # --glow_norm_layer="actnorm" \ #--use_pos_emb_output \ # --tpu_cores=8 \