flax-community
/

roberta-base-thai

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

sakares commited on Jul 17, 2021

Commit

6665f93

•

1 Parent(s): 6e833e6

fix run.sh

Files changed (1) hide show

run.sh +6 -6

run.sh CHANGED Viewed

@@ -9,17 +9,17 @@ python3 run_mlm_flax.py \
     --max_seq_length="128" \
     --weight_decay="0.01" \
     --preprocessing_num_workers="64" \
-    --per_device_train_batch_size="256" \
-    --per_device_eval_batch_size="256" \
     --learning_rate="3e-5" \
-    --warmup_steps="5000" \
     --overwrite_output_dir \
     --seed="19" \
     --num_train_epochs="8" \
     --adam_beta1="0.9" \
     --adam_beta2="0.98" \
-    --logging_steps="62" \
-    --save_steps="625" \
-    --eval_steps="2500" \
     --dtype="bfloat16" \
     --push_to_hub

     --max_seq_length="128" \
     --weight_decay="0.01" \
     --preprocessing_num_workers="64" \
+    --per_device_train_batch_size="512" \
+    --per_device_eval_batch_size="512" \
     --learning_rate="3e-5" \
+    --warmup_steps="312" \
     --overwrite_output_dir \
     --seed="19" \
     --num_train_epochs="8" \
     --adam_beta1="0.9" \
     --adam_beta2="0.98" \
+    --logging_steps="31" \
+    --save_steps="312" \
+    --eval_steps="1250" \
     --dtype="bfloat16" \
     --push_to_hub