failed script

Files changed (4) hide show

events.out.tfevents.1626538069.t1v-n-4e27a527-w-0.76098.3.v2 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:367d20009fec797ec8f588fa9bee718bf9c3cf3c0607dd97627eeaa4f8e9dfff
+size 40

run.sh CHANGED Viewed

@@ -1,17 +1,16 @@
 python run_clm_mp.py \
     	--model_name_or_path /mnt/disks/flaxdisk/norwegian-gptneo-red/ \
-  	--tokenizer_name /mnt/disks/flaxdisk/norwegian-gptneo-red/ \
-   	--train_file /mnt/disks/flaxdisk/corpus/social_train.json \
-       	--validation_file /mnt/disks/flaxdisk/corpus/social_validation.json \
      	--do_train \
        	--do_eval  \
      	--block_size 1024 \
-   	--num_train_epochs 10 \
    	--learning_rate 4e-6 \
 	--per_device_train_batch_size 3 \
        	--per_device_eval_batch_size 3 \
     	--overwrite_output_dir \
-	--output_dir /mnt/disks/flaxdisk/norwegian-gptneo-red \
 	--cache_dir /mnt/disks/flaxdisk/cache/ \
        	--dtype bfloat16 \
    	--logging_steps 97 \

 python run_clm_mp.py \
     	--model_name_or_path /mnt/disks/flaxdisk/norwegian-gptneo-red/ \
+  	--tokenizer_name gpt2 \
+   	--dataset_name wikitext --dataset_config_name wikitext-2-raw-v1 \
      	--do_train \
        	--do_eval  \
      	--block_size 1024 \
+   	--num_train_epochs 5 \
    	--learning_rate 4e-6 \
 	--per_device_train_batch_size 3 \
        	--per_device_eval_batch_size 3 \
     	--overwrite_output_dir \
+	--output_dir /mnt/disks/flaxdisk/output/ \
 	--cache_dir /mnt/disks/flaxdisk/cache/ \
        	--dtype bfloat16 \
    	--logging_steps 97 \

run_bak.sh ADDED Viewed

+python run_clm_mp.py \
+    	--model_name_or_path /mnt/disks/flaxdisk/norwegian-gptneo-red/ \
+  	--tokenizer_name /mnt/disks/flaxdisk/norwegian-gptneo-red/ \
+   	--train_file /mnt/disks/flaxdisk/corpus/social_train.json \
+       	--validation_file /mnt/disks/flaxdisk/corpus/social_validation.json \
+     	--do_train \
+       	--do_eval  \
+     	--block_size 1024 \
+   	--num_train_epochs 5 \
+   	--learning_rate 4e-6 \
+	--per_device_train_batch_size 3 \
+       	--per_device_eval_batch_size 3 \
+    	--overwrite_output_dir \
+	--output_dir /mnt/disks/flaxdisk/output/ \
+	--cache_dir /mnt/disks/flaxdisk/cache/ \
+       	--dtype bfloat16 \
+   	--logging_steps 97 \
+       	--eval_steps 96\
+	--push_to_hub

run_bak2.sh ADDED Viewed

+python run_clm_mp.py \
+    	--model_name_or_path /mnt/disks/flaxdisk/norwegian-gptneo-red/ \
+  	--tokenizer_name gpt2 \
+   	--dataset_name wikitext --dataset_config_name wikitext-2-raw-v1 \
+	#--train_file /mnt/disks/flaxdisk/corpus/social_train.json \
+       	#--validation_file /mnt/disks/flaxdisk/corpus/social_validation.json \
+     	--do_train \
+       	--do_eval  \
+     	--block_size 1024 \
+   	--num_train_epochs 5 \
+   	--learning_rate 4e-6 \
+	--per_device_train_batch_size 3 \
+       	--per_device_eval_batch_size 3 \
+    	--overwrite_output_dir \
+	--output_dir /mnt/disks/flaxdisk/output/ \
+	--cache_dir /mnt/disks/flaxdisk/cache/ \
+       	--dtype bfloat16 \
+   	--logging_steps 97 \
+       	--eval_steps 96\
+	--push_to_hub