Spaces:

flax-community
/

dalle-mini

Running

boris commited on Oct 8, 2021

Commit

5ca30e6

1 Parent(s): 69cf636

feat: update scripts

Files changed (2) hide show

dev/seq2seq/do_big_run.sh CHANGED Viewed

@@ -2,15 +2,16 @@ python run_seq2seq_flax.py \
 	--dataset_repo_or_path dalle-mini/encoded \
 	--train_file **/train/*/*.jsonl \
 	--validation_file **/valid/*/*.jsonl \
-	--len_train 42684248 \
-	--len_eval 34328 \
 	--streaming \
 	--normalize_text \
 	--output_dir output \
 	--per_device_train_batch_size 56 \
 	--per_device_eval_batch_size 56 \
 	--preprocessing_num_workers 80 \
-	--warmup_steps 500 \
 	--gradient_accumulation_steps 8 \
 	--do_train \
 	--do_eval \

 	--dataset_repo_or_path dalle-mini/encoded \
 	--train_file **/train/*/*.jsonl \
 	--validation_file **/valid/*/*.jsonl \
+	--len_train 129847128 \
+	--len_eval 157312 \
+	--eval_steps 1000 \
 	--streaming \
 	--normalize_text \
 	--output_dir output \
 	--per_device_train_batch_size 56 \
 	--per_device_eval_batch_size 56 \
 	--preprocessing_num_workers 80 \
+	--warmup_steps 5000 \
 	--gradient_accumulation_steps 8 \
 	--do_train \
 	--do_eval \

dev/seq2seq/do_small_run.sh CHANGED Viewed

@@ -1,13 +1,13 @@
 python run_seq2seq_flax.py \
 	--dataset_repo_or_path dalle-mini/encoded \
-	--train_file **/train/*/*.jsonl \
 	--validation_file **/valid/*/*.jsonl \
-	--len_train 42684248 \
-	--len_eval 34328 \
 	--streaming \
 	--output_dir output \
-	--per_device_train_batch_size 56 \
-	--per_device_eval_batch_size 56 \
 	--preprocessing_num_workers 80 \
 	--warmup_steps 125 \
 	--gradient_accumulation_steps 8 \

 python run_seq2seq_flax.py \
 	--dataset_repo_or_path dalle-mini/encoded \
+	--train_file **/train/CC3M/*.jsonl \
 	--validation_file **/valid/*/*.jsonl \
+	--len_train 129847128 \
+	--len_eval 157312 \
 	--streaming \
 	--output_dir output \
+	--per_device_train_batch_size 16 \
+	--per_device_eval_batch_size 16 \
 	--preprocessing_num_workers 80 \
 	--warmup_steps 125 \
 	--gradient_accumulation_steps 8 \