Saving weights and logs of step 10000

Files changed (8) hide show

flax_model.msgpack ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:551fdc978da02b8bb2d4c532488e94af3ed1bb471671edc02611cd5ef07f1e00
+size 711588089

merges.txt CHANGED Viewed

File without changes

run_mlm_flax.py CHANGED Viewed

@@ -31,7 +31,7 @@ from pathlib import Path
 from typing import Dict, List, Optional, Tuple
 import numpy as np
-from datasets import load_dataset
 from tqdm import tqdm
 import flax

 from typing import Dict, List, Optional, Tuple
 import numpy as np
+from datasets import load_dataset, load_from_disk
 from tqdm import tqdm
 import flax

special_tokens_map.json CHANGED Viewed

File without changes

start_train.sh CHANGED Viewed

@@ -6,7 +6,7 @@ python3 run_mlm_flax.py \
     --config_name="./" \
     --tokenizer_name="./" \
     --dataset_filepath="/researchdisk1/data/training_data_full" \
-    --save_tokenized_dataset_filepath="/researchdisk1/data/training_data_full_tokenized_128" \
     --max_seq_length="128" \
     --pad_to_max_length \
     --preprocessing_num_workers="96" \
@@ -22,4 +22,5 @@ python3 run_mlm_flax.py \
     --eval_steps="10000" \
     --logging_steps="1000" \
     --dtype="bfloat16" \
     --push_to_hub

     --config_name="./" \
     --tokenizer_name="./" \
     --dataset_filepath="/researchdisk1/data/training_data_full" \
+    --tokenized_dataset_filepath="/researchdisk1/data/training_data_full_tokenized_128" \
     --max_seq_length="128" \
     --pad_to_max_length \
     --preprocessing_num_workers="96" \
     --eval_steps="10000" \
     --logging_steps="1000" \
     --dtype="bfloat16" \
+    --adafactor \
     --push_to_hub

tokenizer.json CHANGED Viewed

File without changes

tokenizer_config.json CHANGED Viewed

File without changes

vocab.json CHANGED Viewed

File without changes