Training in progress, epoch 0

Browse files

Files changed (6) hide show

config.json +1 -1
eval_job_output.txt +341 -59
logs/events.out.tfevents.1716139274.sphinx2 +3 -0
model.safetensors +1 -1
train_job_output.txt +0 -0
training_args.bin +2 -2

config.json CHANGED Viewed

@@ -23,7 +23,7 @@
   "rotary_pct": 0.25,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
-  "transformers_version": "4.39.3",
   "use_cache": true,
   "use_parallel_residual": true,
   "vocab_size": 50304

   "rotary_pct": 0.25,
   "tie_word_embeddings": false,
   "torch_dtype": "float32",
+  "transformers_version": "4.40.2",
   "use_cache": true,
   "use_parallel_residual": true,
   "vocab_size": 50304

eval_job_output.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-slurm submission log: 2024-05-08 15:15:19.808042
 created following sbatch script:
 ###############################
@@ -7,24 +7,24 @@ created following sbatch script:
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
-#SBATCH --dependency=afterok:7590696
 #SBATCH --gres=gpu:1
-#SBATCH --job-name=tthrush-job-478757
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx2
 #SBATCH --open-mode=append
-#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
 # activate your desired anaconda environment
-. /nlp/scr/tthrush/miniconda3/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
 # cd to working directory
 cd .
 # launch commands
-srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa/perf'
 ###############################
@@ -34,67 +34,265 @@ submission to slurm complete!
 ###############################
 slurm submission output
-Submitted batch job 7590697
 ###############################
 ###############################
-start time: 2024-05-08 16:46:03.300046
-machine: sphinx2
-conda env: pretraining-coreset-selection
 ###############################
-running following processes
-	lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa/perf
 ###############################
-command outputs:
-2024-05-08:16:46:16,301 INFO     [utils.py:145] Note: detected 255 virtual cores but NumExpr set to maximum of 64, check "NUMEXPR_MAX_THREADS" environment variable.
-2024-05-08:16:46:16,301 INFO     [utils.py:148] Note: NumExpr detected 255 cores but "NUMEXPR_MAX_THREADS" not set, so enforcing safe limit of 8.
-2024-05-08:16:46:16,301 INFO     [utils.py:160] NumExpr defaulting to 8 threads.
-2024-05-08:16:46:18,703 INFO     [config.py:58] PyTorch version 2.2.2 available.
-2024-05-08:16:46:38,285 INFO     [__main__.py:156] Verbosity set to INFO
-2024-05-08:16:46:52,372 WARNING  [__init__.py:194] Some tasks could not be loaded due to missing dependencies. Run with `--verbosity DEBUG` for full details.
-/nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/lib/python3.10/site-packages/datasets/load.py:1429: FutureWarning: The repository for hails/mmlu_no_train contains custom code which must be executed to correctly load the dataset. You can inspect the repository content at https://hf.co/datasets/hails/mmlu_no_train
-You can avoid this message in future by passing the argument `trust_remote_code=True`.
-Passing `trust_remote_code=True` will be mandatory to load this dataset from the next major release of `datasets`.
-  warnings.warn(
-2024-05-08:16:48:12,611 WARNING  [__init__.py:194] Some tasks could not be loaded due to missing dependencies. Run with `--verbosity DEBUG` for full details.
-2024-05-08:16:48:12,617 INFO     [__main__.py:229] Selected Tasks: ['arc_easy', 'lambada', 'piqa', 'sciq', 'xnli_en', 'xnli_fr']
-2024-05-08:16:48:12,899 INFO     [huggingface.py:148] Using device 'cuda'
-Traceback (most recent call last):
-  File "/nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/bin/lm_eval", line 8, in <module>
-    sys.exit(cli_evaluate())
-  File "/sailhome/tthrush/lm-evaluation-harness/lm_eval/__main__.py", line 231, in cli_evaluate
-    results = evaluator.simple_evaluate(
-  File "/sailhome/tthrush/lm-evaluation-harness/lm_eval/utils.py", line 415, in _wrapper
-    return fn(*args, **kwargs)
-  File "/sailhome/tthrush/lm-evaluation-harness/lm_eval/evaluator.py", line 98, in simple_evaluate
-    lm = lm_eval.api.registry.get_model(model).create_from_arg_string(
-  File "/sailhome/tthrush/lm-evaluation-harness/lm_eval/api/model.py", line 134, in create_from_arg_string
-    return cls(**args, **args2)
-  File "/sailhome/tthrush/lm-evaluation-harness/lm_eval/models/huggingface.py", line 174, in __init__
-    self._get_config(
-  File "/sailhome/tthrush/lm-evaluation-harness/lm_eval/models/huggingface.py", line 420, in _get_config
-    self._config = transformers.AutoConfig.from_pretrained(
-  File "/nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/lib/python3.10/site-packages/transformers/models/auto/configuration_auto.py", line 1138, in from_pretrained
-    config_dict, unused_kwargs = PretrainedConfig.get_config_dict(pretrained_model_name_or_path, **kwargs)
-  File "/nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/lib/python3.10/site-packages/transformers/configuration_utils.py", line 631, in get_config_dict
-    config_dict, kwargs = cls._get_config_dict(pretrained_model_name_or_path, **kwargs)
-  File "/nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/lib/python3.10/site-packages/transformers/configuration_utils.py", line 686, in _get_config_dict
-    resolved_config_file = cached_file(
-  File "/nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/lib/python3.10/site-packages/transformers/utils/hub.py", line 369, in cached_file
-    raise EnvironmentError(
-OSError: /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa does not appear to have a file named config.json. Checkout 'https://huggingface.co//juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa/tree/main' for available files.
 ###############################
-end time: 2024-05-08 16:48:23.445722
-elapsed time: 0:02:20.145676
-slurm submission log: 2024-05-09 07:34:41.456517
 created following sbatch script:
 ###############################
@@ -103,24 +301,108 @@ created following sbatch script:
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
-#SBATCH --dependency=afterok:7591656
 #SBATCH --gres=gpu:1
-#SBATCH --job-name=tthrush-job-942141
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx2
 #SBATCH --open-mode=append
-#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
 # activate your desired anaconda environment
-. /nlp/scr/tthrush/miniconda3/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
 # cd to working directory
 cd .
 # launch commands
-srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/llms/pythia-14m_piqa/perf'
 ###############################
@@ -130,7 +412,7 @@ submission to slurm complete!
 ###############################
 slurm submission output
-Submitted batch job 7591657

+slurm submission log: 2024-05-19 09:14:41.870170
 created following sbatch script:
 ###############################
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631089
 #SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-4203243
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx2
 #SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
 # activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
 # cd to working directory
 cd .
 # launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
 ###############################
 ###############################
 slurm submission output
+Submitted batch job 7631090
 ###############################
+slurm submission log: 2024-05-19 09:16:21.073119
+created following sbatch script:
+###############################
+#!/bin/bash
+#SBATCH --account=nlp
+#SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631150
+#SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-3010961
+#SBATCH --mem=60G
+#SBATCH --nodelist=sphinx2
+#SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
+#SBATCH --partition=sphinx
+#SBATCH --time=14-0
+# activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
+# cd to working directory
+cd .
+# launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
+###############################
+submission to slurm complete!
+###############################
+slurm submission output
+Submitted batch job 7631151
+###############################
+slurm submission log: 2024-05-19 09:25:08.396129
+created following sbatch script:
+###############################
+#!/bin/bash
+#SBATCH --account=nlp
+#SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631221
+#SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-4399372
+#SBATCH --mem=60G
+#SBATCH --nodelist=sphinx2
+#SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
+#SBATCH --partition=sphinx
+#SBATCH --time=14-0
+# activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
+# cd to working directory
+cd .
+# launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
+###############################
+submission to slurm complete!
+###############################
+slurm submission output
+Submitted batch job 7631222
+###############################
+slurm submission log: 2024-05-19 09:27:21.404018
+created following sbatch script:
+###############################
+#!/bin/bash
+#SBATCH --account=nlp
+#SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631284
+#SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-1884627
+#SBATCH --mem=60G
+#SBATCH --nodelist=sphinx2
+#SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
+#SBATCH --partition=sphinx
+#SBATCH --time=14-0
+# activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
+# cd to working directory
+cd .
+# launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
+###############################
+submission to slurm complete!
+###############################
+slurm submission output
+Submitted batch job 7631285
+###############################
+slurm submission log: 2024-05-19 09:28:18.004148
+created following sbatch script:
+###############################
+#!/bin/bash
+#SBATCH --account=nlp
+#SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631348
+#SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-1636654
+#SBATCH --mem=60G
+#SBATCH --nodelist=sphinx2
+#SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
+#SBATCH --partition=sphinx
+#SBATCH --time=14-0
+# activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
+# cd to working directory
+cd .
+# launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
+###############################
+submission to slurm complete!
+###############################
+slurm submission output
+Submitted batch job 7631349
+###############################
+slurm submission log: 2024-05-19 09:29:20.681949
+created following sbatch script:
+###############################
+#!/bin/bash
+#SBATCH --account=nlp
+#SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631409
+#SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-2759412
+#SBATCH --mem=60G
+#SBATCH --nodelist=sphinx2
+#SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
+#SBATCH --partition=sphinx
+#SBATCH --time=14-0
+# activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
+# cd to working directory
+cd .
+# launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
+###############################
+submission to slurm complete!
+###############################
+slurm submission output
+Submitted batch job 7631410
 ###############################
+slurm submission log: 2024-05-19 09:30:34.292755
+created following sbatch script:
+###############################
+#!/bin/bash
+#SBATCH --account=nlp
+#SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631469
+#SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-4781467
+#SBATCH --mem=60G
+#SBATCH --nodelist=sphinx2
+#SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
+#SBATCH --partition=sphinx
+#SBATCH --time=14-0
+# activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
+# cd to working directory
+cd .
+# launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
 ###############################
+submission to slurm complete!
 ###############################
+slurm submission output
+Submitted batch job 7631470
 ###############################
+slurm submission log: 2024-05-19 09:31:39.869529
 created following sbatch script:
 ###############################
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631529
 #SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-2913641
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx2
 #SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
+#SBATCH --partition=sphinx
+#SBATCH --time=14-0
+# activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
+# cd to working directory
+cd .
+# launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
+###############################
+submission to slurm complete!
+###############################
+slurm submission output
+Submitted batch job 7631530
+###############################
+slurm submission log: 2024-05-19 09:34:33.468022
+created following sbatch script:
+###############################
+#!/bin/bash
+#SBATCH --account=nlp
+#SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631593
+#SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-2085637
+#SBATCH --mem=60G
+#SBATCH --nodelist=sphinx2
+#SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
+#SBATCH --partition=sphinx
+#SBATCH --time=14-0
+# activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
+# cd to working directory
+cd .
+# launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
+###############################
+submission to slurm complete!
+###############################
+slurm submission output
+Submitted batch job 7631594
+###############################
+slurm submission log: 2024-05-19 09:45:20.755632
+created following sbatch script:
+###############################
+#!/bin/bash
+#SBATCH --account=nlp
+#SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7631663
+#SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-1519057
+#SBATCH --mem=60G
+#SBATCH --nodelist=sphinx1
+#SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
 # activate your desired anaconda environment
+. /nlp/scr/tthrush/miniconda3/envs/pretraining-coreset-selection/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
 # cd to working directory
 cd .
 # launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1,revision=main,dtype=float16,trust_remote_code=True --tasks xnli_en,xnli_fr,sciq,piqa,lambada,arc_easy --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/14m_llm_seeds_more_data/pythia-14m_piqa_1/perf'
 ###############################
 ###############################
 slurm submission output
+Submitted batch job 7631664

logs/events.out.tfevents.1716139274.sphinx2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7205004b6380aaabe1bc990ab9d6ac1255680e7e4e7c874d56b4feff4207f3b8
+size 62915

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:fb7ac611e2cfac4a1797cf2eb619c6f4234c50633edc03c4f04aba834a682447
 size 56279344

 version https://git-lfs.github.com/spec/v1
+oid sha256:3afd047f9e5e4ca187b5da65a2eb8e83ffe8cd36e546c2a2d02bb834f72e0369
 size 56279344

train_job_output.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:44b10589ffdbb717e36eb18a5c618b90ac401425ea6ab7d2f777359d5bf576c7
-size 5048

 version https://git-lfs.github.com/spec/v1
+oid sha256:a2bb7b3dce46a3ed23526d06f496a5d2feb3176cdf51b3c78e887057bddf0e2e
+size 5176