Training in progress, epoch 0

Browse files

Files changed (5) hide show

eval_job_output.txt +18 -60
logs/events.out.tfevents.1716893914.sphinx2 +3 -0
model.safetensors +1 -1
train_job_output.txt +0 -0
training_args.bin +2 -2

eval_job_output.txt CHANGED Viewed

@@ -1,4 +1,4 @@
-slurm submission log: 2024-05-26 22:30:10.163518
 created following sbatch script:
 ###############################
@@ -7,13 +7,13 @@ created following sbatch script:
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
-#SBATCH --dependency=afterok:7653550
 #SBATCH --gres=gpu:1
-#SBATCH --job-name=tthrush-job-4835795
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx1
 #SBATCH --open-mode=append
-#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
@@ -24,7 +24,7 @@ created following sbatch script:
 cd .
 # launch commands
-srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1,revision=main,dtype=float16,trust_remote_code=True --tasks piqa,arc_easy,xnli_en,xnli_fr,xnli_de,xnli_es,sciq,lambada --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1/perf'
 ###############################
@@ -34,13 +34,13 @@ submission to slurm complete!
 ###############################
 slurm submission output
-Submitted batch job 7653551
 ###############################
-slurm submission log: 2024-05-26 22:32:51.779115
 created following sbatch script:
 ###############################
@@ -49,13 +49,13 @@ created following sbatch script:
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
-#SBATCH --dependency=afterok:7653580
 #SBATCH --gres=gpu:1
-#SBATCH --job-name=tthrush-job-1247637
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx1
 #SBATCH --open-mode=append
-#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
@@ -66,7 +66,7 @@ created following sbatch script:
 cd .
 # launch commands
-srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1,revision=main,dtype=float16,trust_remote_code=True --tasks piqa,arc_easy,xnli_en,xnli_fr,xnli_de,xnli_es,sciq,lambada --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1/perf'
 ###############################
@@ -76,13 +76,13 @@ submission to slurm complete!
 ###############################
 slurm submission output
-Submitted batch job 7653581
 ###############################
-slurm submission log: 2024-05-26 22:58:04.194573
 created following sbatch script:
 ###############################
@@ -91,13 +91,13 @@ created following sbatch script:
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
-#SBATCH --dependency=afterok:7653635
 #SBATCH --gres=gpu:1
-#SBATCH --job-name=tthrush-job-3480785
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx1
 #SBATCH --open-mode=append
-#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
@@ -108,7 +108,7 @@ created following sbatch script:
 cd .
 # launch commands
-srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1,revision=main,dtype=float16,trust_remote_code=True --tasks piqa,arc_easy,xnli_en,xnli_fr,xnli_de,xnli_es,sciq,lambada --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1/perf'
 ###############################
@@ -118,49 +118,7 @@ submission to slurm complete!
 ###############################
 slurm submission output
-Submitted batch job 7653636
-###############################
-slurm submission log: 2024-05-26 23:16:37.954366
-created following sbatch script:
-###############################
-#!/bin/bash
-#SBATCH --account=nlp
-#SBATCH --cpus-per-task=16
-#SBATCH --dependency=afterok:7653692
-#SBATCH --gres=gpu:1
-#SBATCH --job-name=tthrush-job-1152535
-#SBATCH --mem=60G
-#SBATCH --nodelist=sphinx1
-#SBATCH --open-mode=append
-#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1/eval_job_output.txt
-#SBATCH --partition=sphinx
-#SBATCH --time=14-0
-# activate your desired anaconda environment
-. /nlp/scr/tthrush/miniconda3/etc/profile.d/conda.sh ; conda activate pretraining-coreset-selection
-# cd to working directory
-cd .
-# launch commands
-srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1,revision=main,dtype=float16,trust_remote_code=True --tasks piqa,arc_easy,xnli_en,xnli_fr,xnli_de,xnli_es,sciq,lambada --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection/llms/pythia-70m_default_1/perf'
-###############################
-submission to slurm complete!
-###############################
-slurm submission output
-Submitted batch job 7653693

+slurm submission log: 2024-05-27 12:34:01.996971
 created following sbatch script:
 ###############################
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7656642
 #SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-3294461
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx1
 #SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection_big_diff/llms/pythia-70m_default_1/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
 cd .
 # launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection_big_diff/llms/pythia-70m_default_1,revision=main,dtype=float16,trust_remote_code=True --tasks piqa,arc_easy,xnli_en,xnli_fr,xnli_de,xnli_es,sciq,lambada --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection_big_diff/llms/pythia-70m_default_1/perf'
 ###############################
 ###############################
 slurm submission output
+Submitted batch job 7656643
 ###############################
+slurm submission log: 2024-05-27 23:18:48.257074
 created following sbatch script:
 ###############################
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7659748
 #SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-4032027
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx1
 #SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection_big_diff/llms/pythia-70m_default_1/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
 cd .
 # launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection_big_diff/llms/pythia-70m_default_1,revision=main,dtype=float16,trust_remote_code=True --tasks piqa,arc_easy,xnli_en,xnli_fr,xnli_de,xnli_es,sciq,lambada --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection_big_diff/llms/pythia-70m_default_1/perf'
 ###############################
 ###############################
 slurm submission output
+Submitted batch job 7659749
 ###############################
+slurm submission log: 2024-05-27 23:24:09.065268
 created following sbatch script:
 ###############################
 #SBATCH --account=nlp
 #SBATCH --cpus-per-task=16
+#SBATCH --dependency=afterok:7659790
 #SBATCH --gres=gpu:1
+#SBATCH --job-name=tthrush-job-1491095
 #SBATCH --mem=60G
 #SBATCH --nodelist=sphinx1
 #SBATCH --open-mode=append
+#SBATCH --output=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection_big_diff/llms/pythia-70m_default_1/eval_job_output.txt
 #SBATCH --partition=sphinx
 #SBATCH --time=14-0
 cd .
 # launch commands
+srun --unbuffered run_as_child_processes 'lm_eval --model hf --model_args pretrained=/juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection_big_diff/llms/pythia-70m_default_1,revision=main,dtype=float16,trust_remote_code=True --tasks piqa,arc_easy,xnli_en,xnli_fr,xnli_de,xnli_es,sciq,lambada --device cuda --output_path /juice5/scr5/tthrush/pretraining-coreset-selection/llm_pretraining/test_ordinal_projection_big_diff/llms/pythia-70m_default_1/perf'
 ###############################
 ###############################
 slurm submission output
+Submitted batch job 7659791

logs/events.out.tfevents.1716893914.sphinx2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:46d4bdbfbe5761d7056e13b715344a777583501e6d625796459f1236c5881dcc
+size 11766

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3a5094de8742d93ef1f8a47b5f1b0b0a47f72cbb3b81db632dd87ef0b0eeb980
 size 281715176

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b6eea337fa1f3d6e834370139d0769d4a0bb08ecacb7a2eb27fc5db7c7b7954
 size 281715176

train_job_output.txt CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:3d6d46f556e1340581a47698b7ca35dfaa15506d90afacd53b2991f3ff760a32
-size 5176

 version https://git-lfs.github.com/spec/v1
+oid sha256:27bc4d89b732f28d40be81b5f6e283ed05e3aac6fb6fe01e1e2e7fe7f9b49605
+size 5240