End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -37,11 +37,11 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
-- train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
-- total_train_batch_size: 128
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500

 The following hyperparameters were used during training:
 - learning_rate: 1e-05
+- train_batch_size: 4
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
+- total_train_batch_size: 32
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 500

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:97b22062bf5dd760a01fcf30bbbb08804e7aaeb8b33d838c53b7ac0f4a33d2c9
 size 577789320

 version https://git-lfs.github.com/spec/v1
+oid sha256:2c148b3fcb582fd6272e2db533846648ed5d9985a25cc985c392bf8bf5b8ceb9
 size 577789320

runs/Feb15_21-44-54_c06f7f21c073/events.out.tfevents.1708033495.c06f7f21c073.418.3 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:950ad1912ab986ab53c12c20b3f2fe102bf224e1534efa79e627ad6d6947d9cb
+size 6682

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0f5a4d47b319c7607ed84705716bfa8501f5a5d3fc4ffb2d84d25e415282dba6
 size 5048

 version https://git-lfs.github.com/spec/v1
+oid sha256:a5a59feab7f9b68856079d604b31cccda33b9cb30853643abed8f6b9e51d3487
 size 5048