End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -38,8 +38,6 @@ The following hyperparameters were used during training:
 - train_batch_size: 64
 - eval_batch_size: 8
 - seed: 42
-- gradient_accumulation_steps: 8
-- total_train_batch_size: 512
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 1000

 - train_batch_size: 64
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 1000

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8d2e20bc961fa9aa1afc54dc47670ecb0317ecfa79fe10370b83395fd9bf93c6
 size 1262024780

 version https://git-lfs.github.com/spec/v1
+oid sha256:f63503bb2e9f398093b8e672a8d420fb7beb5bc50bd03b4fe16217e6cefeb0a6
 size 1262024780

runs/May21_06-45-37_a5c818e92daf/events.out.tfevents.1716273982.a5c818e92daf.564.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:5ea83b8502c710ca5294520c81091d6f76044f325c69a30f4dfba7271d8bb3c1
+size 6939

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:237a5803bd9e845e70665870be51638cc01a69c4ff0ffaec305a16b91df3ac7a
 size 4984

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a1f4ed642ce92d0121ae7ac347e94c07216ffffdaa9621f46cf0852b03f44d9
 size 4984