Model save

Files changed (3) hide show

README.md CHANGED Viewed

@@ -35,12 +35,12 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.0003
-- train_batch_size: 16
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
-- total_train_batch_size: 128
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 0.0005
+- train_batch_size: 8
 - eval_batch_size: 8
 - seed: 42
 - gradient_accumulation_steps: 8
+- total_train_batch_size: 64
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: constant
 - lr_scheduler_warmup_ratio: 0.03

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8558c8269f7b3d2afe70b669ae78ac5cae68eb03ac14ad9c9f2b877fde065946
 size 10107280

 version https://git-lfs.github.com/spec/v1
+oid sha256:4f3538b9e4c773a84b0791262a7a249dc317bf0ea30c68fe4813f8c43f924d14
 size 10107280

runs/Oct17_02-31-24_nlp118/events.out.tfevents.1729132291.nlp118.284094.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0066e227bde7903dffa1e4bf6cadf63aa59c39f722f1061c6f08146e77581daf
-size 50314

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb6e8f45a7caa64e0d8a7b650ed72cd2947767b93eb3fa4a0082d3125c415cc9
+size 67126