Model save

Files changed (3) hide show

README.md CHANGED Viewed

@@ -36,12 +36,14 @@ The following hyperparameters were used during training:
 - train_batch_size: 1
 - eval_batch_size: 8
 - seed: 42
-- gradient_accumulation_steps: 4
-- total_train_batch_size: 4
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
 - num_epochs: 2.0
 ### Training results
@@ -49,7 +51,7 @@ The following hyperparameters were used during training:
 ### Framework versions
-- Transformers 4.34.1
 - Pytorch 2.1.0+cu118
-- Datasets 2.14.6
-- Tokenizers 0.14.1

 - train_batch_size: 1
 - eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 8
+- total_train_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- lr_scheduler_warmup_ratio: 0.02
 - lr_scheduler_warmup_steps: 2
 - num_epochs: 2.0
+- mixed_precision_training: Native AMP
 ### Training results
 ### Framework versions
+- Transformers 4.35.2
 - Pytorch 2.1.0+cu118
+- Datasets 2.15.0
+- Tokenizers 0.15.0

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:397f0c790e3c139f20c4bb57eb46b9c12f3c06d708cfa8f31784e59ed0b2b573
 size 81168432

 version https://git-lfs.github.com/spec/v1
+oid sha256:a71cd8d77338566ebf9f1021654608551aec7055fabc06d9502e5599cd3828df
 size 81168432

runs/Dec05_05-51-44_79c705a95e4d/events.out.tfevents.1701755505.79c705a95e4d.5674.0 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:22ee2ea5c3c0aa857c86469e6fe9b71c42cf63fed97b7f591986eaa4c01aed94
-size 6483

 version https://git-lfs.github.com/spec/v1
+oid sha256:196a1ae9a78619892cc9f5c124dca5f4d61bfa5dae6af951be49e3172ed76871
+size 6994