End of training

Files changed (4) hide show

README.md CHANGED Viewed

@@ -30,7 +30,7 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 3e-05
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
@@ -39,7 +39,7 @@ The following hyperparameters were used during training:
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1
-- num_epochs: 10
 - mixed_precision_training: Native AMP
 ### Training results

 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-05
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 3
 - mixed_precision_training: Native AMP
 ### Training results

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2f94db3272db3a18a965a5cb1f2e90ed54a9bffe5ddcb35a1719e17f969602b0
 size 12617105

 version https://git-lfs.github.com/spec/v1
+oid sha256:eb9d166024f3fabcfae752f0136fb94bf455d8468a1337322c080e0a9220dcdc
 size 12617105

runs/Nov19_10-19-31_ruche-gpu15.cluster/events.out.tfevents.1700385576.ruche-gpu15.cluster.18081.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:f1fb0b89aa0d332ba5e0c2f03c5d65263f714b6cd732787a23b1e8f93ef64844
+size 4717

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:6bd46fb42009b8a7328d28132597d1fc555404eaa626f40cdaf93752925f9ee1
 size 4155

 version https://git-lfs.github.com/spec/v1
+oid sha256:d5a08003e7c79bf24030a146484373ca02dac827df901128ee5c764fd7ddaad4
 size 4155