End of training

Files changed (3) hide show

README.md CHANGED Viewed

@@ -1,9 +1,7 @@
 ---
-base_model: m3hrdadfi/xlmr-large-qa-fa
 tags:
 - generated_from_trainer
-datasets:
-- pquad
 model-index:
 - name: qa-persian-xlmr-large
   results: []
@@ -14,9 +12,9 @@ should probably proofread and complete it, then remove this comment. -->
 # qa-persian-xlmr-large
-This model is a fine-tuned version of [m3hrdadfi/xlmr-large-qa-fa](https://huggingface.co/m3hrdadfi/xlmr-large-qa-fa) on the pquad dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.4953
 ## Model description
@@ -35,24 +33,33 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 1e-05
-- train_batch_size: 1
-- eval_batch_size: 1
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 0.01
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
-| 1.6966        | 0.01  | 640  | 1.4953          |
 ### Framework versions
-- Transformers 4.35.2
-- Pytorch 2.1.0+cu118
-- Datasets 2.15.0
-- Tokenizers 0.15.0

 ---
+base_model: makhataei/qa-persian-xlmr-large
 tags:
 - generated_from_trainer
 model-index:
 - name: qa-persian-xlmr-large
   results: []
 # qa-persian-xlmr-large
+This model is a fine-tuned version of [makhataei/qa-persian-xlmr-large](https://huggingface.co/makhataei/qa-persian-xlmr-large) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 5.0366
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 5e-06
+- train_batch_size: 14
+- eval_batch_size: 14
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 10
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss |
 |:-------------:|:-----:|:----:|:---------------:|
+| 2.0175        | 1.0   | 202  | 1.5773          |
+| 1.17          | 2.0   | 404  | 1.7608          |
+| 0.6861        | 3.0   | 606  | 2.2780          |
+| 0.4457        | 4.0   | 808  | 2.8859          |
+| 0.2626        | 5.0   | 1010 | 3.9207          |
+| 0.1862        | 6.0   | 1212 | 4.6119          |
+| 0.1264        | 7.0   | 1414 | 4.8694          |
+| 0.0786        | 8.0   | 1616 | 4.8824          |
+| 0.0566        | 9.0   | 1818 | 4.9686          |
+| 0.0571        | 10.0  | 2020 | 5.0366          |
 ### Framework versions
+- Transformers 4.38.1
+- Pytorch 2.1.0+cu121
+- Datasets 2.18.0
+- Tokenizers 0.15.2

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:71ee20493190f2dc7051dba696729ebabb25b10287cfde84027c433e9fcd1fe4
 size 2235420048

 version https://git-lfs.github.com/spec/v1
+oid sha256:412385474279f65c8a72b7d4419c6103555d730b0cae4cd24663a96def553418
 size 2235420048

runs/Mar03_05-19-09_c3bd18d56594/events.out.tfevents.1709443151.c3bd18d56594.3825.1 CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2e761b28027c9d9ae908f7b1bf49659cac884b854af1c2dee583a49461317479
-size 18989

 version https://git-lfs.github.com/spec/v1
+oid sha256:01da4f30ac1568d532cb2413f7f439a7bd8fb6d53f9e5270619c49d68433daf0
+size 19614