End of training

Browse files

Files changed (6) hide show

README.md +21 -13
config.json +1 -1
generation_config.json +1 -1
model.safetensors +1 -1
runs/May20_09-36-05_e5ec22a001f4/events.out.tfevents.1716197766.e5ec22a001f4.394.0 +3 -0
training_args.bin +2 -2

README.md CHANGED Viewed

@@ -5,6 +5,7 @@ tags:
 - generated_from_trainer
 metrics:
 - bleu
 model-index:
 - name: spark-name-ar-to-en
   results: []
@@ -17,9 +18,11 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [ihebaker10/spark-name-ar-to-en](https://huggingface.co/ihebaker10/spark-name-ar-to-en) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 1.4970
-- Bleu: 0.0
-- Gen Len: 4.134
 ## Model description
@@ -44,22 +47,27 @@ The following hyperparameters were used during training:
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
-- num_epochs: 5
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Bleu | Gen Len |
-|:-------------:|:-----:|:----:|:---------------:|:----:|:-------:|
-| 1.65          | 1.0   | 1000 | 1.4867          | 0.0  | 4.1465  |
-| 1.3953        | 2.0   | 2000 | 1.4755          | 0.0  | 4.1295  |
-| 1.2245        | 3.0   | 3000 | 1.4903          | 0.0  | 4.1655  |
-| 1.1021        | 4.0   | 4000 | 1.4927          | 0.0  | 4.135   |
-| 1.0237        | 5.0   | 5000 | 1.4970          | 0.0  | 4.134   |
 ### Framework versions
-- Transformers 4.40.0
 - Pytorch 2.2.1+cu121
-- Datasets 2.19.0
 - Tokenizers 0.19.1

 - generated_from_trainer
 metrics:
 - bleu
+- wer
 model-index:
 - name: spark-name-ar-to-en
   results: []
 This model is a fine-tuned version of [ihebaker10/spark-name-ar-to-en](https://huggingface.co/ihebaker10/spark-name-ar-to-en) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.4228
+- Bleu: 46.0889
+- Wer: 0.513
+- Cer: 0.3032
+- Gen Len: 6.6541
 ## Model description
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
+- num_epochs: 10
 ### Training results
+| Training Loss | Epoch | Step  | Validation Loss | Bleu    | Wer    | Cer    | Gen Len |
+|:-------------:|:-----:|:-----:|:---------------:|:-------:|:------:|:------:|:-------:|
+| 1.4673        | 1.0   | 2221  | 1.4345          | 47.0582 | 0.4936 | 0.2991 | 6.4236  |
+| 1.3251        | 2.0   | 4442  | 1.4000          | 50.8792 | 0.477  | 0.2893 | 6.4104  |
+| 1.0338        | 3.0   | 6663  | 1.3892          | 51.5038 | 0.4727 | 0.2872 | 6.418   |
+| 0.9901        | 4.0   | 8884  | 1.3888          | 52.5143 | 0.4675 | 0.2821 | 6.3892  |
+| 0.8191        | 5.0   | 11105 | 1.3953          | 52.9892 | 0.4664 | 0.2902 | 6.5155  |
+| 0.805         | 6.0   | 13326 | 1.4024          | 52.8471 | 0.4654 | 0.2904 | 6.5205  |
+| 0.7153        | 7.0   | 15547 | 1.4127          | 45.0993 | 0.5169 | 0.304  | 6.6268  |
+| 0.673         | 8.0   | 17768 | 1.4138          | 45.2321 | 0.5186 | 0.3087 | 6.6599  |
+| 0.6606        | 9.0   | 19989 | 1.4228          | 45.6946 | 0.5154 | 0.3059 | 6.6617  |
+| 0.6626        | 10.0  | 22210 | 1.4228          | 46.0889 | 0.513  | 0.3032 | 6.6541  |
 ### Framework versions
+- Transformers 4.40.2
 - Pytorch 2.2.1+cu121
+- Datasets 2.19.1
 - Tokenizers 0.19.1

config.json CHANGED Viewed

@@ -55,7 +55,7 @@
   "share_encoder_decoder_embeddings": true,
   "static_position_embeddings": true,
   "torch_dtype": "float32",
-  "transformers_version": "4.40.0",
   "use_cache": true,
   "vocab_size": 62834
 }

   "share_encoder_decoder_embeddings": true,
   "static_position_embeddings": true,
   "torch_dtype": "float32",
+  "transformers_version": "4.40.2",
   "use_cache": true,
   "vocab_size": 62834
 }

generation_config.json CHANGED Viewed

@@ -12,5 +12,5 @@
   "num_beams": 4,
   "pad_token_id": 62833,
   "renormalize_logits": true,
-  "transformers_version": "4.40.0"
 }

   "num_beams": 4,
   "pad_token_id": 62833,
   "renormalize_logits": true,
+  "transformers_version": "4.40.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:39520a1a8f8f949f3cc9c5bd1b1c4617b00d7a89c10068e23d87fd5cc370a00f
 size 305518408

 version https://git-lfs.github.com/spec/v1
+oid sha256:fa05c7d0de9fa13d276741c7b895e697ec6e56842cf0d725e1ba6ba58b3863af
 size 305518408

runs/May20_09-36-05_e5ec22a001f4/events.out.tfevents.1716197766.e5ec22a001f4.394.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:b9e2e37aaf02dea0ed5d4acf0389fa34aa378cb8a87dba341aefec914a567664
+size 16831

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9224d4dab0478e2ca1d514b435d161294cdf653c08d944eb81c3776295877f5b
-size 5176

 version https://git-lfs.github.com/spec/v1
+oid sha256:fb123ffa95730f75bb7c447f8fab5e9badeaf82c55919e8f80fe0febb57e7b0c
+size 5112