desmondbai
/

marian-finetuned-kde4-en-to-fr

Text2Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

Tongyan Bai commited on Mar 24

Commit

731f54d

•

1 Parent(s): 8abfc26

https://huggingface.co/tongyanb/lab2_efficient

Files changed (3) hide show

README.md +26 -11
model.safetensors +1 -1
training_args.bin +1 -1

README.md CHANGED Viewed

@@ -5,9 +5,24 @@ tags:
 - generated_from_trainer
 datasets:
 - kde4
 model-index:
 - name: marian-finetuned-kde4-en-to-fr
-  results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -17,13 +32,8 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [Helsinki-NLP/opus-mt-en-fr](https://huggingface.co/Helsinki-NLP/opus-mt-en-fr) on the kde4 dataset.
 It achieves the following results on the evaluation set:
-- eval_loss: 0.9633
-- eval_bleu: 49.9655
-- eval_runtime: 162.904
-- eval_samples_per_second: 12.903
-- eval_steps_per_second: 0.203
-- epoch: 0.0
-- step: 4
 ## Model description
@@ -43,15 +53,20 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
-- train_batch_size: 64
 - eval_batch_size: 64
 - seed: 42
-- gradient_accumulation_steps: 2
 - total_train_batch_size: 128
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1
-- num_epochs: 1
 ### Framework versions

 - generated_from_trainer
 datasets:
 - kde4
+metrics:
+- bleu
 model-index:
 - name: marian-finetuned-kde4-en-to-fr
+  results:
+  - task:
+      name: Sequence-to-sequence Language Modeling
+      type: text2text-generation
+    dataset:
+      name: kde4
+      type: kde4
+      config: en-fr
+      split: train
+      args: en-fr
+    metrics:
+    - name: Bleu
+      type: bleu
+      value: 51.33567203419723
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 This model is a fine-tuned version of [Helsinki-NLP/opus-mt-en-fr](https://huggingface.co/Helsinki-NLP/opus-mt-en-fr) on the kde4 dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.8956
+- Bleu: 51.3357
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 2e-05
+- train_batch_size: 32
 - eval_batch_size: 64
 - seed: 42
+- gradient_accumulation_steps: 4
 - total_train_batch_size: 128
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: cosine
 - lr_scheduler_warmup_ratio: 0.1
+- num_epochs: 2
+- mixed_precision_training: Native AMP
+### Training results
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d2d5a474425b748418656b2da983eb0cd20fb946e02dee99d5387ca4b02e4049
 size 298705768

 version https://git-lfs.github.com/spec/v1
+oid sha256:2fb7de141d8b840e8a7b8b270d55ec36a366fbccb421e2bc13b954ef2cb9f0e0
 size 298705768

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:54382a209d579b667b04515dd25d1e1c93a66cabdc357c39dbacf05c1ddec364
 size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:5000340ec9b0be647c8cab6d70f6e3276ca03b78ba2f7487c69f51ccbd9ccac6
 size 5112