sehilnlf
/

model

Text2Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

sehilnlf commited on May 25

Commit

ae76c29

•

1 Parent(s): b9a1162

version 1

Files changed (2) hide show

README.md +27 -6
generation_config.json +4 -0

README.md CHANGED Viewed

@@ -1,9 +1,11 @@
 ---
-license: mit
-base_model: facebook/bart-large-mnli
 tags:
 - text2text-generation
 - generated_from_trainer
 model-index:
 - name: model
   results: []
@@ -14,7 +16,10 @@ should probably proofread and complete it, then remove this comment. -->
 # model
-This model is a fine-tuned version of [facebook/bart-large-mnli](https://huggingface.co/facebook/bart-large-mnli) on an unknown dataset.
 ## Model description
@@ -34,16 +39,32 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
-- train_batch_size: 4
-- eval_batch_size: 4
 - seed: 42
 - gradient_accumulation_steps: 4
-- total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 10
 - mixed_precision_training: Native AMP
 ### Framework versions
 - Transformers 4.39.3

 ---
+license: apache-2.0
+base_model: facebook/bart-large
 tags:
 - text2text-generation
 - generated_from_trainer
+metrics:
+- sacrebleu
 model-index:
 - name: model
   results: []
 # model
+This model is a fine-tuned version of [facebook/bart-large](https://huggingface.co/facebook/bart-large) on the None dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.6118
+- Sacrebleu: 67.0674
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 1e-05
+- train_batch_size: 16
+- eval_batch_size: 16
 - seed: 42
 - gradient_accumulation_steps: 4
+- total_train_batch_size: 64
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 10
 - mixed_precision_training: Native AMP
+### Training results
+| Training Loss | Epoch | Step | Validation Loss | Sacrebleu |
+|:-------------:|:-----:|:----:|:---------------:|:---------:|
+| No log        | 1.0   | 218  | 0.5748          | 65.7729   |
+| No log        | 2.0   | 437  | 0.5609          | 66.4458   |
+| No log        | 3.0   | 656  | 0.5786          | 66.8800   |
+| No log        | 4.0   | 875  | 0.5485          | 66.8774   |
+| No log        | 5.0   | 1093 | 0.5506          | 66.8932   |
+| No log        | 6.0   | 1312 | 0.5890          | 66.9609   |
+| No log        | 7.0   | 1531 | 0.5674          | 66.8977   |
+| No log        | 8.0   | 1750 | 0.5903          | 66.9902   |
+| No log        | 9.0   | 1968 | 0.6196          | 67.0418   |
+| No log        | 9.97  | 2180 | 0.6118          | 67.0674   |
 ### Framework versions
 - Transformers 4.39.3

generation_config.json CHANGED Viewed

@@ -1,8 +1,12 @@
 {
   "bos_token_id": 0,
   "decoder_start_token_id": 2,
   "eos_token_id": 2,
   "forced_eos_token_id": 2,
   "pad_token_id": 1,
   "transformers_version": "4.39.3"
 }

 {
   "bos_token_id": 0,
   "decoder_start_token_id": 2,
+  "early_stopping": true,
   "eos_token_id": 2,
+  "forced_bos_token_id": 0,
   "forced_eos_token_id": 2,
+  "no_repeat_ngram_size": 3,
+  "num_beams": 4,
   "pad_token_id": 1,
   "transformers_version": "4.39.3"
 }