allenai
/

led-base-16384-ms2

Text2Text Generation

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Community

johngiorgi commited on Jul 27, 2022

Commit

3d0af6d

•

1 Parent(s): 6ea05fb

Update README.md

Files changed (1) hide show

README.md +15 -19

README.md CHANGED Viewed

@@ -13,22 +13,18 @@ should probably proofread and complete it, then remove this comment. -->
 # Overview
-This model is a fine-tuned version of [allenai/led-base-16384](https://huggingface.co/allenai/led-base-16384) on the [allenai/mslr2022](https://huggingface.co/datasets/allenai/mslr2022) ms2 dataset.
 It achieves the following results on the evaluation set:
-- eval_loss: 3.7527
-- eval_rouge1_fmeasure_mean: 27.9314
-- eval_rouge2_fmeasure_mean: 9.4000
-- eval_rougeL_fmeasure_mean: 20.9302
-- eval_rougeLsum_fmeasure_mean: 23.6179
-- eval_bertscore_hashcode: microsoft/deberta-xlarge-mnli_L40_no-idf_version=0.3.11(hug_trans=4.21.0.dev0)-rescaled_fast-tokenizer
-- eval_bertscore_f1_mean: 23.5092
-- eval_seed: 42
-- eval_model_name_or_path: output/ms2/led-base/baseline
-- eval_doc_sep_token: </s>
-- eval_runtime: 820.6405
-- eval_samples_per_second: 2.463
-- eval_steps_per_second: 0.617
-- step: 0
 ## Model description
@@ -47,12 +43,12 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 2e-05
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 42
-- gradient_accumulation_steps: 8
-- total_train_batch_size: 32
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
@@ -64,5 +60,5 @@ The following hyperparameters were used during training:
 - Transformers 4.21.0.dev0
 - Pytorch 1.10.0
-- Datasets 2.3.3.dev0
 - Tokenizers 0.12.1

 # Overview
+This model is a fine-tuned version of [allenai/led-base-16384](https://huggingface.co/allenai/led-base-16384) on the allenai/mslr2022 ms2 dataset.
 It achieves the following results on the evaluation set:
+- Loss: 3.7602
+- Rouge1 Fmeasure Mean: 28.5338
+- Rouge2 Fmeasure Mean: 9.5060
+- Rougel Fmeasure Mean: 20.9321
+- Rougelsum Fmeasure Mean: 24.0998
+- Bertscore Hashcode: microsoft/deberta-xlarge-mnli_L40_no-idf_version=0.3.11(hug_trans=4.21.0.dev0)-rescaled_fast-tokenizer
+- Bertscore F1 Mean: 22.7619
+- Seed: 42
+- Model Name Or Path: allenai/led-base-16384
+- Doc Sep Token: </s>
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 3e-05
 - train_batch_size: 4
 - eval_batch_size: 4
 - seed: 42
+- gradient_accumulation_steps: 4
+- total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.1
 - Transformers 4.21.0.dev0
 - Pytorch 1.10.0
+- Datasets 2.4.0
 - Tokenizers 0.12.1