metadata

license: apache-2.0
tags:
  - generated_from_trainer
datasets:
  - pszemraj/fleece2instructions
metrics:
  - rouge
model-index:
  - name: bart-base-fleece2instructions-r1
    results:
      - task:
          name: Sequence-to-sequence Language Modeling
          type: text2text-generation
        dataset:
          name: pszemraj/fleece2instructions
          type: pszemraj/fleece2instructions
          config: null
          split: None
        metrics:
          - name: Rouge1
            type: rouge
            value: 61.7209

bart-base-fleece2instructions-r1

This model is a fine-tuned version of facebook/bart-base on the pszemraj/fleece2instructions dataset. It achieves the following results on the evaluation set:

Loss: 1.0034
Rouge1: 61.7209
Rouge2: 45.0116
Rougel: 59.8188
Rougelsum: 59.8931
Gen Len: 14.3179

Model description

More information needed

Intended uses & limitations

More information needed

Training and evaluation data

More information needed

Training procedure

Training hyperparameters

The following hyperparameters were used during training:

learning_rate: 8e-05
train_batch_size: 8
eval_batch_size: 1
seed: 42
distributed_type: multi-GPU
gradient_accumulation_steps: 8
total_train_batch_size: 64
optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
lr_scheduler_type: cosine
lr_scheduler_warmup_ratio: 0.02
num_epochs: 2.0

Training results

Training Loss	Epoch	Step	Validation Loss	Rouge1	Rouge2	Rougel	Rougelsum	Gen Len
1.2723	1.0	362	1.0325	61.6206	45.1199	59.6467	59.7534	14.0443
1.0157	2.0	724	1.0034	62.4433	46.0114	60.5355	60.6392	14.1807

Framework versions

Transformers 4.28.0.dev0
Pytorch 2.0.0.dev20230212+cu118
Datasets 2.9.0
Tokenizers 0.13.2