bw58
/

bw58_billsum_model

@@ -17,12 +17,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [google/flan-t5-small](https://huggingface.co/google/flan-t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: nan
-- Rouge1: 0.1732
-- Rouge2: 0.056
-- Rougel: 0.1193
-- Rougelsum: 0.1195
-- Gen Len: 42.3387
 ## Model description
@@ -41,23 +41,22 @@ More information needed
 ### Training hyperparameters
 The following hyperparameters were used during training:
-- learning_rate: 0.002
 - train_batch_size: 15
 - eval_batch_size: 15
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 4
-- mixed_precision_training: Native AMP
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
-| No log        | 1.0   | 66   | nan             | 0.1732 | 0.056  | 0.1193 | 0.1195    | 42.3387 |
-| No log        | 2.0   | 132  | nan             | 0.1732 | 0.056  | 0.1193 | 0.1195    | 42.3387 |
-| No log        | 3.0   | 198  | nan             | 0.1732 | 0.056  | 0.1193 | 0.1195    | 42.3387 |
-| No log        | 4.0   | 264  | nan             | 0.1732 | 0.056  | 0.1193 | 0.1195    | 42.3387 |
 ### Framework versions

 This model is a fine-tuned version of [google/flan-t5-small](https://huggingface.co/google/flan-t5-small) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.1628
+- Rouge1: 0.402
+- Rouge2: 0.162
+- Rougel: 0.286
+- Rougelsum: 0.2864
+- Gen Len: 99.9879
 ## Model description
 ### Training hyperparameters
 The following hyperparameters were used during training:
+- learning_rate: 2e-05
 - train_batch_size: 15
 - eval_batch_size: 15
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - num_epochs: 4
 ### Training results
 | Training Loss | Epoch | Step | Validation Loss | Rouge1 | Rouge2 | Rougel | Rougelsum | Gen Len |
 |:-------------:|:-----:|:----:|:---------------:|:------:|:------:|:------:|:---------:|:-------:|
+| 2.7337        | 1.0   | 66   | 2.2892          | 0.32   | 0.1024 | 0.2173 | 0.2179    | 89.6048 |
+| 2.5608        | 2.0   | 132  | 2.1977          | 0.376  | 0.1413 | 0.2618 | 0.262     | 97.7863 |
+| 2.5009        | 3.0   | 198  | 2.1694          | 0.4009 | 0.1615 | 0.2846 | 0.285     | 99.9194 |
+| 2.4203        | 4.0   | 264  | 2.1628          | 0.402  | 0.162  | 0.286  | 0.2864    | 99.9879 |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:495fa51e204676f1a857a9fc13c4c89f3f5ba9f480b898cebca02add25e6d749
 size 307867048

 version https://git-lfs.github.com/spec/v1
+oid sha256:1cd6787455d48d598ebd1be84395076d10f06b01d41a0beb4ada53eeeaedb1d3
 size 307867048

tokenizer.json CHANGED Viewed

@@ -1,6 +1,11 @@
 {
   "version": "1.0",
-  "truncation": null,
   "padding": null,
   "added_tokens": [
     {

 {
   "version": "1.0",
+  "truncation": {
+    "direction": "Right",
+    "max_length": 128,
+    "strategy": "LongestFirst",
+    "stride": 0
+  },
   "padding": null,
   "added_tokens": [
     {

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ef4f1d119a7c7ec6173a62c4c6e36d8e185ceabe0bb9349d97633eb3b2e0c27
 size 4856

 version https://git-lfs.github.com/spec/v1
+oid sha256:5a2577225da79ce71dc8a6a76e093e6dc47be29bd2e97cc6fc1b1e2f4bcdd131
 size 4856