kaifanli
/

bart-base-japanese-tobyoki-pairwise

@@ -17,12 +17,12 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [ku-nlp/bart-base-japanese](https://huggingface.co/ku-nlp/bart-base-japanese) on the None dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.3030
-- Rouge1: 20.3362
-- Rouge2: 3.6623
-- Rougel: 10.9234
-- Rougelsum: 16.1471
-- Gen Len: 289.1
 ## Model description
@@ -42,8 +42,8 @@ More information needed
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
-- train_batch_size: 1
-- eval_batch_size: 1
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
@@ -51,17 +51,12 @@ The following hyperparameters were used during training:
 ### Training results
-| Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2 | Rougel  | Rougelsum | Gen Len |
-|:-------------:|:-----:|:----:|:---------------:|:-------:|:------:|:-------:|:---------:|:-------:|
-| No log        | 1.0   | 10   | 2.7065          | 17.4135 | 1.8293 | 10.3284 | 13.7135   | 300.0   |
-| No log        | 2.0   | 20   | 2.4983          | 15.5531 | 1.4496 | 9.0138  | 12.8628   | 300.0   |
-| No log        | 3.0   | 30   | 2.4181          | 17.7832 | 2.7959 | 9.969   | 13.5642   | 300.0   |
-| No log        | 4.0   | 40   | 2.3930          | 20.0103 | 2.9976 | 11.0143 | 15.4415   | 300.0   |
-| No log        | 5.0   | 50   | 2.3328          | 20.5428 | 3.6354 | 11.3166 | 16.0252   | 300.0   |
-| No log        | 6.0   | 60   | 2.3246          | 24.0821 | 4.2604 | 12.4489 | 19.152    | 294.2   |
-| No log        | 7.0   | 70   | 2.3077          | 20.4387 | 3.8043 | 11.4571 | 16.7923   | 300.0   |
-| No log        | 8.0   | 80   | 2.3060          | 22.0434 | 4.3648 | 12.386  | 18.3828   | 300.0   |
-| No log        | 9.0   | 90   | 2.3030          | 20.3362 | 3.6623 | 10.9234 | 16.1471   | 289.1   |
 ### Framework versions

 This model is a fine-tuned version of [ku-nlp/bart-base-japanese](https://huggingface.co/ku-nlp/bart-base-japanese) on the None dataset.
 It achieves the following results on the evaluation set:
+- Loss: 0.0672
+- Rouge1: 21.0544
+- Rouge2: 10.5652
+- Rougel: 16.8852
+- Rougelsum: 18.96
+- Gen Len: 63.0687
 ## Model description
 The following hyperparameters were used during training:
 - learning_rate: 5e-05
+- train_batch_size: 8
+- eval_batch_size: 8
 - seed: 42
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 ### Training results
+| Training Loss | Epoch | Step | Validation Loss | Rouge1  | Rouge2  | Rougel  | Rougelsum | Gen Len  |
+|:-------------:|:-----:|:----:|:---------------:|:-------:|:-------:|:-------:|:---------:|:--------:|
+| 1.5614        | 1.0   | 550  | 0.5451          | 21.2559 | 5.6179  | 13.9926 | 18.8544   | 116.9277 |
+| 0.6179        | 2.0   | 1100 | 0.1827          | 19.8231 | 7.6726  | 14.2842 | 17.1362   | 76.1356  |
+| 0.3266        | 3.0   | 1650 | 0.0943          | 18.0723 | 7.6543  | 14.0923 | 15.9801   | 57.7577  |
+| 0.2039        | 4.0   | 2200 | 0.0672          | 21.0544 | 10.5652 | 16.8852 | 18.96     | 63.0687  |
 ### Framework versions

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4ba9aade624dad071fca482c4659a070b9f2a7369fb75b9f226d96be338f2cb5
 size 501748312

 version https://git-lfs.github.com/spec/v1
+oid sha256:d60f1cf73003e01c263cd0f1467478ae6a7404aeaa6ea121af69f87d2748b025
 size 501748312

runs/Feb21_17-15-41_kogecha/events.out.tfevents.1708503352.kogecha CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:aaf38c26a7d6a2e1971a8a10b25b90bd7c8b1d6c26316ad984b1f08ae7983ec9
-size 8196

 version https://git-lfs.github.com/spec/v1
+oid sha256:0b77ab44c88da6f74684fea51c9db654674100c7a97ccc04fcba0a634a3f994c
+size 9075