End of training

Files changed (5) hide show

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ should probably proofread and complete it, then remove this comment. -->
 This model is a fine-tuned version of [cardiffnlp/twitter-roberta-base-2019-90m](https://huggingface.co/cardiffnlp/twitter-roberta-base-2019-90m) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 2.2660
 ## Model description

 This model is a fine-tuned version of [cardiffnlp/twitter-roberta-base-2019-90m](https://huggingface.co/cardiffnlp/twitter-roberta-base-2019-90m) on an unknown dataset.
 It achieves the following results on the evaluation set:
+- Loss: 2.2624
 ## Model description

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
-    "epoch": 6.76,
-    "eval_loss": 2.2869741916656494,
-    "eval_runtime": 343.9591,
-    "eval_samples": 298875,
-    "eval_samples_per_second": 868.926,
-    "eval_steps_per_second": 54.309,
-    "perplexity": 9.845103171952147,
-    "train_loss": 2.4450033056640623,
-    "train_runtime": 259948.3281,
-    "train_samples": 5678630,
-    "train_samples_per_second": 147.722,
-    "train_steps_per_second": 9.233
 }

 {
+    "epoch": 6.74,
+    "eval_loss": 2.262387275695801,
+    "eval_runtime": 376.3646,
+    "eval_samples": 300000,
+    "eval_samples_per_second": 797.099,
+    "eval_steps_per_second": 49.819,
+    "perplexity": 9.605993971787024,
+    "train_loss": 2.4027615625,
+    "train_runtime": 271335.6086,
+    "train_samples": 5700001,
+    "train_samples_per_second": 141.522,
+    "train_steps_per_second": 8.845
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
-    "epoch": 6.76,
-    "eval_loss": 2.2869741916656494,
-    "eval_runtime": 343.9591,
-    "eval_samples": 298875,
-    "eval_samples_per_second": 868.926,
-    "eval_steps_per_second": 54.309,
-    "perplexity": 9.845103171952147
 }

 {
+    "epoch": 6.74,
+    "eval_loss": 2.262387275695801,
+    "eval_runtime": 376.3646,
+    "eval_samples": 300000,
+    "eval_samples_per_second": 797.099,
+    "eval_steps_per_second": 49.819,
+    "perplexity": 9.605993971787024
 }

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 6.76,
-    "train_loss": 2.4450033056640623,
-    "train_runtime": 259948.3281,
-    "train_samples": 5678630,
-    "train_samples_per_second": 147.722,
-    "train_steps_per_second": 9.233
 }

 {
+    "epoch": 6.74,
+    "train_loss": 2.4027615625,
+    "train_runtime": 271335.6086,
+    "train_samples": 5700001,
+    "train_samples_per_second": 141.522,
+    "train_steps_per_second": 8.845
 }

trainer_state.json CHANGED Viewed

The diff for this file is too large to render. See raw diff