End of training

Browse files

Files changed (4) hide show

all_results.json +8 -0
predict_results_fake-news.txt +241 -0
train_results.json +8 -0
trainer_state.json +100 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 5.0,
+    "train_loss": 0.18657105684280395,
+    "train_runtime": 93.1154,
+    "train_samples": 1120,
+    "train_samples_per_second": 60.14,
+    "train_steps_per_second": 3.759
+}

predict_results_fake-news.txt ADDED Viewed

	@@ -0,0 +1,241 @@

+index	prediction
+0	1
+1	1
+2	1
+3	1
+4	1
+5	1
+6	1
+7	1
+8	0
+9	0
+10	0
+11	0
+12	0
+13	0
+14	1
+15	0
+16	0
+17	0
+18	1
+19	0
+20	0
+21	1
+22	1
+23	0
+24	1
+25	1
+26	1
+27	1
+28	0
+29	1
+30	0
+31	0
+32	1
+33	1
+34	1
+35	1
+36	1
+37	1
+38	0
+39	0
+40	0
+41	1
+42	1
+43	1
+44	0
+45	0
+46	1
+47	0
+48	0
+49	1
+50	0
+51	1
+52	0
+53	1
+54	1
+55	0
+56	0
+57	1
+58	1
+59	1
+60	1
+61	1
+62	1
+63	0
+64	1
+65	1
+66	1
+67	0
+68	0
+69	1
+70	0
+71	0
+72	1
+73	1
+74	1
+75	0
+76	0
+77	0
+78	0
+79	1
+80	1
+81	0
+82	1
+83	1
+84	1
+85	1
+86	0
+87	1
+88	0
+89	1
+90	0
+91	1
+92	1
+93	1
+94	0
+95	0
+96	1
+97	0
+98	1
+99	1
+100	1
+101	0
+102	0
+103	0
+104	1
+105	1
+106	0
+107	1
+108	1
+109	1
+110	0
+111	0
+112	1
+113	0
+114	1
+115	1
+116	0
+117	0
+118	0
+119	0
+120	0
+121	1
+122	0
+123	1
+124	1
+125	1
+126	0
+127	1
+128	1
+129	0
+130	0
+131	1
+132	0
+133	0
+134	0
+135	1
+136	1
+137	1
+138	0
+139	0
+140	0
+141	0
+142	0
+143	0
+144	1
+145	0
+146	0
+147	1
+148	1
+149	1
+150	0
+151	1
+152	0
+153	1
+154	0
+155	0
+156	1
+157	1
+158	1
+159	1
+160	1
+161	0
+162	0
+163	1
+164	1
+165	0
+166	0
+167	1
+168	0
+169	1
+170	1
+171	1
+172	1
+173	1
+174	1
+175	0
+176	0
+177	1
+178	0
+179	1
+180	0
+181	1
+182	1
+183	0
+184	1
+185	1
+186	0
+187	0
+188	0
+189	0
+190	0
+191	0
+192	1
+193	1
+194	0
+195	1
+196	0
+197	1
+198	1
+199	1
+200	0
+201	1
+202	1
+203	1
+204	0
+205	1
+206	0
+207	0
+208	0
+209	0
+210	1
+211	0
+212	0
+213	0
+214	0
+215	1
+216	0
+217	0
+218	1
+219	0
+220	1
+221	0
+222	1
+223	0
+224	0
+225	0
+226	1
+227	1
+228	0
+229	1
+230	0
+231	0
+232	1
+233	0
+234	1
+235	0
+236	1
+237	0
+238	0
+239	1

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 5.0,
+    "train_loss": 0.18657105684280395,
+    "train_runtime": 93.1154,
+    "train_samples": 1120,
+    "train_samples_per_second": 60.14,
+    "train_steps_per_second": 3.759
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,100 @@

+{
+  "best_metric": 0.8908296943231441,
+  "best_model_checkpoint": "models/fake-news-bert-base-spanish-wwm-cased/checkpoint-210",
+  "epoch": 5.0,
+  "global_step": 350,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 1.0,
+      "learning_rate": 1.6000000000000003e-05,
+      "loss": 0.512,
+      "step": 70
+    },
+    {
+      "epoch": 1.0,
+      "eval_f1": 0.7473684210526316,
+      "eval_loss": 0.5346518158912659,
+      "eval_runtime": 1.3022,
+      "eval_samples_per_second": 184.298,
+      "eval_steps_per_second": 11.519,
+      "step": 70
+    },
+    {
+      "epoch": 2.0,
+      "learning_rate": 1.2e-05,
+      "loss": 0.2281,
+      "step": 140
+    },
+    {
+      "epoch": 2.0,
+      "eval_f1": 0.8333333333333334,
+      "eval_loss": 0.3819647431373596,
+      "eval_runtime": 1.3101,
+      "eval_samples_per_second": 183.197,
+      "eval_steps_per_second": 11.45,
+      "step": 140
+    },
+    {
+      "epoch": 3.0,
+      "learning_rate": 8.000000000000001e-06,
+      "loss": 0.1212,
+      "step": 210
+    },
+    {
+      "epoch": 3.0,
+      "eval_f1": 0.8908296943231441,
+      "eval_loss": 0.3823632299900055,
+      "eval_runtime": 1.3116,
+      "eval_samples_per_second": 182.984,
+      "eval_steps_per_second": 11.437,
+      "step": 210
+    },
+    {
+      "epoch": 4.0,
+      "learning_rate": 4.000000000000001e-06,
+      "loss": 0.0495,
+      "step": 280
+    },
+    {
+      "epoch": 4.0,
+      "eval_f1": 0.8818181818181818,
+      "eval_loss": 0.4416821300983429,
+      "eval_runtime": 1.3226,
+      "eval_samples_per_second": 181.456,
+      "eval_steps_per_second": 11.341,
+      "step": 280
+    },
+    {
+      "epoch": 5.0,
+      "learning_rate": 0.0,
+      "loss": 0.0221,
+      "step": 350
+    },
+    {
+      "epoch": 5.0,
+      "eval_f1": 0.8767123287671234,
+      "eval_loss": 0.504033088684082,
+      "eval_runtime": 1.3358,
+      "eval_samples_per_second": 179.671,
+      "eval_steps_per_second": 11.229,
+      "step": 350
+    },
+    {
+      "epoch": 5.0,
+      "step": 350,
+      "total_flos": 1473421910016000.0,
+      "train_loss": 0.18657105684280395,
+      "train_runtime": 93.1154,
+      "train_samples_per_second": 60.14,
+      "train_steps_per_second": 3.759
+    }
+  ],
+  "max_steps": 350,
+  "num_train_epochs": 5,
+  "total_flos": 1473421910016000.0,
+  "trial_name": null,
+  "trial_params": null
+}