pszemraj commited on
Commit
6335a2e
1 Parent(s): b46205c

End of training

Browse files
all_results.json ADDED
@@ -0,0 +1,14 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "epoch": 8.0,
3
+ "eval_loss": 0.4402828514575958,
4
+ "eval_matthews_correlation": 0.5510400717227824,
5
+ "eval_runtime": 0.9341,
6
+ "eval_samples": 1043,
7
+ "eval_samples_per_second": 1116.545,
8
+ "eval_steps_per_second": 70.654,
9
+ "train_loss": 0.39676498534048305,
10
+ "train_runtime": 212.9463,
11
+ "train_samples": 8551,
12
+ "train_samples_per_second": 321.245,
13
+ "train_steps_per_second": 0.639
14
+ }
eval_results.json ADDED
@@ -0,0 +1,9 @@
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "epoch": 8.0,
3
+ "eval_loss": 0.4402828514575958,
4
+ "eval_matthews_correlation": 0.5510400717227824,
5
+ "eval_runtime": 0.9341,
6
+ "eval_samples": 1043,
7
+ "eval_samples_per_second": 1116.545,
8
+ "eval_steps_per_second": 70.654
9
+ }
predict_results_cola.txt ADDED
@@ -0,0 +1,1064 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ index prediction
2
+ 0 acceptable
3
+ 1 acceptable
4
+ 2 acceptable
5
+ 3 acceptable
6
+ 4 unacceptable
7
+ 5 acceptable
8
+ 6 acceptable
9
+ 7 acceptable
10
+ 8 acceptable
11
+ 9 acceptable
12
+ 10 acceptable
13
+ 11 acceptable
14
+ 12 acceptable
15
+ 13 acceptable
16
+ 14 acceptable
17
+ 15 acceptable
18
+ 16 unacceptable
19
+ 17 acceptable
20
+ 18 unacceptable
21
+ 19 unacceptable
22
+ 20 acceptable
23
+ 21 acceptable
24
+ 22 unacceptable
25
+ 23 acceptable
26
+ 24 acceptable
27
+ 25 acceptable
28
+ 26 unacceptable
29
+ 27 unacceptable
30
+ 28 acceptable
31
+ 29 acceptable
32
+ 30 acceptable
33
+ 31 acceptable
34
+ 32 acceptable
35
+ 33 unacceptable
36
+ 34 unacceptable
37
+ 35 acceptable
38
+ 36 acceptable
39
+ 37 acceptable
40
+ 38 acceptable
41
+ 39 unacceptable
42
+ 40 unacceptable
43
+ 41 acceptable
44
+ 42 acceptable
45
+ 43 acceptable
46
+ 44 unacceptable
47
+ 45 acceptable
48
+ 46 unacceptable
49
+ 47 acceptable
50
+ 48 acceptable
51
+ 49 acceptable
52
+ 50 unacceptable
53
+ 51 unacceptable
54
+ 52 acceptable
55
+ 53 acceptable
56
+ 54 unacceptable
57
+ 55 unacceptable
58
+ 56 acceptable
59
+ 57 unacceptable
60
+ 58 acceptable
61
+ 59 acceptable
62
+ 60 unacceptable
63
+ 61 acceptable
64
+ 62 acceptable
65
+ 63 unacceptable
66
+ 64 acceptable
67
+ 65 acceptable
68
+ 66 acceptable
69
+ 67 unacceptable
70
+ 68 acceptable
71
+ 69 unacceptable
72
+ 70 acceptable
73
+ 71 acceptable
74
+ 72 unacceptable
75
+ 73 unacceptable
76
+ 74 acceptable
77
+ 75 acceptable
78
+ 76 acceptable
79
+ 77 acceptable
80
+ 78 acceptable
81
+ 79 acceptable
82
+ 80 acceptable
83
+ 81 unacceptable
84
+ 82 acceptable
85
+ 83 acceptable
86
+ 84 acceptable
87
+ 85 acceptable
88
+ 86 acceptable
89
+ 87 acceptable
90
+ 88 acceptable
91
+ 89 acceptable
92
+ 90 acceptable
93
+ 91 acceptable
94
+ 92 acceptable
95
+ 93 acceptable
96
+ 94 acceptable
97
+ 95 acceptable
98
+ 96 acceptable
99
+ 97 acceptable
100
+ 98 acceptable
101
+ 99 acceptable
102
+ 100 unacceptable
103
+ 101 acceptable
104
+ 102 acceptable
105
+ 103 acceptable
106
+ 104 unacceptable
107
+ 105 acceptable
108
+ 106 acceptable
109
+ 107 acceptable
110
+ 108 acceptable
111
+ 109 acceptable
112
+ 110 acceptable
113
+ 111 acceptable
114
+ 112 acceptable
115
+ 113 acceptable
116
+ 114 acceptable
117
+ 115 unacceptable
118
+ 116 acceptable
119
+ 117 unacceptable
120
+ 118 unacceptable
121
+ 119 acceptable
122
+ 120 acceptable
123
+ 121 acceptable
124
+ 122 acceptable
125
+ 123 acceptable
126
+ 124 acceptable
127
+ 125 acceptable
128
+ 126 unacceptable
129
+ 127 acceptable
130
+ 128 acceptable
131
+ 129 acceptable
132
+ 130 acceptable
133
+ 131 acceptable
134
+ 132 acceptable
135
+ 133 acceptable
136
+ 134 acceptable
137
+ 135 acceptable
138
+ 136 acceptable
139
+ 137 acceptable
140
+ 138 acceptable
141
+ 139 unacceptable
142
+ 140 acceptable
143
+ 141 acceptable
144
+ 142 acceptable
145
+ 143 acceptable
146
+ 144 acceptable
147
+ 145 acceptable
148
+ 146 acceptable
149
+ 147 acceptable
150
+ 148 acceptable
151
+ 149 acceptable
152
+ 150 acceptable
153
+ 151 acceptable
154
+ 152 acceptable
155
+ 153 acceptable
156
+ 154 acceptable
157
+ 155 acceptable
158
+ 156 unacceptable
159
+ 157 unacceptable
160
+ 158 acceptable
161
+ 159 acceptable
162
+ 160 acceptable
163
+ 161 acceptable
164
+ 162 acceptable
165
+ 163 unacceptable
166
+ 164 acceptable
167
+ 165 unacceptable
168
+ 166 unacceptable
169
+ 167 unacceptable
170
+ 168 acceptable
171
+ 169 acceptable
172
+ 170 acceptable
173
+ 171 acceptable
174
+ 172 acceptable
175
+ 173 unacceptable
176
+ 174 acceptable
177
+ 175 acceptable
178
+ 176 acceptable
179
+ 177 acceptable
180
+ 178 acceptable
181
+ 179 acceptable
182
+ 180 acceptable
183
+ 181 acceptable
184
+ 182 unacceptable
185
+ 183 acceptable
186
+ 184 unacceptable
187
+ 185 acceptable
188
+ 186 acceptable
189
+ 187 unacceptable
190
+ 188 unacceptable
191
+ 189 acceptable
192
+ 190 acceptable
193
+ 191 acceptable
194
+ 192 unacceptable
195
+ 193 acceptable
196
+ 194 acceptable
197
+ 195 acceptable
198
+ 196 acceptable
199
+ 197 unacceptable
200
+ 198 acceptable
201
+ 199 unacceptable
202
+ 200 acceptable
203
+ 201 unacceptable
204
+ 202 unacceptable
205
+ 203 acceptable
206
+ 204 acceptable
207
+ 205 acceptable
208
+ 206 acceptable
209
+ 207 acceptable
210
+ 208 acceptable
211
+ 209 acceptable
212
+ 210 acceptable
213
+ 211 acceptable
214
+ 212 acceptable
215
+ 213 unacceptable
216
+ 214 acceptable
217
+ 215 acceptable
218
+ 216 acceptable
219
+ 217 acceptable
220
+ 218 acceptable
221
+ 219 unacceptable
222
+ 220 acceptable
223
+ 221 acceptable
224
+ 222 acceptable
225
+ 223 acceptable
226
+ 224 unacceptable
227
+ 225 acceptable
228
+ 226 unacceptable
229
+ 227 acceptable
230
+ 228 unacceptable
231
+ 229 acceptable
232
+ 230 acceptable
233
+ 231 acceptable
234
+ 232 acceptable
235
+ 233 acceptable
236
+ 234 acceptable
237
+ 235 acceptable
238
+ 236 unacceptable
239
+ 237 acceptable
240
+ 238 acceptable
241
+ 239 unacceptable
242
+ 240 acceptable
243
+ 241 acceptable
244
+ 242 unacceptable
245
+ 243 acceptable
246
+ 244 acceptable
247
+ 245 acceptable
248
+ 246 acceptable
249
+ 247 acceptable
250
+ 248 acceptable
251
+ 249 acceptable
252
+ 250 acceptable
253
+ 251 acceptable
254
+ 252 acceptable
255
+ 253 acceptable
256
+ 254 acceptable
257
+ 255 acceptable
258
+ 256 acceptable
259
+ 257 acceptable
260
+ 258 acceptable
261
+ 259 acceptable
262
+ 260 unacceptable
263
+ 261 acceptable
264
+ 262 acceptable
265
+ 263 acceptable
266
+ 264 acceptable
267
+ 265 acceptable
268
+ 266 acceptable
269
+ 267 acceptable
270
+ 268 acceptable
271
+ 269 acceptable
272
+ 270 acceptable
273
+ 271 acceptable
274
+ 272 unacceptable
275
+ 273 acceptable
276
+ 274 acceptable
277
+ 275 acceptable
278
+ 276 acceptable
279
+ 277 unacceptable
280
+ 278 acceptable
281
+ 279 unacceptable
282
+ 280 acceptable
283
+ 281 acceptable
284
+ 282 acceptable
285
+ 283 acceptable
286
+ 284 acceptable
287
+ 285 unacceptable
288
+ 286 acceptable
289
+ 287 acceptable
290
+ 288 acceptable
291
+ 289 acceptable
292
+ 290 acceptable
293
+ 291 unacceptable
294
+ 292 acceptable
295
+ 293 unacceptable
296
+ 294 unacceptable
297
+ 295 acceptable
298
+ 296 acceptable
299
+ 297 acceptable
300
+ 298 acceptable
301
+ 299 acceptable
302
+ 300 acceptable
303
+ 301 unacceptable
304
+ 302 acceptable
305
+ 303 acceptable
306
+ 304 acceptable
307
+ 305 acceptable
308
+ 306 unacceptable
309
+ 307 unacceptable
310
+ 308 acceptable
311
+ 309 acceptable
312
+ 310 acceptable
313
+ 311 acceptable
314
+ 312 acceptable
315
+ 313 acceptable
316
+ 314 unacceptable
317
+ 315 unacceptable
318
+ 316 unacceptable
319
+ 317 acceptable
320
+ 318 acceptable
321
+ 319 unacceptable
322
+ 320 unacceptable
323
+ 321 acceptable
324
+ 322 acceptable
325
+ 323 acceptable
326
+ 324 acceptable
327
+ 325 acceptable
328
+ 326 acceptable
329
+ 327 acceptable
330
+ 328 acceptable
331
+ 329 acceptable
332
+ 330 acceptable
333
+ 331 acceptable
334
+ 332 unacceptable
335
+ 333 acceptable
336
+ 334 acceptable
337
+ 335 acceptable
338
+ 336 unacceptable
339
+ 337 acceptable
340
+ 338 acceptable
341
+ 339 acceptable
342
+ 340 acceptable
343
+ 341 acceptable
344
+ 342 acceptable
345
+ 343 unacceptable
346
+ 344 unacceptable
347
+ 345 acceptable
348
+ 346 acceptable
349
+ 347 acceptable
350
+ 348 acceptable
351
+ 349 acceptable
352
+ 350 acceptable
353
+ 351 unacceptable
354
+ 352 acceptable
355
+ 353 acceptable
356
+ 354 acceptable
357
+ 355 acceptable
358
+ 356 acceptable
359
+ 357 acceptable
360
+ 358 acceptable
361
+ 359 acceptable
362
+ 360 acceptable
363
+ 361 acceptable
364
+ 362 acceptable
365
+ 363 unacceptable
366
+ 364 acceptable
367
+ 365 unacceptable
368
+ 366 acceptable
369
+ 367 acceptable
370
+ 368 acceptable
371
+ 369 acceptable
372
+ 370 unacceptable
373
+ 371 acceptable
374
+ 372 acceptable
375
+ 373 acceptable
376
+ 374 acceptable
377
+ 375 acceptable
378
+ 376 acceptable
379
+ 377 acceptable
380
+ 378 acceptable
381
+ 379 acceptable
382
+ 380 acceptable
383
+ 381 acceptable
384
+ 382 acceptable
385
+ 383 acceptable
386
+ 384 acceptable
387
+ 385 acceptable
388
+ 386 acceptable
389
+ 387 acceptable
390
+ 388 acceptable
391
+ 389 acceptable
392
+ 390 acceptable
393
+ 391 unacceptable
394
+ 392 unacceptable
395
+ 393 acceptable
396
+ 394 acceptable
397
+ 395 acceptable
398
+ 396 acceptable
399
+ 397 acceptable
400
+ 398 acceptable
401
+ 399 acceptable
402
+ 400 acceptable
403
+ 401 acceptable
404
+ 402 unacceptable
405
+ 403 acceptable
406
+ 404 acceptable
407
+ 405 acceptable
408
+ 406 acceptable
409
+ 407 acceptable
410
+ 408 acceptable
411
+ 409 acceptable
412
+ 410 acceptable
413
+ 411 acceptable
414
+ 412 acceptable
415
+ 413 acceptable
416
+ 414 acceptable
417
+ 415 unacceptable
418
+ 416 acceptable
419
+ 417 acceptable
420
+ 418 acceptable
421
+ 419 acceptable
422
+ 420 acceptable
423
+ 421 acceptable
424
+ 422 acceptable
425
+ 423 acceptable
426
+ 424 acceptable
427
+ 425 acceptable
428
+ 426 acceptable
429
+ 427 acceptable
430
+ 428 unacceptable
431
+ 429 unacceptable
432
+ 430 acceptable
433
+ 431 acceptable
434
+ 432 acceptable
435
+ 433 unacceptable
436
+ 434 acceptable
437
+ 435 acceptable
438
+ 436 acceptable
439
+ 437 acceptable
440
+ 438 acceptable
441
+ 439 acceptable
442
+ 440 acceptable
443
+ 441 acceptable
444
+ 442 acceptable
445
+ 443 acceptable
446
+ 444 unacceptable
447
+ 445 unacceptable
448
+ 446 unacceptable
449
+ 447 acceptable
450
+ 448 unacceptable
451
+ 449 acceptable
452
+ 450 acceptable
453
+ 451 acceptable
454
+ 452 acceptable
455
+ 453 acceptable
456
+ 454 acceptable
457
+ 455 acceptable
458
+ 456 acceptable
459
+ 457 acceptable
460
+ 458 acceptable
461
+ 459 unacceptable
462
+ 460 acceptable
463
+ 461 acceptable
464
+ 462 unacceptable
465
+ 463 acceptable
466
+ 464 acceptable
467
+ 465 acceptable
468
+ 466 acceptable
469
+ 467 acceptable
470
+ 468 acceptable
471
+ 469 acceptable
472
+ 470 acceptable
473
+ 471 acceptable
474
+ 472 acceptable
475
+ 473 unacceptable
476
+ 474 acceptable
477
+ 475 unacceptable
478
+ 476 unacceptable
479
+ 477 acceptable
480
+ 478 acceptable
481
+ 479 unacceptable
482
+ 480 acceptable
483
+ 481 acceptable
484
+ 482 acceptable
485
+ 483 acceptable
486
+ 484 acceptable
487
+ 485 acceptable
488
+ 486 unacceptable
489
+ 487 acceptable
490
+ 488 unacceptable
491
+ 489 unacceptable
492
+ 490 acceptable
493
+ 491 unacceptable
494
+ 492 acceptable
495
+ 493 acceptable
496
+ 494 acceptable
497
+ 495 unacceptable
498
+ 496 unacceptable
499
+ 497 acceptable
500
+ 498 acceptable
501
+ 499 acceptable
502
+ 500 acceptable
503
+ 501 acceptable
504
+ 502 acceptable
505
+ 503 acceptable
506
+ 504 unacceptable
507
+ 505 acceptable
508
+ 506 acceptable
509
+ 507 acceptable
510
+ 508 unacceptable
511
+ 509 acceptable
512
+ 510 acceptable
513
+ 511 unacceptable
514
+ 512 acceptable
515
+ 513 acceptable
516
+ 514 acceptable
517
+ 515 acceptable
518
+ 516 acceptable
519
+ 517 unacceptable
520
+ 518 acceptable
521
+ 519 acceptable
522
+ 520 acceptable
523
+ 521 unacceptable
524
+ 522 unacceptable
525
+ 523 acceptable
526
+ 524 unacceptable
527
+ 525 acceptable
528
+ 526 acceptable
529
+ 527 unacceptable
530
+ 528 acceptable
531
+ 529 acceptable
532
+ 530 acceptable
533
+ 531 acceptable
534
+ 532 acceptable
535
+ 533 acceptable
536
+ 534 acceptable
537
+ 535 acceptable
538
+ 536 acceptable
539
+ 537 acceptable
540
+ 538 acceptable
541
+ 539 acceptable
542
+ 540 acceptable
543
+ 541 acceptable
544
+ 542 acceptable
545
+ 543 acceptable
546
+ 544 acceptable
547
+ 545 unacceptable
548
+ 546 acceptable
549
+ 547 acceptable
550
+ 548 acceptable
551
+ 549 acceptable
552
+ 550 acceptable
553
+ 551 acceptable
554
+ 552 acceptable
555
+ 553 acceptable
556
+ 554 acceptable
557
+ 555 acceptable
558
+ 556 acceptable
559
+ 557 acceptable
560
+ 558 acceptable
561
+ 559 acceptable
562
+ 560 acceptable
563
+ 561 acceptable
564
+ 562 acceptable
565
+ 563 acceptable
566
+ 564 acceptable
567
+ 565 acceptable
568
+ 566 acceptable
569
+ 567 acceptable
570
+ 568 acceptable
571
+ 569 acceptable
572
+ 570 acceptable
573
+ 571 unacceptable
574
+ 572 acceptable
575
+ 573 acceptable
576
+ 574 acceptable
577
+ 575 unacceptable
578
+ 576 acceptable
579
+ 577 acceptable
580
+ 578 acceptable
581
+ 579 acceptable
582
+ 580 acceptable
583
+ 581 unacceptable
584
+ 582 unacceptable
585
+ 583 acceptable
586
+ 584 acceptable
587
+ 585 acceptable
588
+ 586 unacceptable
589
+ 587 acceptable
590
+ 588 acceptable
591
+ 589 acceptable
592
+ 590 acceptable
593
+ 591 acceptable
594
+ 592 acceptable
595
+ 593 acceptable
596
+ 594 acceptable
597
+ 595 acceptable
598
+ 596 acceptable
599
+ 597 acceptable
600
+ 598 acceptable
601
+ 599 acceptable
602
+ 600 acceptable
603
+ 601 acceptable
604
+ 602 acceptable
605
+ 603 acceptable
606
+ 604 unacceptable
607
+ 605 acceptable
608
+ 606 unacceptable
609
+ 607 acceptable
610
+ 608 acceptable
611
+ 609 acceptable
612
+ 610 acceptable
613
+ 611 acceptable
614
+ 612 acceptable
615
+ 613 acceptable
616
+ 614 acceptable
617
+ 615 acceptable
618
+ 616 acceptable
619
+ 617 unacceptable
620
+ 618 acceptable
621
+ 619 acceptable
622
+ 620 acceptable
623
+ 621 acceptable
624
+ 622 acceptable
625
+ 623 acceptable
626
+ 624 acceptable
627
+ 625 acceptable
628
+ 626 acceptable
629
+ 627 acceptable
630
+ 628 acceptable
631
+ 629 acceptable
632
+ 630 unacceptable
633
+ 631 acceptable
634
+ 632 acceptable
635
+ 633 acceptable
636
+ 634 acceptable
637
+ 635 unacceptable
638
+ 636 acceptable
639
+ 637 acceptable
640
+ 638 acceptable
641
+ 639 acceptable
642
+ 640 unacceptable
643
+ 641 unacceptable
644
+ 642 unacceptable
645
+ 643 acceptable
646
+ 644 acceptable
647
+ 645 acceptable
648
+ 646 acceptable
649
+ 647 acceptable
650
+ 648 unacceptable
651
+ 649 acceptable
652
+ 650 unacceptable
653
+ 651 acceptable
654
+ 652 acceptable
655
+ 653 unacceptable
656
+ 654 unacceptable
657
+ 655 acceptable
658
+ 656 unacceptable
659
+ 657 unacceptable
660
+ 658 unacceptable
661
+ 659 acceptable
662
+ 660 acceptable
663
+ 661 acceptable
664
+ 662 acceptable
665
+ 663 acceptable
666
+ 664 acceptable
667
+ 665 acceptable
668
+ 666 acceptable
669
+ 667 acceptable
670
+ 668 unacceptable
671
+ 669 acceptable
672
+ 670 acceptable
673
+ 671 acceptable
674
+ 672 acceptable
675
+ 673 acceptable
676
+ 674 unacceptable
677
+ 675 acceptable
678
+ 676 acceptable
679
+ 677 acceptable
680
+ 678 acceptable
681
+ 679 unacceptable
682
+ 680 acceptable
683
+ 681 acceptable
684
+ 682 acceptable
685
+ 683 acceptable
686
+ 684 acceptable
687
+ 685 acceptable
688
+ 686 acceptable
689
+ 687 acceptable
690
+ 688 acceptable
691
+ 689 unacceptable
692
+ 690 unacceptable
693
+ 691 unacceptable
694
+ 692 acceptable
695
+ 693 acceptable
696
+ 694 unacceptable
697
+ 695 unacceptable
698
+ 696 acceptable
699
+ 697 acceptable
700
+ 698 acceptable
701
+ 699 unacceptable
702
+ 700 acceptable
703
+ 701 unacceptable
704
+ 702 unacceptable
705
+ 703 acceptable
706
+ 704 unacceptable
707
+ 705 acceptable
708
+ 706 acceptable
709
+ 707 unacceptable
710
+ 708 acceptable
711
+ 709 acceptable
712
+ 710 acceptable
713
+ 711 unacceptable
714
+ 712 acceptable
715
+ 713 acceptable
716
+ 714 acceptable
717
+ 715 unacceptable
718
+ 716 acceptable
719
+ 717 unacceptable
720
+ 718 unacceptable
721
+ 719 acceptable
722
+ 720 acceptable
723
+ 721 unacceptable
724
+ 722 unacceptable
725
+ 723 acceptable
726
+ 724 unacceptable
727
+ 725 acceptable
728
+ 726 unacceptable
729
+ 727 unacceptable
730
+ 728 acceptable
731
+ 729 acceptable
732
+ 730 acceptable
733
+ 731 unacceptable
734
+ 732 unacceptable
735
+ 733 acceptable
736
+ 734 acceptable
737
+ 735 acceptable
738
+ 736 acceptable
739
+ 737 acceptable
740
+ 738 acceptable
741
+ 739 acceptable
742
+ 740 acceptable
743
+ 741 unacceptable
744
+ 742 acceptable
745
+ 743 acceptable
746
+ 744 unacceptable
747
+ 745 acceptable
748
+ 746 acceptable
749
+ 747 unacceptable
750
+ 748 acceptable
751
+ 749 acceptable
752
+ 750 acceptable
753
+ 751 acceptable
754
+ 752 acceptable
755
+ 753 acceptable
756
+ 754 acceptable
757
+ 755 acceptable
758
+ 756 acceptable
759
+ 757 acceptable
760
+ 758 acceptable
761
+ 759 acceptable
762
+ 760 acceptable
763
+ 761 acceptable
764
+ 762 acceptable
765
+ 763 acceptable
766
+ 764 acceptable
767
+ 765 acceptable
768
+ 766 unacceptable
769
+ 767 acceptable
770
+ 768 acceptable
771
+ 769 acceptable
772
+ 770 acceptable
773
+ 771 acceptable
774
+ 772 acceptable
775
+ 773 acceptable
776
+ 774 acceptable
777
+ 775 unacceptable
778
+ 776 unacceptable
779
+ 777 acceptable
780
+ 778 acceptable
781
+ 779 acceptable
782
+ 780 acceptable
783
+ 781 acceptable
784
+ 782 acceptable
785
+ 783 acceptable
786
+ 784 acceptable
787
+ 785 acceptable
788
+ 786 acceptable
789
+ 787 acceptable
790
+ 788 acceptable
791
+ 789 acceptable
792
+ 790 acceptable
793
+ 791 acceptable
794
+ 792 unacceptable
795
+ 793 acceptable
796
+ 794 unacceptable
797
+ 795 acceptable
798
+ 796 unacceptable
799
+ 797 acceptable
800
+ 798 unacceptable
801
+ 799 unacceptable
802
+ 800 acceptable
803
+ 801 acceptable
804
+ 802 acceptable
805
+ 803 acceptable
806
+ 804 acceptable
807
+ 805 acceptable
808
+ 806 acceptable
809
+ 807 unacceptable
810
+ 808 unacceptable
811
+ 809 acceptable
812
+ 810 acceptable
813
+ 811 acceptable
814
+ 812 acceptable
815
+ 813 acceptable
816
+ 814 acceptable
817
+ 815 unacceptable
818
+ 816 acceptable
819
+ 817 acceptable
820
+ 818 acceptable
821
+ 819 acceptable
822
+ 820 acceptable
823
+ 821 acceptable
824
+ 822 unacceptable
825
+ 823 unacceptable
826
+ 824 acceptable
827
+ 825 unacceptable
828
+ 826 unacceptable
829
+ 827 acceptable
830
+ 828 acceptable
831
+ 829 acceptable
832
+ 830 unacceptable
833
+ 831 unacceptable
834
+ 832 unacceptable
835
+ 833 acceptable
836
+ 834 acceptable
837
+ 835 acceptable
838
+ 836 unacceptable
839
+ 837 acceptable
840
+ 838 acceptable
841
+ 839 acceptable
842
+ 840 acceptable
843
+ 841 unacceptable
844
+ 842 acceptable
845
+ 843 acceptable
846
+ 844 acceptable
847
+ 845 acceptable
848
+ 846 unacceptable
849
+ 847 acceptable
850
+ 848 acceptable
851
+ 849 acceptable
852
+ 850 acceptable
853
+ 851 acceptable
854
+ 852 acceptable
855
+ 853 unacceptable
856
+ 854 acceptable
857
+ 855 acceptable
858
+ 856 acceptable
859
+ 857 acceptable
860
+ 858 unacceptable
861
+ 859 acceptable
862
+ 860 acceptable
863
+ 861 acceptable
864
+ 862 acceptable
865
+ 863 acceptable
866
+ 864 acceptable
867
+ 865 acceptable
868
+ 866 acceptable
869
+ 867 acceptable
870
+ 868 acceptable
871
+ 869 acceptable
872
+ 870 acceptable
873
+ 871 acceptable
874
+ 872 unacceptable
875
+ 873 unacceptable
876
+ 874 acceptable
877
+ 875 acceptable
878
+ 876 acceptable
879
+ 877 unacceptable
880
+ 878 acceptable
881
+ 879 acceptable
882
+ 880 acceptable
883
+ 881 acceptable
884
+ 882 acceptable
885
+ 883 acceptable
886
+ 884 acceptable
887
+ 885 unacceptable
888
+ 886 unacceptable
889
+ 887 unacceptable
890
+ 888 unacceptable
891
+ 889 unacceptable
892
+ 890 unacceptable
893
+ 891 unacceptable
894
+ 892 unacceptable
895
+ 893 acceptable
896
+ 894 acceptable
897
+ 895 acceptable
898
+ 896 acceptable
899
+ 897 unacceptable
900
+ 898 unacceptable
901
+ 899 acceptable
902
+ 900 acceptable
903
+ 901 acceptable
904
+ 902 acceptable
905
+ 903 acceptable
906
+ 904 unacceptable
907
+ 905 acceptable
908
+ 906 acceptable
909
+ 907 acceptable
910
+ 908 acceptable
911
+ 909 acceptable
912
+ 910 acceptable
913
+ 911 acceptable
914
+ 912 acceptable
915
+ 913 unacceptable
916
+ 914 acceptable
917
+ 915 acceptable
918
+ 916 acceptable
919
+ 917 acceptable
920
+ 918 acceptable
921
+ 919 acceptable
922
+ 920 acceptable
923
+ 921 acceptable
924
+ 922 acceptable
925
+ 923 unacceptable
926
+ 924 unacceptable
927
+ 925 acceptable
928
+ 926 acceptable
929
+ 927 acceptable
930
+ 928 acceptable
931
+ 929 acceptable
932
+ 930 unacceptable
933
+ 931 unacceptable
934
+ 932 unacceptable
935
+ 933 unacceptable
936
+ 934 acceptable
937
+ 935 acceptable
938
+ 936 acceptable
939
+ 937 unacceptable
940
+ 938 unacceptable
941
+ 939 unacceptable
942
+ 940 acceptable
943
+ 941 acceptable
944
+ 942 unacceptable
945
+ 943 acceptable
946
+ 944 acceptable
947
+ 945 acceptable
948
+ 946 acceptable
949
+ 947 acceptable
950
+ 948 unacceptable
951
+ 949 unacceptable
952
+ 950 acceptable
953
+ 951 acceptable
954
+ 952 unacceptable
955
+ 953 unacceptable
956
+ 954 acceptable
957
+ 955 unacceptable
958
+ 956 acceptable
959
+ 957 acceptable
960
+ 958 acceptable
961
+ 959 acceptable
962
+ 960 acceptable
963
+ 961 acceptable
964
+ 962 acceptable
965
+ 963 acceptable
966
+ 964 acceptable
967
+ 965 acceptable
968
+ 966 acceptable
969
+ 967 acceptable
970
+ 968 acceptable
971
+ 969 acceptable
972
+ 970 acceptable
973
+ 971 acceptable
974
+ 972 acceptable
975
+ 973 acceptable
976
+ 974 acceptable
977
+ 975 acceptable
978
+ 976 acceptable
979
+ 977 acceptable
980
+ 978 acceptable
981
+ 979 acceptable
982
+ 980 unacceptable
983
+ 981 acceptable
984
+ 982 unacceptable
985
+ 983 acceptable
986
+ 984 acceptable
987
+ 985 acceptable
988
+ 986 acceptable
989
+ 987 acceptable
990
+ 988 unacceptable
991
+ 989 acceptable
992
+ 990 acceptable
993
+ 991 unacceptable
994
+ 992 acceptable
995
+ 993 acceptable
996
+ 994 acceptable
997
+ 995 acceptable
998
+ 996 acceptable
999
+ 997 acceptable
1000
+ 998 unacceptable
1001
+ 999 acceptable
1002
+ 1000 acceptable
1003
+ 1001 acceptable
1004
+ 1002 acceptable
1005
+ 1003 acceptable
1006
+ 1004 unacceptable
1007
+ 1005 acceptable
1008
+ 1006 acceptable
1009
+ 1007 acceptable
1010
+ 1008 acceptable
1011
+ 1009 acceptable
1012
+ 1010 acceptable
1013
+ 1011 acceptable
1014
+ 1012 acceptable
1015
+ 1013 acceptable
1016
+ 1014 acceptable
1017
+ 1015 acceptable
1018
+ 1016 acceptable
1019
+ 1017 acceptable
1020
+ 1018 acceptable
1021
+ 1019 acceptable
1022
+ 1020 unacceptable
1023
+ 1021 acceptable
1024
+ 1022 acceptable
1025
+ 1023 unacceptable
1026
+ 1024 acceptable
1027
+ 1025 acceptable
1028
+ 1026 acceptable
1029
+ 1027 acceptable
1030
+ 1028 acceptable
1031
+ 1029 acceptable
1032
+ 1030 acceptable
1033
+ 1031 acceptable
1034
+ 1032 acceptable
1035
+ 1033 acceptable
1036
+ 1034 acceptable
1037
+ 1035 unacceptable
1038
+ 1036 unacceptable
1039
+ 1037 acceptable
1040
+ 1038 acceptable
1041
+ 1039 acceptable
1042
+ 1040 unacceptable
1043
+ 1041 acceptable
1044
+ 1042 acceptable
1045
+ 1043 unacceptable
1046
+ 1044 unacceptable
1047
+ 1045 acceptable
1048
+ 1046 acceptable
1049
+ 1047 acceptable
1050
+ 1048 acceptable
1051
+ 1049 unacceptable
1052
+ 1050 acceptable
1053
+ 1051 acceptable
1054
+ 1052 unacceptable
1055
+ 1053 unacceptable
1056
+ 1054 acceptable
1057
+ 1055 unacceptable
1058
+ 1056 acceptable
1059
+ 1057 acceptable
1060
+ 1058 acceptable
1061
+ 1059 unacceptable
1062
+ 1060 acceptable
1063
+ 1061 unacceptable
1064
+ 1062 unacceptable
train_results.json ADDED
@@ -0,0 +1,8 @@
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "epoch": 8.0,
3
+ "train_loss": 0.39676498534048305,
4
+ "train_runtime": 212.9463,
5
+ "train_samples": 8551,
6
+ "train_samples_per_second": 321.245,
7
+ "train_steps_per_second": 0.639
8
+ }
trainer_state.json ADDED
@@ -0,0 +1,259 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "best_metric": 0.4402828514575958,
3
+ "best_model_checkpoint": "./runtime-text-classification/electra-small-discriminator-CoLA/checkpoint-68",
4
+ "epoch": 8.0,
5
+ "global_step": 136,
6
+ "is_hyper_param_search": false,
7
+ "is_local_process_zero": true,
8
+ "is_world_process_zero": true,
9
+ "log_history": [
10
+ {
11
+ "epoch": 0.29,
12
+ "learning_rate": 5.714285714285715e-05,
13
+ "loss": 0.6849,
14
+ "step": 5
15
+ },
16
+ {
17
+ "epoch": 0.59,
18
+ "learning_rate": 7.989329134654207e-05,
19
+ "loss": 0.6448,
20
+ "step": 10
21
+ },
22
+ {
23
+ "epoch": 0.88,
24
+ "learning_rate": 7.924324356368777e-05,
25
+ "loss": 0.6139,
26
+ "step": 15
27
+ },
28
+ {
29
+ "epoch": 1.0,
30
+ "eval_loss": 0.5997378826141357,
31
+ "eval_matthews_correlation": 0.0,
32
+ "eval_runtime": 0.8941,
33
+ "eval_samples_per_second": 1166.585,
34
+ "eval_steps_per_second": 73.82,
35
+ "step": 17
36
+ },
37
+ {
38
+ "epoch": 1.18,
39
+ "learning_rate": 7.801204537254331e-05,
40
+ "loss": 0.5956,
41
+ "step": 20
42
+ },
43
+ {
44
+ "epoch": 1.47,
45
+ "learning_rate": 7.621792949972588e-05,
46
+ "loss": 0.5731,
47
+ "step": 25
48
+ },
49
+ {
50
+ "epoch": 1.76,
51
+ "learning_rate": 7.388746487984242e-05,
52
+ "loss": 0.5315,
53
+ "step": 30
54
+ },
55
+ {
56
+ "epoch": 2.0,
57
+ "eval_loss": 0.4889530539512634,
58
+ "eval_matthews_correlation": 0.5153742778418894,
59
+ "eval_runtime": 0.9571,
60
+ "eval_samples_per_second": 1089.761,
61
+ "eval_steps_per_second": 68.959,
62
+ "step": 34
63
+ },
64
+ {
65
+ "epoch": 2.06,
66
+ "learning_rate": 7.105516319802298e-05,
67
+ "loss": 0.4982,
68
+ "step": 35
69
+ },
70
+ {
71
+ "epoch": 2.35,
72
+ "learning_rate": 6.776296780882537e-05,
73
+ "loss": 0.457,
74
+ "step": 40
75
+ },
76
+ {
77
+ "epoch": 2.65,
78
+ "learning_rate": 6.405963260007481e-05,
79
+ "loss": 0.4453,
80
+ "step": 45
81
+ },
82
+ {
83
+ "epoch": 2.94,
84
+ "learning_rate": 6.000000000000001e-05,
85
+ "loss": 0.4244,
86
+ "step": 50
87
+ },
88
+ {
89
+ "epoch": 3.0,
90
+ "eval_loss": 0.4469350576400757,
91
+ "eval_matthews_correlation": 0.5432575763528743,
92
+ "eval_runtime": 0.926,
93
+ "eval_samples_per_second": 1126.29,
94
+ "eval_steps_per_second": 71.271,
95
+ "step": 51
96
+ },
97
+ {
98
+ "epoch": 3.24,
99
+ "learning_rate": 5.564418881960624e-05,
100
+ "loss": 0.3968,
101
+ "step": 55
102
+ },
103
+ {
104
+ "epoch": 3.53,
105
+ "learning_rate": 5.105670395747087e-05,
106
+ "loss": 0.3774,
107
+ "step": 60
108
+ },
109
+ {
110
+ "epoch": 3.82,
111
+ "learning_rate": 4.6305481151278946e-05,
112
+ "loss": 0.3568,
113
+ "step": 65
114
+ },
115
+ {
116
+ "epoch": 4.0,
117
+ "eval_loss": 0.4402828514575958,
118
+ "eval_matthews_correlation": 0.5510400717227824,
119
+ "eval_runtime": 0.9239,
120
+ "eval_samples_per_second": 1128.958,
121
+ "eval_steps_per_second": 71.439,
122
+ "step": 68
123
+ },
124
+ {
125
+ "epoch": 4.12,
126
+ "learning_rate": 4.1460880922306367e-05,
127
+ "loss": 0.342,
128
+ "step": 70
129
+ },
130
+ {
131
+ "epoch": 4.41,
132
+ "learning_rate": 3.6594646611454575e-05,
133
+ "loss": 0.3341,
134
+ "step": 75
135
+ },
136
+ {
137
+ "epoch": 4.71,
138
+ "learning_rate": 3.177884193720798e-05,
139
+ "loss": 0.3171,
140
+ "step": 80
141
+ },
142
+ {
143
+ "epoch": 5.0,
144
+ "learning_rate": 2.7084783809142164e-05,
145
+ "loss": 0.319,
146
+ "step": 85
147
+ },
148
+ {
149
+ "epoch": 5.0,
150
+ "eval_loss": 0.4517458379268646,
151
+ "eval_matthews_correlation": 0.5653604748370356,
152
+ "eval_runtime": 0.9654,
153
+ "eval_samples_per_second": 1080.428,
154
+ "eval_steps_per_second": 68.368,
155
+ "step": 85
156
+ },
157
+ {
158
+ "epoch": 5.29,
159
+ "learning_rate": 2.2581986200872356e-05,
160
+ "loss": 0.3019,
161
+ "step": 90
162
+ },
163
+ {
164
+ "epoch": 5.59,
165
+ "learning_rate": 1.833713072255262e-05,
166
+ "loss": 0.2781,
167
+ "step": 95
168
+ },
169
+ {
170
+ "epoch": 5.88,
171
+ "learning_rate": 1.4413079137644358e-05,
172
+ "loss": 0.2887,
173
+ "step": 100
174
+ },
175
+ {
176
+ "epoch": 6.0,
177
+ "eval_loss": 0.46560344099998474,
178
+ "eval_matthews_correlation": 0.5727969336224868,
179
+ "eval_runtime": 0.9477,
180
+ "eval_samples_per_second": 1100.569,
181
+ "eval_steps_per_second": 69.643,
182
+ "step": 102
183
+ },
184
+ {
185
+ "epoch": 6.18,
186
+ "learning_rate": 1.0867942447523366e-05,
187
+ "loss": 0.3025,
188
+ "step": 105
189
+ },
190
+ {
191
+ "epoch": 6.47,
192
+ "learning_rate": 7.75422032978549e-06,
193
+ "loss": 0.2775,
194
+ "step": 110
195
+ },
196
+ {
197
+ "epoch": 6.76,
198
+ "learning_rate": 5.118023674247692e-06,
199
+ "loss": 0.2771,
200
+ "step": 115
201
+ },
202
+ {
203
+ "epoch": 7.0,
204
+ "eval_loss": 0.4558466076850891,
205
+ "eval_matthews_correlation": 0.5882977917441249,
206
+ "eval_runtime": 1.0446,
207
+ "eval_samples_per_second": 998.496,
208
+ "eval_steps_per_second": 63.184,
209
+ "step": 119
210
+ },
211
+ {
212
+ "epoch": 7.06,
213
+ "learning_rate": 2.9983917300539224e-06,
214
+ "loss": 0.2732,
215
+ "step": 120
216
+ },
217
+ {
218
+ "epoch": 7.35,
219
+ "learning_rate": 1.426713976205658e-06,
220
+ "loss": 0.2865,
221
+ "step": 125
222
+ },
223
+ {
224
+ "epoch": 7.65,
225
+ "learning_rate": 4.2626527699558996e-07,
226
+ "loss": 0.2695,
227
+ "step": 130
228
+ },
229
+ {
230
+ "epoch": 7.94,
231
+ "learning_rate": 1.1861206194425657e-08,
232
+ "loss": 0.2729,
233
+ "step": 135
234
+ },
235
+ {
236
+ "epoch": 8.0,
237
+ "eval_loss": 0.4568850100040436,
238
+ "eval_matthews_correlation": 0.5857509882742485,
239
+ "eval_runtime": 0.8945,
240
+ "eval_samples_per_second": 1165.969,
241
+ "eval_steps_per_second": 73.781,
242
+ "step": 136
243
+ },
244
+ {
245
+ "epoch": 8.0,
246
+ "step": 136,
247
+ "total_flos": 503134700437504.0,
248
+ "train_loss": 0.39676498534048305,
249
+ "train_runtime": 212.9463,
250
+ "train_samples_per_second": 321.245,
251
+ "train_steps_per_second": 0.639
252
+ }
253
+ ],
254
+ "max_steps": 136,
255
+ "num_train_epochs": 8,
256
+ "total_flos": 503134700437504.0,
257
+ "trial_name": null,
258
+ "trial_params": null
259
+ }