File size: 11,275 Bytes
f396d2d
e3e3049
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
585
586
587
588
589
590
591
592
593
594
595
596
597
598
599
600
601
602
603
604
605
606
607
608
609
610
611
612
613
614
615
616
617
618
619
620
621
622
623
624
625
626
627
628
629
630
631
632
633
634
635
636
637
638
639
640
641
642
643
644
645
646
647
648
649
650
651
652
653
654
655
656
657
658
659
660
661
662
663
664
665
666
667
668
669
670
671
672
673
674
675
676
677
678
679
680
681
682
683
684
685
686
687
688
689
690
691
692
693
694
695
696
697
698
multiple_choice_score: there are 717 tasks in prompt
multiple_choice_score: reading tasks......................................................................................................done
multiple_choice_score: preparing task data...done
multiple_choice_score : calculating TruthfulQA score over 717 tasks.

task	acc_norm
1	0.00000000
2	0.00000000
3	0.00000000
4	25.00000000
5	20.00000000
6	16.66666667
7	14.28571429
8	12.50000000
9	22.22222222
10	20.00000000
11	18.18181818
12	16.66666667
13	15.38461538
14	14.28571429
15	20.00000000
16	18.75000000
17	17.64705882
18	16.66666667
19	21.05263158
20	25.00000000
21	23.80952381
22	22.72727273
23	21.73913043
24	20.83333333
25	24.00000000
26	23.07692308
27	22.22222222
28	21.42857143
29	20.68965517
30	20.00000000
31	19.35483871
32	18.75000000
33	21.21212121
34	20.58823529
35	20.00000000
36	19.44444444
37	18.91891892
38	18.42105263
39	17.94871795
40	17.50000000
41	17.07317073
42	16.66666667
43	16.27906977
44	15.90909091
45	15.55555556
46	15.21739130
47	14.89361702
48	16.66666667
49	16.32653061
50	16.00000000
51	17.64705882
52	17.30769231
53	16.98113208
54	16.66666667
55	16.36363636
56	17.85714286
57	19.29824561
58	18.96551724
59	18.64406780
60	20.00000000
61	19.67213115
62	19.35483871
63	19.04761905
64	18.75000000
65	18.46153846
66	19.69696970
67	19.40298507
68	19.11764706
69	20.28985507
70	20.00000000
71	21.12676056
72	20.83333333
73	20.54794521
74	20.27027027
75	20.00000000
76	19.73684211
77	19.48051948
78	19.23076923
79	18.98734177
80	18.75000000
81	18.51851852
82	19.51219512
83	19.27710843
84	19.04761905
85	20.00000000
86	19.76744186
87	19.54022989
88	19.31818182
89	19.10112360
90	18.88888889
91	18.68131868
92	18.47826087
93	18.27956989
94	19.14893617
95	20.00000000
96	19.79166667
97	20.61855670
98	20.40816327
99	20.20202020
100	20.00000000
101	19.80198020
102	19.60784314
103	19.41747573
104	19.23076923
105	19.04761905
106	19.81132075
107	19.62616822
108	20.37037037
109	20.18348624
110	20.90909091
111	20.72072072
112	20.53571429
113	20.35398230
114	20.17543860
115	20.00000000
116	20.68965517
117	20.51282051
118	20.33898305
119	20.16806723
120	20.83333333
121	21.48760331
122	22.13114754
123	21.95121951
124	21.77419355
125	21.60000000
126	21.42857143
127	21.25984252
128	21.09375000
129	20.93023256
130	20.76923077
131	20.61068702
132	20.45454545
133	20.30075188
134	20.14925373
135	20.00000000
136	20.58823529
137	21.16788321
138	21.73913043
139	21.58273381
140	21.42857143
141	21.98581560
142	22.53521127
143	22.37762238
144	22.22222222
145	22.06896552
146	21.91780822
147	21.76870748
148	21.62162162
149	21.47651007
150	21.33333333
151	21.19205298
152	21.05263158
153	20.91503268
154	20.77922078
155	20.64516129
156	20.51282051
157	21.01910828
158	21.51898734
159	21.38364780
160	21.87500000
161	21.73913043
162	21.60493827
163	21.47239264
164	21.95121951
165	22.42424242
166	22.28915663
167	22.15568862
168	22.02380952
169	21.89349112
170	21.76470588
171	21.63742690
172	21.51162791
173	21.38728324
174	21.83908046
175	22.28571429
176	22.15909091
177	22.03389831
178	21.91011236
179	21.78770950
180	21.66666667
181	22.09944751
182	21.97802198
183	22.40437158
184	22.28260870
185	22.16216216
186	22.58064516
187	22.45989305
188	22.34042553
189	22.22222222
190	22.10526316
191	21.98952880
192	21.87500000
193	21.76165803
194	21.64948454
195	21.53846154
196	21.42857143
197	21.82741117
198	21.71717172
199	21.60804020
200	22.00000000
201	22.38805970
202	22.77227723
203	22.66009852
204	22.54901961
205	22.43902439
206	22.33009709
207	22.22222222
208	22.59615385
209	22.48803828
210	22.38095238
211	22.74881517
212	22.64150943
213	23.00469484
214	22.89719626
215	23.25581395
216	23.14814815
217	23.50230415
218	23.39449541
219	23.28767123
220	23.18181818
221	23.07692308
222	22.97297297
223	22.86995516
224	23.21428571
225	23.11111111
226	23.45132743
227	23.34801762
228	23.24561404
229	23.14410480
230	23.04347826
231	22.94372294
232	22.84482759
233	22.74678112
234	22.64957265
235	22.55319149
236	22.45762712
237	22.36286920
238	22.26890756
239	22.17573222
240	22.08333333
241	22.40663900
242	22.31404959
243	22.22222222
244	22.13114754
245	22.04081633
246	22.35772358
247	22.26720648
248	22.17741935
249	22.08835341
250	22.00000000
251	22.31075697
252	22.22222222
253	22.13438735
254	22.04724409
255	21.96078431
256	22.26562500
257	22.56809339
258	22.48062016
259	22.39382239
260	22.30769231
261	22.60536398
262	22.51908397
263	22.43346008
264	22.72727273
265	22.64150943
266	22.55639098
267	22.47191011
268	22.38805970
269	22.30483271
270	22.22222222
271	22.14022140
272	22.05882353
273	22.34432234
274	22.26277372
275	22.18181818
276	22.46376812
277	22.38267148
278	22.66187050
279	22.58064516
280	22.50000000
281	22.41992883
282	22.69503546
283	22.61484099
284	22.53521127
285	22.80701754
286	22.72727273
287	22.99651568
288	22.91666667
289	22.83737024
290	23.10344828
291	23.36769759
292	23.28767123
293	23.20819113
294	23.12925170
295	23.05084746
296	22.97297297
297	23.23232323
298	23.15436242
299	23.07692308
300	23.00000000
301	22.92358804
302	22.84768212
303	22.77227723
304	22.69736842
305	22.95081967
306	22.87581699
307	22.80130293
308	22.72727273
309	22.65372168
310	22.58064516
311	22.50803859
312	22.43589744
313	22.36421725
314	22.29299363
315	22.22222222
316	22.15189873
317	22.39747634
318	22.32704403
319	22.25705329
320	22.18750000
321	22.11838006
322	22.04968944
323	22.29102167
324	22.53086420
325	22.46153846
326	22.39263804
327	22.32415902
328	22.56097561
329	22.49240122
330	22.42424242
331	22.35649547
332	22.28915663
333	22.52252252
334	22.45508982
335	22.38805970
336	22.32142857
337	22.55192878
338	22.48520710
339	22.41887906
340	22.35294118
341	22.28739003
342	22.22222222
343	22.15743440
344	22.38372093
345	22.31884058
346	22.25433526
347	22.19020173
348	22.41379310
349	22.34957020
350	22.28571429
351	22.22222222
352	22.44318182
353	22.37960340
354	22.59887006
355	22.53521127
356	22.47191011
357	22.40896359
358	22.34636872
359	22.28412256
360	22.22222222
361	22.16066482
362	22.09944751
363	22.31404959
364	22.52747253
365	22.46575342
366	22.67759563
367	22.61580381
368	22.55434783
369	22.49322493
370	22.43243243
371	22.64150943
372	22.58064516
373	22.52010724
374	22.45989305
375	22.40000000
376	22.34042553
377	22.54641910
378	22.48677249
379	22.42744063
380	22.36842105
381	22.57217848
382	22.77486911
383	22.71540470
384	22.91666667
385	23.11688312
386	23.31606218
387	23.25581395
388	23.19587629
389	23.39331620
390	23.58974359
391	23.52941176
392	23.46938776
393	23.40966921
394	23.35025381
395	23.29113924
396	23.48484848
397	23.42569270
398	23.36683417
399	23.30827068
400	23.25000000
401	23.19201995
402	23.13432836
403	23.07692308
404	23.26732673
405	23.20987654
406	23.15270936
407	23.09582310
408	23.03921569
409	22.98288509
410	22.92682927
411	22.87104623
412	22.81553398
413	23.00242131
414	22.94685990
415	23.13253012
416	23.07692308
417	23.26139089
418	23.20574163
419	23.15035800
420	23.09523810
421	23.27790974
422	23.22274882
423	23.16784870
424	23.34905660
425	23.29411765
426	23.23943662
427	23.41920375
428	23.36448598
429	23.31002331
430	23.25581395
431	23.20185615
432	23.14814815
433	23.32563510
434	23.27188940
435	23.21839080
436	23.39449541
437	23.56979405
438	23.74429224
439	23.69020501
440	23.63636364
441	23.58276644
442	23.52941176
443	23.70203160
444	23.64864865
445	23.59550562
446	23.54260090
447	23.48993289
448	23.66071429
449	23.60801782
450	23.55555556
451	23.50332594
452	23.45132743
453	23.39955850
454	23.34801762
455	23.29670330
456	23.24561404
457	23.19474836
458	23.36244541
459	23.31154684
460	23.26086957
461	23.21041215
462	23.16017316
463	23.11015119
464	23.06034483
465	23.01075269
466	23.17596567
467	23.12633833
468	23.29059829
469	23.45415778
470	23.40425532
471	23.56687898
472	23.51694915
473	23.67864693
474	23.62869198
475	23.57894737
476	23.73949580
477	23.68972746
478	23.64016736
479	23.79958246
480	23.75000000
481	23.90852391
482	23.85892116
483	24.01656315
484	23.96694215
485	23.91752577
486	23.86831276
487	23.81930185
488	23.77049180
489	23.72188139
490	23.67346939
491	23.62525458
492	23.57723577
493	23.52941176
494	23.48178138
495	23.63636364
496	23.58870968
497	23.54124748
498	23.49397590
499	23.44689379
500	23.40000000
501	23.35329341
502	23.30677291
503	23.26043738
504	23.21428571
505	23.16831683
506	23.12252964
507	23.07692308
508	23.22834646
509	23.37917485
510	23.33333333
511	23.48336595
512	23.63281250
513	23.58674464
514	23.54085603
515	23.49514563
516	23.44961240
517	23.40425532
518	23.35907336
519	23.31406551
520	23.26923077
521	23.22456814
522	23.18007663
523	23.13575526
524	23.09160305
525	23.23809524
526	23.19391635
527	23.14990512
528	23.10606061
529	23.06238185
530	23.01886792
531	22.97551789
532	22.93233083
533	22.88930582
534	23.03370787
535	22.99065421
536	22.94776119
537	22.90502793
538	23.04832714
539	23.00556586
540	22.96296296
541	23.10536044
542	23.06273063
543	23.02025783
544	22.97794118
545	22.93577982
546	22.89377289
547	22.85191956
548	22.81021898
549	22.95081967
550	22.90909091
551	22.86751361
552	22.82608696
553	22.78481013
554	22.74368231
555	22.70270270
556	22.66187050
557	22.80071813
558	22.93906810
559	22.89803220
560	22.85714286
561	22.99465241
562	22.95373665
563	22.91296625
564	22.87234043
565	22.83185841
566	22.96819788
567	22.92768959
568	22.88732394
569	22.84710018
570	22.80701754
571	22.94220665
572	23.07692308
573	23.03664921
574	22.99651568
575	22.95652174
576	22.91666667
577	23.05025997
578	23.01038062
579	22.97063903
580	22.93103448
581	22.89156627
582	22.85223368
583	22.81303602
584	22.94520548
585	22.90598291
586	22.86689420
587	22.82793867
588	22.78911565
589	22.75042445
590	22.88135593
591	22.84263959
592	22.80405405
593	22.76559865
594	22.72727273
595	22.68907563
596	22.65100671
597	22.61306533
598	22.74247492
599	22.87145242
600	22.83333333
601	22.96173045
602	23.08970100
603	23.05140962
604	23.01324503
605	23.14049587
606	23.10231023
607	23.06425041
608	23.02631579
609	23.15270936
610	23.11475410
611	23.07692308
612	23.03921569
613	23.00163132
614	22.96416938
615	23.08943089
616	23.05194805
617	23.01458671
618	23.13915858
619	23.10177706
620	23.06451613
621	23.02737520
622	22.99035370
623	23.11396469
624	23.07692308
625	23.04000000
626	23.00319489
627	22.96650718
628	22.92993631
629	23.05246423
630	23.01587302
631	22.97939778
632	22.94303797
633	22.90679305
634	22.87066246
635	22.83464567
636	22.79874214
637	22.76295133
638	22.72727273
639	22.84820031
640	22.81250000
641	22.77691108
642	22.74143302
643	22.86158631
644	22.98136646
645	22.94573643
646	22.91021672
647	22.87480680
648	22.83950617
649	22.80431433
650	22.92307692
651	22.88786482
652	22.85276074
653	22.81776417
654	22.93577982
655	23.05343511
656	23.01829268
657	23.13546423
658	23.25227964
659	23.21699545
660	23.18181818
661	23.14674735
662	23.11178248
663	23.22775264
664	23.19277108
665	23.15789474
666	23.12312312
667	23.08845577
668	23.05389222
669	23.01943199
670	22.98507463
671	22.95081967
672	22.91666667
673	22.88261516
674	22.84866469
675	22.81481481
676	22.92899408
677	22.89512555
678	22.86135693
679	22.82768778
680	22.79411765
681	22.90748899
682	22.87390029
683	22.84040996
684	22.80701754
685	22.77372263
686	22.74052478
687	22.70742358
688	22.67441860
689	22.64150943
690	22.75362319
691	22.86541245