kreas commited on
Commit
466a138
1 Parent(s): 45d3807

Upload /Llama-2-7b-hf/nf4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Llama-2-7b-hf/nf4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,258 +2,257 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 1014.673408,
6
  "max_vram": 4905.238528,
7
  "max_reserved": 4420.796416,
8
  "max_allocated": 4252.667392
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.04235845992333779,
13
- "stdev": 0.000575210706458403,
14
  "values": [
15
- 0.04604630279541016,
16
- 0.04459417724609375,
17
- 0.044017696380615236,
18
- 0.043,
19
- 0.04298649597167969,
20
- 0.044181758880615235,
21
- 0.04794060897827149,
22
- 0.045223072052001954,
23
- 0.04260659027099609,
24
- 0.04237311935424805,
25
- 0.04183859252929688,
26
- 0.04231884765625,
27
- 0.04192665481567383,
28
- 0.04237004852294922,
29
- 0.04188876724243164,
30
- 0.04235776138305664,
31
- 0.042006526947021484,
32
- 0.04234137725830078,
33
- 0.04183567810058594,
34
- 0.04234649658203125,
35
- 0.04187033462524414,
36
- 0.04235878372192383,
37
- 0.04184985733032227,
38
- 0.04235878372192383,
39
- 0.041902080535888675,
40
- 0.04236083221435547,
41
- 0.04187340927124023,
42
- 0.04234137725830078,
43
- 0.041842689514160154,
44
- 0.04272127914428711,
45
- 0.041869312286376956,
46
  0.04237823867797851,
47
- 0.041842689514160154,
48
- 0.042352638244628905,
49
- 0.041847808837890625,
50
- 0.042379264831542966,
51
- 0.04184783935546875,
52
- 0.04233830261230469,
53
- 0.041853950500488284,
54
- 0.04236083221435547,
55
- 0.04184371185302734,
56
- 0.042344703674316406,
57
- 0.04214886474609375,
58
- 0.04237331390380859,
59
- 0.04184985733032227,
60
- 0.04237516784667969,
61
- 0.0418682861328125,
62
- 0.04235878372192383,
63
- 0.041821182250976564,
64
- 0.04236697769165039,
65
- 0.041850879669189454,
66
- 0.04236288070678711,
67
- 0.04184371185302734,
68
- 0.04235059356689453,
69
- 0.04187363052368164,
70
- 0.042355712890625,
71
- 0.042249214172363284,
 
 
 
 
 
 
 
 
72
  0.04237619018554688,
73
- 0.04187955093383789,
 
 
 
 
 
 
74
  0.04239257431030274,
75
- 0.0418785285949707,
76
- 0.04235366439819336,
77
- 0.04186531066894531,
78
- 0.042355712890625,
79
- 0.041917537689208986,
80
- 0.04249190521240234,
81
- 0.04222566223144531,
82
  0.042352638244628905,
83
- 0.04187855911254883,
84
- 0.04234649658203125,
85
- 0.04184064102172851,
86
- 0.042349567413330076,
87
- 0.04185497665405274,
88
- 0.04238438415527344,
89
- 0.04185190582275391,
90
- 0.04234985733032227,
91
- 0.042038272857666016,
92
- 0.04237107086181641,
93
- 0.042256385803222656,
94
- 0.042438751220703126,
95
- 0.04217958450317383,
96
- 0.0424089584350586,
97
- 0.04188671875,
98
- 0.04234137725830078,
99
- 0.04185804748535156,
100
- 0.04234137725830078,
101
- 0.04192256164550781,
102
- 0.04234649658203125,
103
- 0.04183254241943359,
104
- 0.04236492919921875,
105
- 0.04184985733032227,
106
- 0.0423454704284668,
107
- 0.04186111831665039,
108
- 0.042359809875488284,
109
- 0.04212758255004883,
110
- 0.04239974212646484,
111
- 0.04209766387939453,
112
- 0.04239769744873047,
113
- 0.0418600959777832,
114
- 0.042365951538085936,
115
- 0.04186111831665039,
116
- 0.042379264831542966,
117
- 0.041869312286376956,
118
- 0.04236492919921875,
119
- 0.04219190216064453,
120
- 0.042369022369384765,
121
- 0.04218572616577149,
122
  0.042369022369384765,
123
- 0.04184473419189453,
124
- 0.04236492919921875,
125
- 0.04185702514648437,
126
- 0.04235366439819336,
127
- 0.041853950500488284,
128
- 0.04245708847045898,
129
- 0.04187750244140625,
130
  0.042382335662841795,
131
- 0.0421662712097168,
132
- 0.04239257431030274,
133
- 0.04235161590576172,
134
- 0.04247552108764648,
135
- 0.04256563186645508,
136
- 0.04246220779418945,
137
- 0.04232601547241211,
138
- 0.04243046569824219,
139
- 0.04306022262573242,
 
 
 
 
 
140
  0.042395648956298826,
141
- 0.042397758483886716,
142
- 0.042433536529541016,
143
- 0.04243558502197266,
144
- 0.042396961212158205,
145
- 0.042479713439941405,
146
- 0.04241305541992187,
147
- 0.04252262496948242,
 
 
 
 
 
 
 
148
  0.042379264831542966,
149
- 0.042336254119873046,
150
- 0.042444801330566405,
151
- 0.04249497604370117,
152
- 0.0424161262512207,
153
- 0.04234649658203125,
154
- 0.04237823867797851,
155
- 0.04191129684448242,
156
- 0.04237516784667969,
157
- 0.04225024032592774,
158
- 0.0424192008972168,
159
- 0.04230656051635742,
160
- 0.04242329788208008,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
161
  0.04240588760375977,
162
- 0.04239180755615234,
163
- 0.04234672164916992,
 
 
 
 
 
 
 
 
 
 
 
164
  0.042385406494140625,
165
- 0.04242432022094727,
166
- 0.042499073028564455,
167
- 0.04243558502197266,
168
- 0.0424192008972168,
169
- 0.042444801330566405,
170
- 0.04238950347900391,
171
- 0.04229529571533203,
172
- 0.042387454986572266,
173
- 0.042387454986572266,
174
- 0.04235488128662109,
175
- 0.042378303527832034,
176
- 0.04238950347900391,
177
- 0.04216115188598633,
178
- 0.04242432022094727,
179
- 0.042482688903808595,
180
- 0.04240793609619141,
181
- 0.04228915023803711,
182
- 0.04238643264770508,
183
- 0.04234137725830078,
184
- 0.04237516784667969,
185
  0.04225228881835937,
186
- 0.04238643264770508,
187
- 0.04278988647460937,
188
  0.04238336181640625,
189
- 0.04233523178100586,
190
- 0.042380287170410154,
191
- 0.04213555145263672,
192
- 0.0424051513671875,
193
- 0.04213452911376953,
194
- 0.042353759765625,
195
- 0.041837825775146484,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
196
  0.042349567413330076,
197
- 0.0418785285949707,
198
- 0.04242329788208008,
199
- 0.04229017639160156,
200
- 0.04263628768920898,
201
- 0.042299678802490234,
202
- 0.04239974212646484,
203
- 0.042503360748291016,
204
- 0.04242943954467773,
205
- 0.042280960083007815,
206
- 0.04239974212646484,
207
  0.042363903045654294,
208
- 0.042439678192138675,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
209
  0.042352638244628905,
210
- 0.042404895782470704,
211
- 0.04229836654663086,
212
- 0.04256972885131836,
213
- 0.04243046569824219,
214
- 0.042403839111328126,
215
- 0.04239769744873047,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
216
  0.04239257431030274,
217
- 0.04236083221435547,
218
- 0.04242432022094727,
219
- 0.04230553436279297,
220
- 0.042396671295166014,
221
- 0.04221644973754883,
222
- 0.042379264831542966,
223
- 0.04259430313110352,
224
- 0.04235776138305664,
225
- 0.04236800003051758,
226
- 0.04237311935424805,
227
- 0.042365951538085936,
228
- 0.04242227172851563,
229
- 0.042560672760009764,
230
  0.042385406494140625,
231
- 0.04235776138305664,
232
- 0.04237619018554688,
233
- 0.04247347259521484,
234
- 0.04280934524536133,
235
- 0.042359809875488284,
236
- 0.04239769744873047,
237
- 0.04246323013305664,
238
- 0.042395648956298826,
239
- 0.042229759216308595,
240
- 0.04241305541992187,
241
- 0.042379264831542966,
242
- 0.042379264831542966,
243
- 0.04227686309814453,
244
- 0.04240486526489258,
245
- 0.04219190216064453,
246
- 0.04236288070678711,
247
- 0.0423004150390625,
248
- 0.042365951538085936,
249
- 0.042259456634521485,
250
- 0.04236697769165039,
251
- 0.042383392333984374
252
  ]
253
  },
254
  "throughput": {
255
  "unit": "tokens/s",
256
- "value": 6043.656933309665
257
  },
258
  "energy": null,
259
  "efficiency": null
@@ -261,23 +260,23 @@
261
  "decode": {
262
  "memory": {
263
  "unit": "MB",
264
- "max_ram": 1014.673408,
265
  "max_vram": 5255.462912,
266
  "max_reserved": 4771.0208,
267
- "max_allocated": 4715.611648
268
  },
269
  "latency": {
270
  "unit": "s",
271
- "mean": 8.496251308441167,
272
- "stdev": 0.006892139434813593,
273
  "values": [
274
- 8.489359169006352,
275
- 8.50314344787598
276
  ]
277
  },
278
  "throughput": {
279
  "unit": "tokens/s",
280
- "value": 30.01323651369084
281
  },
282
  "energy": null,
283
  "efficiency": null
@@ -286,524 +285,524 @@
286
  "memory": null,
287
  "latency": {
288
  "unit": "s",
289
- "mean": 0.033318632582122205,
290
- "stdev": 0.0001715019741849696,
291
  "values": [
292
- 0.03346720123291016,
293
- 0.03380940628051758,
294
- 0.033414142608642575,
295
- 0.03335782241821289,
296
- 0.03330867385864258,
297
- 0.033291263580322264,
298
- 0.03315609741210938,
299
- 0.0333199348449707,
300
- 0.03316940689086914,
301
- 0.0333383674621582,
302
- 0.0332861442565918,
303
- 0.03326566314697266,
304
- 0.03335168075561523,
305
- 0.03326873779296875,
306
- 0.033446910858154294,
307
- 0.033567745208740236,
308
- 0.033219585418701174,
309
- 0.033255424499511715,
310
- 0.033175552368164066,
311
- 0.03319193649291992,
312
- 0.03323392105102539,
313
- 0.03323801422119141,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
314
  0.033708030700683594,
315
- 0.0332861442565918,
316
- 0.03327897644042969,
317
- 0.033274879455566404,
318
- 0.03344384002685547,
319
- 0.033271808624267575,
320
- 0.033372161865234375,
321
- 0.033377281188964845,
322
- 0.03337420654296875,
323
- 0.033328128814697267,
324
- 0.03321753692626953,
325
- 0.03337011337280273,
326
- 0.033259521484375,
327
- 0.03322470474243164,
328
- 0.03324825668334961,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
329
  0.03370086288452148,
330
- 0.033255424499511715,
331
- 0.03335782241821289,
332
- 0.033307647705078124,
333
- 0.033285118103027346,
334
- 0.03321446228027344,
335
- 0.033290241241455076,
336
- 0.033334270477294925,
337
- 0.033416191101074216,
338
- 0.03401830291748047,
339
- 0.03400908660888672,
340
- 0.03389132690429687,
341
- 0.03330559921264648,
342
- 0.03326976013183594,
343
- 0.03334368133544922,
344
- 0.03332281494140625,
345
- 0.03337932968139649,
346
- 0.033296382904052735,
347
- 0.035366912841796876,
348
- 0.03342335891723633,
349
- 0.033235969543457033,
350
- 0.03321139144897461,
351
- 0.03332198333740234,
352
- 0.03336294555664063,
353
- 0.03337625503540039,
354
- 0.033347583770751955,
355
- 0.033261566162109374,
356
- 0.033377281188964845,
357
- 0.03352678298950195,
358
- 0.03329536056518555,
359
- 0.033296382904052735,
360
- 0.033291263580322264,
361
- 0.03328409576416016,
362
- 0.03331174468994141,
363
- 0.033258495330810545,
364
- 0.033219585418701174,
365
- 0.033219585418701174,
366
- 0.03324415969848633,
367
- 0.03327590560913086,
368
- 0.033263614654541016,
369
- 0.033285118103027346,
370
- 0.03314483261108398,
371
- 0.03323494338989258,
372
- 0.0332861442565918,
373
- 0.0332492790222168,
374
- 0.03318067169189453,
375
- 0.033701889038085936,
376
- 0.03316121673583984,
377
- 0.0332492790222168,
378
- 0.03317452621459961,
379
- 0.033314815521240236,
380
- 0.03318783950805664,
381
- 0.033288192749023435,
382
- 0.03322265625,
383
- 0.03326873779296875,
384
- 0.03327590560913086,
385
- 0.03323187255859375,
386
- 0.03310182571411133,
387
- 0.033255424499511715,
388
- 0.033142784118652346,
389
  0.033650688171386715,
390
- 0.03315097427368164,
391
- 0.033307647705078124,
392
- 0.03320012664794922,
393
- 0.03325235366821289,
394
- 0.03338240051269531,
395
- 0.033293312072753906,
396
- 0.03321753692626953,
397
- 0.03321465682983398,
398
- 0.03318764877319336,
399
- 0.03331686401367188,
400
- 0.03322367858886719,
401
- 0.03321855926513672,
402
- 0.0332042236328125,
403
- 0.03322675323486328,
404
- 0.03317657470703125,
405
- 0.0332677116394043,
406
- 0.033380352020263675,
407
- 0.033414142608642575,
408
- 0.03347455978393555,
409
- 0.03338137435913086,
410
- 0.03322265625,
411
- 0.033468414306640625,
412
- 0.0333568000793457,
413
- 0.03338444900512695,
414
- 0.03336703872680664,
415
- 0.03322470474243164,
416
- 0.033470462799072266,
417
- 0.03316121673583984,
418
- 0.033160190582275394,
419
- 0.033225727081298825,
420
- 0.03322675323486328,
421
- 0.03319014358520508,
422
- 0.033279743194580075,
423
- 0.03321855926513672,
424
- 0.03325337600708008,
425
- 0.03334656143188477,
426
- 0.03335782241821289,
427
- 0.03322470474243164,
428
- 0.03336908721923828,
429
- 0.03313356781005859,
430
- 0.033172481536865236,
431
- 0.03320012664794922,
432
- 0.0332410888671875,
433
- 0.03342335891723633,
434
- 0.03331891250610351,
435
- 0.033825790405273434,
436
- 0.03311820983886719,
437
- 0.03343360137939453,
438
- 0.033291263580322264,
439
- 0.03317279815673828,
440
- 0.03330835342407226,
441
- 0.03316428756713867,
442
- 0.03321241760253906,
443
- 0.03336601638793945,
444
- 0.033107967376708985,
445
- 0.03324313735961914,
446
- 0.033320960998535154,
447
- 0.033124351501464845,
448
- 0.03309056091308594,
449
- 0.033544193267822264,
450
- 0.033555454254150394,
451
- 0.03325747299194336,
452
- 0.03314585494995117,
453
- 0.033423583984375,
454
- 0.03320195388793945,
455
- 0.03326668930053711,
456
- 0.033263614654541016,
457
- 0.03348582458496094,
458
- 0.03338444900512695,
459
- 0.033186817169189455,
460
- 0.03367628860473633,
461
- 0.03368038558959961,
462
- 0.03340083312988281,
463
- 0.033301502227783206,
464
- 0.03327283096313476,
465
- 0.0331038703918457,
466
- 0.0331141128540039,
467
- 0.033296382904052735,
468
- 0.03316223907470703,
469
- 0.03312639999389649,
470
- 0.033113086700439456,
471
- 0.03316428756713867,
472
- 0.03325030517578125,
473
- 0.03342233657836914,
474
- 0.03314585494995117,
475
- 0.0331673583984375,
476
- 0.03301273727416992,
477
- 0.03329232025146484,
478
- 0.0331734733581543,
479
- 0.03319705581665039,
480
- 0.03306496047973633,
481
- 0.033276927947998046,
482
- 0.033083393096923826,
483
- 0.033170433044433595,
484
- 0.03320832061767578,
485
- 0.03324518585205078,
486
- 0.03321548843383789,
487
- 0.03318272018432617,
488
- 0.03312844848632813,
489
- 0.0331960334777832,
490
- 0.03331686401367188,
491
- 0.03302195358276367,
492
- 0.03327078247070313,
493
- 0.033020927429199216,
494
- 0.03313971328735352,
495
- 0.03311001586914063,
496
  0.03360665512084961,
497
- 0.033329151153564454,
498
- 0.033143806457519534,
499
- 0.03317782211303711,
500
- 0.033045280456542966,
501
- 0.03308544158935547,
502
- 0.0331141128540039,
503
- 0.03321241760253906,
504
- 0.03304959869384766,
505
- 0.033111038208007815,
506
- 0.03309465789794922,
507
- 0.03321241760253906,
508
- 0.03324415969848633,
509
- 0.03318486404418945,
510
- 0.03342633438110352,
511
- 0.033380352020263675,
512
- 0.03314688110351562,
513
- 0.033235969543457033,
514
- 0.03321343994140625,
515
- 0.033331199645996096,
516
- 0.03318272018432617,
517
- 0.03340595245361328,
518
- 0.03321855926513672,
519
- 0.033263614654541016,
520
- 0.03313049697875976,
521
- 0.03328409576416016,
522
- 0.03324006271362305,
523
- 0.03340697479248047,
524
- 0.033242111206054685,
525
- 0.03329536056518555,
526
- 0.03313663864135742,
527
- 0.03324518585205078,
528
- 0.03329536056518555,
529
- 0.033291263580322264,
530
- 0.03312844848632813,
531
- 0.03336191940307617,
532
- 0.03318067169189453,
533
- 0.03320832061767578,
534
- 0.033323009490966796,
535
- 0.03341107177734375,
536
- 0.03322880172729492,
537
- 0.03324518585205078,
538
- 0.033230846405029296,
539
- 0.03338137435913086,
540
- 0.0330618896484375,
541
- 0.03305574417114258,
542
- 0.033113086700439456,
543
- 0.033364990234375,
544
- 0.03319807815551758,
545
- 0.03337420654296875,
546
- 0.03324825668334961,
547
- 0.033560577392578124,
548
- 0.0333383674621582,
549
- 0.03336806488037109,
550
- 0.033272064208984375,
551
- 0.03331865692138672,
552
- 0.03336703872680664,
553
- 0.03326876831054688,
554
- 0.03331683349609375,
555
- 0.03364863967895508,
556
- 0.03325439834594727,
557
- 0.033377281188964845,
558
- 0.033259521484375,
559
- 0.03315609741210938,
560
- 0.03319091033935547,
561
- 0.03331174468994141,
562
- 0.033337345123291014,
563
- 0.0330885124206543,
564
- 0.03322880172729492,
565
- 0.03315814590454102,
566
- 0.033154048919677735,
567
- 0.03321036911010742,
568
- 0.033137664794921876,
569
- 0.03323801422119141,
570
- 0.03346636962890625,
571
- 0.033058815002441407,
572
- 0.03313971328735352,
573
- 0.03320627212524414,
574
- 0.0331776008605957,
575
- 0.03320115280151367,
576
- 0.03321651077270508,
577
- 0.033285118103027346,
578
- 0.03320217514038086,
579
- 0.03319398498535156,
580
- 0.03333324813842774,
581
- 0.03325030517578125,
582
- 0.03329945755004883,
583
- 0.03313868713378906,
584
- 0.033148929595947264,
585
- 0.033159168243408206,
586
- 0.03326464080810547,
587
- 0.033230846405029296,
588
- 0.03321446228027344,
589
- 0.033276927947998046,
590
- 0.033344512939453126,
591
- 0.03339775848388672,
592
- 0.0332564468383789,
593
- 0.033276927947998046,
594
- 0.033326175689697264,
595
- 0.03324918365478516,
596
- 0.0333834228515625,
597
- 0.03355340957641602,
598
- 0.03336806488037109,
599
- 0.03344793701171875,
600
- 0.03344384002685547,
601
- 0.033290241241455076,
602
- 0.033430526733398434,
603
- 0.0331253776550293,
604
- 0.03326367950439453,
605
- 0.033176513671875,
606
- 0.033307647705078124,
607
- 0.03341516876220703,
608
- 0.03333017730712891,
609
- 0.033277950286865234,
610
- 0.0333568000793457,
611
- 0.03335372924804687,
612
- 0.033455265045166015,
613
- 0.033401695251464844,
614
- 0.033288192749023435,
615
- 0.033329151153564454,
616
- 0.033827838897705076,
617
- 0.033544193267822264,
618
  0.033500160217285156,
619
- 0.033445888519287106,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
620
  0.03355648040771484,
621
- 0.03351859283447266,
622
- 0.033858558654785154,
623
- 0.03339468765258789,
624
- 0.03349094390869141,
625
- 0.03340185546875,
626
- 0.033432575225830076,
627
- 0.033538047790527346,
628
- 0.033470462799072266,
629
- 0.03341926574707031,
630
- 0.03385651016235352,
631
- 0.03338649749755859,
632
- 0.0335093765258789,
633
- 0.03346432113647461,
634
- 0.03339263916015625,
 
 
 
 
 
 
 
635
  0.03343564987182617,
636
- 0.03352166366577149,
637
- 0.033414142608642575,
638
- 0.03345100784301758,
639
- 0.033337345123291014,
640
- 0.033454078674316406,
641
- 0.03328716659545899,
642
- 0.033503231048583985,
643
- 0.03328307342529297,
644
- 0.03344076919555664,
645
- 0.033410049438476565,
646
- 0.03337932968139649,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
647
  0.0335810546875,
648
- 0.03328409576416016,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
649
  0.03346636962890625,
650
- 0.03332819366455078,
651
- 0.03340486526489258,
652
- 0.03334883117675781,
653
- 0.03342006301879883,
654
- 0.033514495849609374,
655
- 0.03355750274658203,
 
 
 
 
656
  0.03342745590209961,
657
- 0.03348787307739258,
658
- 0.03352576065063476,
659
- 0.03352268981933594,
660
- 0.033358016967773435,
661
- 0.033468223571777346,
662
- 0.03339775848388672,
663
- 0.033430526733398434,
664
- 0.03353190231323242,
665
- 0.033342464447021485,
666
- 0.03337113571166992,
667
- 0.033320960998535154,
668
  0.03354009628295898,
669
- 0.03343667221069336,
670
- 0.03338751983642578,
671
- 0.03338956832885742,
672
- 0.033463294982910154,
673
- 0.0332861442565918,
674
- 0.03337932968139649,
675
- 0.03340390396118164,
676
- 0.03373875045776367,
677
- 0.03335475158691406,
678
- 0.03340595245361328,
679
- 0.03340083312988281,
680
- 0.03331584167480469,
681
- 0.03341209411621094,
682
- 0.03326873779296875,
683
- 0.033306625366210936,
684
- 0.033342464447021485,
685
- 0.03333529663085937,
686
- 0.033393665313720705,
687
- 0.03337113571166992,
688
- 0.03336908721923828,
689
- 0.03347558212280274,
690
- 0.03350732803344727,
691
- 0.0336445426940918,
692
- 0.03340902328491211,
693
- 0.03340288162231445,
694
- 0.03340185546875,
695
- 0.03337420654296875,
696
- 0.03329740905761719,
697
- 0.03334348678588867,
698
- 0.033375232696533204,
699
- 0.033413120269775394,
700
- 0.03320832061767578,
701
- 0.03330252838134766,
702
- 0.03333855819702149,
703
- 0.033346366882324216,
704
- 0.03326566314697266,
705
- 0.03337113571166992,
706
- 0.03346944046020508,
707
- 0.033393665313720705,
708
- 0.033498111724853515,
709
- 0.0334284782409668,
710
- 0.03336191940307617,
711
- 0.033323009490966796,
712
- 0.03340697479248047,
713
- 0.03341110229492188,
714
- 0.0332789421081543,
715
- 0.03335372924804687,
716
- 0.03322060775756836,
717
- 0.03331071853637695,
718
- 0.033242271423339846,
719
- 0.03330134582519531,
720
- 0.033205249786376956,
721
- 0.03320115280151367,
722
- 0.03326566314697266,
723
- 0.03329536056518555,
724
- 0.033342464447021485,
725
- 0.03318476867675781,
726
- 0.0333496322631836,
727
- 0.03325337600708008,
728
- 0.033328128814697267,
729
- 0.03326566314697266,
730
- 0.033203201293945314,
731
- 0.033329151153564454,
732
- 0.033285118103027346,
733
- 0.03334041595458984,
734
- 0.033342464447021485,
735
- 0.03336191940307617,
736
- 0.033380352020263675,
737
- 0.03370086288452148,
738
- 0.03334764862060547,
739
- 0.033365951538085935,
740
- 0.03345305633544922,
741
- 0.033372161865234375,
742
- 0.03334860610961914,
743
- 0.0332861442565918,
744
- 0.03339468765258789,
745
- 0.03320115280151367,
746
- 0.033328128814697267,
747
- 0.03332710266113281,
748
- 0.03342335891723633,
749
- 0.033372161865234375,
750
- 0.033271808624267575,
751
  0.03356979370117188,
752
- 0.03353497695922852,
753
- 0.03361894226074219,
754
- 0.033181697845458984,
755
- 0.033328128814697267,
756
- 0.03331174468994141,
757
- 0.03318476867675781,
758
- 0.03319500732421875,
759
- 0.033261566162109374,
760
- 0.033519615173339845,
761
- 0.03323392105102539,
762
- 0.033285118103027346,
763
- 0.03306905746459961,
764
- 0.03324313735961914,
765
- 0.033328128814697267,
766
- 0.033113086700439456,
767
- 0.033312767028808594,
768
- 0.0332492790222168,
769
- 0.03352371215820313,
770
- 0.03318179321289062,
771
- 0.03322051239013672,
772
- 0.03315302276611328,
773
- 0.03323699188232422,
774
- 0.033152000427246094,
775
- 0.03322777557373047,
776
- 0.03332419204711914,
777
- 0.03319075012207031,
778
- 0.03314688110351562,
779
- 0.03334348678588867,
780
- 0.03321343994140625,
781
- 0.033181697845458984,
782
- 0.03316857528686523,
783
- 0.03333100891113281,
784
- 0.03328921508789062,
785
- 0.03334041595458984,
786
- 0.03347763061523437,
787
- 0.03329740905761719,
788
- 0.03316633605957031,
789
- 0.03334656143188477,
790
- 0.03329945755004883,
791
- 0.033334270477294925,
792
- 0.033111038208007815,
793
- 0.03321855926513672,
794
- 0.033140735626220705,
795
- 0.03334656143188477,
796
- 0.03337324905395508,
797
- 0.03357382583618164,
798
- 0.033154048919677735,
799
- 0.03328204727172852,
800
- 0.033148929595947264,
801
- 0.033307647705078124
 
 
 
 
 
 
 
 
 
 
 
 
802
  ]
803
  },
804
  "throughput": {
805
  "unit": "tokens/s",
806
- "value": 30.013236513690856
807
  },
808
  "energy": null,
809
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 1015.881728,
6
  "max_vram": 4905.238528,
7
  "max_reserved": 4420.796416,
8
  "max_allocated": 4252.667392
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.042467162730330105,
13
+ "stdev": 0.0006609647717465549,
14
  "values": [
15
+ 0.048517601013183594,
16
+ 0.04331315231323242,
17
+ 0.043079681396484375,
18
+ 0.04321279907226563,
19
+ 0.04323123168945313,
20
+ 0.043218944549560545,
21
+ 0.043480064392089846,
22
+ 0.04548710250854492,
23
+ 0.04911718368530273,
24
+ 0.0445296630859375,
25
+ 0.042159103393554685,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
26
  0.04237823867797851,
27
+ 0.04234444808959961,
28
+ 0.0423741455078125,
29
+ 0.04237619018554688,
30
+ 0.04238336181640625,
31
+ 0.04228633499145508,
32
+ 0.042385406494140625,
33
+ 0.04228409576416016,
34
+ 0.04238336181640625,
35
+ 0.04239462280273437,
36
+ 0.04246220779418945,
37
+ 0.042264575958251956,
38
+ 0.042359809875488284,
39
+ 0.04222873687744141,
40
+ 0.042570751190185545,
41
+ 0.04218265533447266,
42
+ 0.042363903045654294,
43
+ 0.04226764678955078,
44
+ 0.04237209701538086,
45
+ 0.04212940979003906,
46
+ 0.042363903045654294,
47
+ 0.04219612884521484,
48
+ 0.04238156890869141,
49
+ 0.04231782531738281,
50
+ 0.04241408157348633,
51
+ 0.042324031829833984,
52
+ 0.042387454986572266,
53
+ 0.04229529571533203,
54
+ 0.04235776138305664,
55
+ 0.04212838363647461,
56
+ 0.04236800003051758,
57
+ 0.04221440124511719,
58
+ 0.04236800003051758,
59
+ 0.04280115127563477,
60
  0.04237619018554688,
61
+ 0.04229430389404297,
62
+ 0.0424007682800293,
63
+ 0.04217139053344727,
64
+ 0.04236185455322266,
65
+ 0.04226867294311523,
66
+ 0.042393600463867184,
67
+ 0.042243072509765625,
68
  0.04239257431030274,
69
+ 0.04221952056884765,
 
 
 
 
 
 
70
  0.042352638244628905,
71
+ 0.042827934265136716,
72
+ 0.04238643264770508,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
73
  0.042369022369384765,
74
+ 0.0424161262512207,
75
+ 0.04222873687744141,
 
 
 
 
 
76
  0.042382335662841795,
77
+ 0.042278911590576174,
78
+ 0.04239052963256836,
79
+ 0.042237953186035154,
80
+ 0.04238147354125977,
81
+ 0.042308609008789064,
82
+ 0.04239052963256836,
83
+ 0.04216934585571289,
84
+ 0.042385406494140625,
85
+ 0.04228710556030273,
86
+ 0.0423741455078125,
87
+ 0.04220927810668945,
88
+ 0.04236185455322266,
89
+ 0.04229119873046875,
90
+ 0.04249103927612305,
91
  0.042395648956298826,
92
+ 0.04238131332397461,
93
+ 0.04235673522949219,
94
+ 0.04242124938964844,
95
+ 0.04230144119262695,
96
+ 0.04241116714477539,
97
+ 0.042425342559814457,
98
+ 0.04239052963256836,
99
+ 0.042248191833496096,
100
+ 0.04243865585327149,
101
+ 0.04233126449584961,
102
+ 0.04239769744873047,
103
+ 0.04232191848754883,
104
+ 0.042420223236083986,
105
+ 0.042331134796142575,
106
  0.042379264831542966,
107
+ 0.0426506233215332,
108
+ 0.04239462280273437,
109
+ 0.04236697769165039,
110
+ 0.042393600463867184,
111
+ 0.042396671295166014,
112
+ 0.04249292755126953,
113
+ 0.04233011245727539,
114
+ 0.042396671295166014,
115
+ 0.04233011245727539,
116
+ 0.042482688903808595,
117
+ 0.042241024017333983,
118
+ 0.04264243316650391,
119
+ 0.04236288070678711,
120
+ 0.042363903045654294,
121
+ 0.04232191848754883,
122
+ 0.04237311935424805,
123
+ 0.042431488037109374,
124
+ 0.04239052963256836,
125
+ 0.0423741455078125,
126
+ 0.042412033081054686,
127
+ 0.04233523178100586,
128
+ 0.04239462280273437,
129
+ 0.042395648956298826,
130
+ 0.04238950347900391,
131
+ 0.04253696060180664,
132
+ 0.04238131332397461,
133
+ 0.042426368713378904,
134
+ 0.04243865585327149,
135
+ 0.042415103912353515,
136
+ 0.042521598815917966,
137
+ 0.042327041625976565,
138
  0.04240588760375977,
139
+ 0.042412033081054686,
140
+ 0.04235059356689453,
141
+ 0.042264575958251956,
142
+ 0.042379264831542966,
143
+ 0.04227174377441406,
144
+ 0.042433761596679685,
145
+ 0.04225331115722656,
146
+ 0.04241222381591797,
147
+ 0.04238131332397461,
148
+ 0.04242943954467773,
149
+ 0.04240691375732422,
150
+ 0.042363903045654294,
151
+ 0.04223004913330078,
152
  0.042385406494140625,
153
+ 0.04230758285522461,
154
+ 0.04237004852294922,
155
+ 0.042744831085205076,
156
+ 0.04236697769165039,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
157
  0.04225228881835937,
158
+ 0.04240793609619141,
159
+ 0.04233830261230469,
160
  0.04238336181640625,
161
+ 0.042308609008789064,
162
+ 0.042395648956298826,
163
+ 0.04227993774414063,
164
+ 0.04239567947387695,
165
+ 0.04232499313354492,
166
+ 0.042812416076660156,
167
+ 0.0422083511352539,
168
+ 0.04241100692749023,
169
+ 0.042234878540039066,
170
+ 0.042392894744873046,
171
+ 0.04212940979003906,
172
+ 0.04237823867797851,
173
+ 0.04230451202392578,
174
+ 0.042379264831542966,
175
+ 0.04227174377441406,
176
+ 0.04237619018554688,
177
+ 0.04218982315063476,
178
+ 0.04238131332397461,
179
+ 0.04234854507446289,
180
+ 0.04237516784667969,
181
+ 0.04220927810668945,
182
+ 0.042409984588623044,
183
  0.042349567413330076,
184
+ 0.04237004852294922,
185
+ 0.04219903945922852,
186
+ 0.04237516784667969,
187
+ 0.04221440124511719,
 
 
 
 
 
 
188
  0.042363903045654294,
189
+ 0.04225228881835937,
190
+ 0.042369022369384765,
191
+ 0.04212428665161133,
192
+ 0.04236800003051758,
193
+ 0.0422737922668457,
194
+ 0.04237107086181641,
195
+ 0.04219903945922852,
196
+ 0.0424161262512207,
197
+ 0.04229529571533203,
198
+ 0.04235366439819336,
199
+ 0.042248191833496096,
200
+ 0.04236800003051758,
201
+ 0.04218572616577149,
202
+ 0.04277248001098633,
203
+ 0.042382335662841795,
204
+ 0.042355712890625,
205
+ 0.042428417205810545,
206
+ 0.04238643264770508,
207
  0.042352638244628905,
208
+ 0.04240281677246094,
209
+ 0.04240281677246094,
210
+ 0.042387454986572266,
211
+ 0.042262527465820314,
212
+ 0.04239974212646484,
213
+ 0.04257484817504883,
214
+ 0.042591552734375,
215
+ 0.04235673522949219,
216
+ 0.042393600463867184,
217
+ 0.04225024032592774,
218
+ 0.04242345428466797,
219
+ 0.04231782531738281,
220
+ 0.04240691375732422,
221
+ 0.04241222381591797,
222
+ 0.04261171340942383,
223
+ 0.042246337890625,
224
+ 0.04240793609619141,
225
+ 0.04248883056640625,
226
+ 0.042380287170410154,
227
+ 0.04228505706787109,
228
+ 0.04241100692749023,
229
+ 0.042417152404785156,
230
+ 0.04240691375732422,
231
  0.04239257431030274,
232
+ 0.042386497497558594,
233
+ 0.04246441650390625,
234
+ 0.04236185455322266,
235
+ 0.042369022369384765,
236
+ 0.042417152404785156,
237
+ 0.042482688903808595,
 
 
 
 
 
 
 
238
  0.042385406494140625,
239
+ 0.042297344207763675,
240
+ 0.04238848114013672,
241
+ 0.04245811080932617,
242
+ 0.04240281677246094,
243
+ 0.04224227142333985,
244
+ 0.04238336181640625,
245
+ 0.042420223236083986,
246
+ 0.042389823913574216,
247
+ 0.04247465515136719,
248
+ 0.042393600463867184,
249
+ 0.042292224884033204,
250
+ 0.0428042221069336
 
 
 
 
 
 
 
 
 
251
  ]
252
  },
253
  "throughput": {
254
  "unit": "tokens/s",
255
+ "value": 6028.187040081311
256
  },
257
  "energy": null,
258
  "efficiency": null
 
260
  "decode": {
261
  "memory": {
262
  "unit": "MB",
263
+ "max_ram": 1015.881728,
264
  "max_vram": 5255.462912,
265
  "max_reserved": 4771.0208,
266
+ "max_allocated": 4715.61216
267
  },
268
  "latency": {
269
  "unit": "s",
270
+ "mean": 8.599395771026611,
271
+ "stdev": 0.03203231048584154,
272
  "values": [
273
+ 8.56736346054077,
274
+ 8.631428081512453
275
  ]
276
  },
277
  "throughput": {
278
  "unit": "tokens/s",
279
+ "value": 29.653246203547816
280
  },
281
  "energy": null,
282
  "efficiency": null
 
285
  "memory": null,
286
  "latency": {
287
  "unit": "s",
288
+ "mean": 0.033723120670692594,
289
+ "stdev": 0.0007542579259829491,
290
  "values": [
291
+ 0.03367903900146484,
292
+ 0.034095104217529294,
293
+ 0.03362924957275391,
294
+ 0.033646526336669924,
295
+ 0.033672191619873046,
296
+ 0.03379916763305664,
297
+ 0.03361587142944336,
298
+ 0.03376639938354492,
299
+ 0.03357798385620117,
300
+ 0.03353190231323242,
301
+ 0.033588222503662106,
302
+ 0.033863937377929684,
303
+ 0.03352755355834961,
304
+ 0.033552383422851564,
305
+ 0.03365494537353515,
306
+ 0.033521503448486326,
307
+ 0.03344486236572266,
308
+ 0.03351980972290039,
309
+ 0.0335296630859375,
310
+ 0.03351244735717773,
311
+ 0.033667072296142575,
312
+ 0.03366400146484375,
313
+ 0.03353702545166016,
314
+ 0.03360665512084961,
315
+ 0.033732608795166014,
316
+ 0.033527809143066405,
317
+ 0.033498111724853515,
318
+ 0.033559776306152346,
319
+ 0.033648414611816405,
320
+ 0.03360153579711914,
321
+ 0.03352678298950195,
322
+ 0.03374694442749023,
323
+ 0.0335781135559082,
324
+ 0.03363315200805664,
325
+ 0.033604606628417966,
326
+ 0.03352371215820313,
327
+ 0.033670143127441404,
328
+ 0.03367424011230469,
329
+ 0.03356979370117188,
330
+ 0.03373056030273437,
331
  0.033708030700683594,
332
+ 0.03353395080566406,
333
+ 0.033614849090576174,
334
+ 0.03355852890014648,
335
+ 0.03376332855224609,
336
+ 0.03358617782592774,
337
+ 0.033514495849609374,
338
+ 0.033640735626220705,
339
+ 0.033441600799560545,
340
+ 0.03353900909423828,
341
+ 0.03348188781738281,
342
+ 0.03361465454101562,
343
+ 0.03352268981933594,
344
+ 0.033567745208740236,
345
+ 0.03363759994506836,
346
+ 0.033532703399658206,
347
+ 0.0335175666809082,
348
+ 0.0339835205078125,
349
+ 0.03363119888305664,
350
+ 0.0335728645324707,
351
+ 0.033532928466796875,
352
+ 0.03351347351074219,
353
+ 0.03356979370117188,
354
+ 0.03359231948852539,
355
+ 0.03363225555419922,
356
+ 0.03357807922363281,
357
+ 0.03343247985839844,
358
+ 0.03353497695922852,
359
+ 0.03351347351074219,
360
+ 0.0334202880859375,
361
+ 0.03354009628295898,
362
+ 0.033796127319335935,
363
+ 0.03371942520141601,
364
+ 0.03353379058837891,
365
+ 0.03362918472290039,
366
+ 0.03350140762329101,
367
+ 0.03364742279052734,
368
+ 0.03346121597290039,
369
+ 0.0335022087097168,
370
+ 0.0335175666809082,
371
+ 0.033584129333496096,
372
+ 0.033710079193115236,
373
+ 0.03355574417114258,
374
+ 0.03373641586303711,
375
+ 0.03346944046020508,
376
+ 0.033544193267822264,
377
+ 0.03350352096557617,
378
+ 0.03355516815185547,
379
+ 0.033481727600097655,
380
+ 0.03347359848022461,
381
+ 0.0335082893371582,
382
+ 0.033446910858154294,
383
+ 0.03348992156982422,
384
+ 0.03352883148193359,
385
+ 0.033433727264404293,
386
+ 0.03351744079589844,
387
+ 0.0336445426940918,
388
+ 0.03349708938598633,
389
+ 0.03350527954101563,
390
+ 0.033516544342041016,
391
+ 0.033527935028076175,
392
+ 0.03341606521606445,
393
+ 0.03358003234863281,
394
+ 0.03350527954101563,
395
+ 0.03360563278198242,
396
+ 0.0335093765258789,
397
+ 0.03366604614257813,
398
+ 0.03351574325561523,
399
+ 0.03360847854614258,
400
+ 0.03349913787841797,
401
+ 0.033751041412353515,
402
+ 0.03354214477539062,
403
  0.03370086288452148,
404
+ 0.03360153579711914,
405
+ 0.033567745208740236,
406
+ 0.03361280059814453,
407
+ 0.03362508773803711,
408
+ 0.03391795349121094,
409
+ 0.03364863967895508,
410
+ 0.033498111724853515,
411
+ 0.033689697265625,
412
+ 0.03361782455444336,
413
+ 0.03367424011230469,
414
+ 0.03368243026733399,
415
+ 0.033576961517333984,
416
+ 0.033584129333496096,
417
+ 0.0337520637512207,
418
+ 0.03362303924560547,
419
+ 0.03363532638549805,
420
+ 0.03349094390869141,
421
+ 0.03344412612915039,
422
+ 0.03370774459838867,
423
+ 0.03375833511352539,
424
+ 0.03355532836914062,
425
+ 0.03360358428955078,
426
+ 0.0337336311340332,
427
+ 0.03346124649047852,
428
+ 0.033522720336914065,
429
+ 0.033508319854736325,
430
+ 0.03347353744506836,
431
+ 0.033693695068359376,
432
+ 0.033535999298095705,
433
+ 0.03356467056274414,
434
+ 0.03382271957397461,
435
+ 0.03361382293701172,
436
+ 0.033459201812744144,
437
+ 0.03358310317993164,
438
+ 0.03362303924560547,
439
+ 0.0335032958984375,
440
+ 0.03348678588867188,
441
+ 0.03362937545776367,
442
+ 0.033528640747070314,
443
+ 0.03379916763305664,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
444
  0.033650688171386715,
445
+ 0.033576961517333984,
446
+ 0.03346739196777344,
447
+ 0.033620990753173825,
448
+ 0.033701889038085936,
449
+ 0.033667072296142575,
450
+ 0.033514495849609374,
451
+ 0.03357593536376953,
452
+ 0.033729534149169925,
453
+ 0.033511425018310545,
454
+ 0.03358617782592774,
455
+ 0.03355033493041992,
456
+ 0.033583263397216796,
457
+ 0.033570655822753905,
458
+ 0.03360358428955078,
459
+ 0.03356364822387695,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
460
  0.03360665512084961,
461
+ 0.03374899291992187,
462
+ 0.033718273162841796,
463
+ 0.03359743881225586,
464
+ 0.033584129333496096,
465
+ 0.03356364822387695,
466
+ 0.0336629753112793,
467
+ 0.033620990753173825,
468
+ 0.033919998168945316,
469
+ 0.03372768020629883,
470
+ 0.033554271697998045,
471
+ 0.03358832168579102,
472
+ 0.03361881637573242,
473
+ 0.03367833709716797,
474
+ 0.03359027099609375,
475
+ 0.03363532638549805,
476
+ 0.03375001525878906,
477
+ 0.03360873413085937,
478
+ 0.033424510955810546,
479
+ 0.03377056121826172,
480
+ 0.03363510513305664,
481
+ 0.033546241760253906,
482
+ 0.03377356719970703,
483
+ 0.033805313110351565,
484
+ 0.03364147186279297,
485
+ 0.033600608825683595,
486
+ 0.03353180694580078,
487
+ 0.0335912971496582,
488
+ 0.03360768127441406,
489
+ 0.03358415985107422,
490
+ 0.03361276626586914,
491
+ 0.03357900619506836,
492
+ 0.03366912078857422,
493
+ 0.03369267272949219,
494
+ 0.033539070129394534,
495
+ 0.033519615173339845,
496
+ 0.033642494201660156,
497
+ 0.03354019165039063,
498
+ 0.033525665283203124,
499
+ 0.03361711883544922,
500
+ 0.03361974334716797,
501
+ 0.03349724960327148,
502
+ 0.033764190673828125,
503
+ 0.0334837760925293,
504
+ 0.033565696716308595,
505
+ 0.03359027099609375,
506
+ 0.033501182556152344,
507
+ 0.033549312591552735,
508
+ 0.03354111862182617,
509
+ 0.03348787307739258,
510
+ 0.033649665832519535,
511
+ 0.03352371215820313,
512
+ 0.03361075210571289,
513
+ 0.03359539031982422,
514
+ 0.033685504913330076,
515
+ 0.03357491302490234,
516
+ 0.03379097747802735,
517
+ 0.03350630569458008,
518
+ 0.033620990753173825,
519
+ 0.03346944046020508,
520
+ 0.033530048370361325,
521
+ 0.03350713729858398,
522
+ 0.0335022087097168,
523
+ 0.03343974304199219,
524
+ 0.0335912971496582,
525
+ 0.03343462371826172,
526
+ 0.03355955123901367,
527
+ 0.03342131042480469,
528
+ 0.0340316162109375,
529
+ 0.033539070129394534,
530
+ 0.03346944046020508,
531
+ 0.03349606323242187,
532
+ 0.03350425720214844,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
533
  0.033500160217285156,
534
+ 0.03361280059814453,
535
+ 0.033909759521484374,
536
+ 0.033649665832519535,
537
+ 0.03361996841430664,
538
+ 0.03359231948852539,
539
+ 0.033546241760253906,
540
+ 0.0335206413269043,
541
+ 0.0335994873046875,
542
+ 0.033827838897705076,
543
+ 0.03380326461791992,
544
+ 0.03357900619506836,
545
+ 0.033546432495117184,
546
+ 0.033893375396728515,
547
+ 0.033667072296142575,
548
+ 0.033667072296142575,
549
+ 0.03363942337036133,
550
+ 0.033555454254150394,
551
+ 0.033598464965820314,
552
+ 0.033509407043457035,
553
+ 0.03363529586791992,
554
+ 0.033582080841064454,
555
+ 0.03367424011230469,
556
+ 0.03362303924560547,
557
+ 0.03373875045776367,
558
+ 0.033576961517333984,
559
+ 0.033649761199951174,
560
+ 0.03349187088012695,
561
+ 0.03364863967895508,
562
+ 0.033584320068359375,
563
+ 0.033551166534423825,
564
+ 0.03348787307739258,
565
+ 0.033719551086425784,
566
+ 0.03360128021240234,
567
+ 0.03377151870727539,
568
+ 0.03352492904663086,
569
+ 0.03367200088500977,
570
+ 0.03359231948852539,
571
+ 0.03360255813598633,
572
  0.03355648040771484,
573
+ 0.03363532638549805,
574
+ 0.033584129333496096,
575
+ 0.033532928466796875,
576
+ 0.03352268981933594,
577
+ 0.033827838897705076,
578
+ 0.03350630569458008,
579
+ 0.0335728645324707,
580
+ 0.033484798431396484,
581
+ 0.03364556884765625,
582
+ 0.033462272644042966,
583
+ 0.03363225555419922,
584
+ 0.033565696716308595,
585
+ 0.033704959869384765,
586
+ 0.03361894226074219,
587
+ 0.034223102569580076,
588
+ 0.03355340957641602,
589
+ 0.03362835311889648,
590
+ 0.03361260986328125,
591
+ 0.033585151672363284,
592
+ 0.03353811264038086,
593
+ 0.033615806579589846,
594
  0.03343564987182617,
595
+ 0.03364044952392578,
596
+ 0.0336363525390625,
597
+ 0.033729534149169925,
598
+ 0.03359539031982422,
599
+ 0.033632320404052736,
600
+ 0.03352467346191406,
601
+ 0.03403673553466797,
602
+ 0.03348889541625977,
603
+ 0.03359334564208984,
604
+ 0.033519615173339845,
605
+ 0.03355257415771484,
606
+ 0.033492801666259765,
607
+ 0.03364371109008789,
608
+ 0.033594303131103516,
609
+ 0.03369868850708008,
610
+ 0.03351859283447266,
611
+ 0.03353190231323242,
612
+ 0.0335206413269043,
613
+ 0.033588222503662106,
614
+ 0.03347763061523437,
615
+ 0.03348992156982422,
616
+ 0.03362815856933594,
617
+ 0.03365692901611328,
618
+ 0.03376630401611328,
619
+ 0.03358003234863281,
620
+ 0.03367628860473633,
621
+ 0.033670143127441404,
622
+ 0.033584129333496096,
623
+ 0.03367628860473633,
624
+ 0.033584129333496096,
625
+ 0.03358003234863281,
626
+ 0.03368960189819336,
627
+ 0.03364863967895508,
628
+ 0.0335206413269043,
629
+ 0.033588222503662106,
630
+ 0.033568767547607424,
631
+ 0.03355459213256836,
632
+ 0.033698654174804686,
633
+ 0.03367424011230469,
634
+ 0.03360563278198242,
635
+ 0.033555454254150394,
636
+ 0.03350735855102539,
637
+ 0.033648609161376956,
638
+ 0.03350732803344727,
639
+ 0.03362918472290039,
640
+ 0.033598464965820314,
641
+ 0.03358310317993164,
642
+ 0.033928192138671875,
643
+ 0.03349923324584961,
644
+ 0.03360348892211914,
645
+ 0.0335728645324707,
646
+ 0.03362201690673828,
647
+ 0.03391795349121094,
648
+ 0.033555454254150394,
649
+ 0.03356159973144531,
650
+ 0.0336814079284668,
651
+ 0.033651744842529294,
652
+ 0.03361497497558594,
653
+ 0.0335450553894043,
654
+ 0.03351580810546875,
655
+ 0.03373846435546875,
656
  0.0335810546875,
657
+ 0.033465343475341795,
658
+ 0.03353702545166016,
659
+ 0.0335013427734375,
660
+ 0.03357782363891602,
661
+ 0.03403571319580078,
662
+ 0.033627166748046874,
663
+ 0.03364767837524414,
664
+ 0.03356047821044922,
665
+ 0.033729534149169925,
666
+ 0.03368054580688477,
667
+ 0.033608543395996095,
668
+ 0.033582080841064454,
669
+ 0.03363532638549805,
670
+ 0.03355955123901367,
671
+ 0.03358310317993164,
672
+ 0.03362508773803711,
673
+ 0.03377766418457031,
674
+ 0.03361820983886719,
675
+ 0.033477344512939454,
676
+ 0.033567745208740236,
677
+ 0.03341033554077148,
678
+ 0.03353673553466797,
679
+ 0.03342131042480469,
680
+ 0.0334837760925293,
681
  0.03346636962890625,
682
+ 0.03382601547241211,
683
+ 0.033547039031982424,
684
+ 0.033486881256103516,
685
+ 0.03350012969970703,
686
+ 0.03364147186279297,
687
+ 0.03338751983642578,
688
+ 0.033544193267822264,
689
+ 0.03377356719970703,
690
+ 0.03358617782592774,
691
+ 0.03361996841430664,
692
  0.03342745590209961,
693
+ 0.03360358428955078,
694
+ 0.03361587142944336,
695
+ 0.0336732177734375,
696
+ 0.03346432113647461,
697
+ 0.033535999298095705,
698
+ 0.033462272644042966,
699
+ 0.03345817565917969,
700
+ 0.033616897583007815,
701
+ 0.033699840545654294,
702
+ 0.03346124649047852,
 
703
  0.03354009628295898,
704
+ 0.033508350372314456,
705
+ 0.03351248168945312,
706
+ 0.033476638793945315,
707
+ 0.03420975875854492,
708
+ 0.03355542373657226,
709
+ 0.0336097297668457,
710
+ 0.03361177444458008,
711
+ 0.03355033493041992,
712
+ 0.033569950103759766,
713
+ 0.03987760162353516,
714
+ 0.039078048706054684,
715
+ 0.03925167846679688,
716
+ 0.0383559684753418,
717
+ 0.038001953125,
718
+ 0.03823791885375977,
719
+ 0.03890585708618164,
720
+ 0.03825151824951172,
721
+ 0.03803955078125,
722
+ 0.03559936141967773,
723
+ 0.03567308807373047,
724
+ 0.03725107192993164,
725
+ 0.03808870315551758,
726
+ 0.036789249420166016,
727
+ 0.03564748764038086,
728
+ 0.03366937637329102,
729
+ 0.03364134216308594,
730
+ 0.03357171249389648,
731
+ 0.033396736145019534,
732
+ 0.03352883148193359,
733
+ 0.033667072296142575,
734
+ 0.03363020706176758,
735
+ 0.033617919921875,
736
+ 0.033544193267822264,
737
+ 0.033683456420898435,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
738
  0.03356979370117188,
739
+ 0.03340508651733398,
740
+ 0.03358294296264648,
741
+ 0.033942527770996093,
742
+ 0.03343769454956055,
743
+ 0.03358924865722656,
744
+ 0.03358323287963867,
745
+ 0.03440729522705078,
746
+ 0.03371212768554688,
747
+ 0.03364761734008789,
748
+ 0.03349932861328125,
749
+ 0.033621822357177734,
750
+ 0.033546241760253906,
751
+ 0.03354217529296875,
752
+ 0.03358307266235352,
753
+ 0.03364863967895508,
754
+ 0.03382089614868164,
755
+ 0.0336146240234375,
756
+ 0.03368960189819336,
757
+ 0.03351039886474609,
758
+ 0.03358937454223633,
759
+ 0.03356659317016602,
760
+ 0.03346124649047852,
761
+ 0.03352166366577149,
762
+ 0.03363532638549805,
763
+ 0.03348787307739258,
764
+ 0.033537311553955076,
765
+ 0.03388079833984375,
766
+ 0.033529857635498046,
767
+ 0.033588222503662106,
768
+ 0.03347251129150391,
769
+ 0.03355875015258789,
770
+ 0.03351836776733398,
771
+ 0.03363020706176758,
772
+ 0.033732769012451175,
773
+ 0.03356143951416016,
774
+ 0.03349094390869141,
775
+ 0.03346022415161133,
776
+ 0.03352390289306641,
777
+ 0.033569599151611326,
778
+ 0.033637374877929685,
779
+ 0.034272254943847655,
780
+ 0.0335810546875,
781
+ 0.03355648040771484,
782
+ 0.033538047790527346,
783
+ 0.03346636962890625,
784
+ 0.03358924865722656,
785
+ 0.03346636962890625,
786
+ 0.033432575225830076,
787
+ 0.033492992401123044,
788
+ 0.033538238525390625,
789
+ 0.03342623901367187,
790
+ 0.03347251129150391,
791
+ 0.033470462799072266,
792
+ 0.03345510482788086,
793
+ 0.033585151672363284,
794
+ 0.03352166366577149,
795
+ 0.03354745483398437,
796
+ 0.03356550216674805,
797
+ 0.033538047790527346,
798
+ 0.033567745208740236,
799
+ 0.03365683364868164,
800
+ 0.03360665512084961
801
  ]
802
  },
803
  "throughput": {
804
  "unit": "tokens/s",
805
+ "value": 29.653246203547816
806
  },
807
  "energy": null,
808
  "efficiency": null