kreas commited on
Commit
9b3b4b3
·
verified ·
1 Parent(s): 8fc2a2d

Upload /Llama-2-7b-hf/fp4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Llama-2-7b-hf/fp4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,258 +2,258 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 982.437888,
6
  "max_vram": 4905.238528,
7
  "max_reserved": 4420.796416,
8
  "max_allocated": 4252.667392
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.042258727737619926,
13
- "stdev": 0.000582065656107356,
14
  "values": [
15
- 0.047258270263671874,
16
- 0.04455014419555664,
17
- 0.04322304153442383,
18
- 0.043133953094482425,
19
- 0.04293443298339844,
20
- 0.04335615921020508,
21
- 0.04328345489501953,
22
- 0.04333465576171875,
23
- 0.04698521423339844,
24
- 0.04396953582763672,
25
- 0.04190105438232422,
26
- 0.04237209701538086,
27
- 0.0419502067565918,
28
- 0.042387454986572266,
29
- 0.041899009704589846,
30
- 0.042355712890625,
31
- 0.041852928161621096,
32
  0.042379264831542966,
33
- 0.04192870330810547,
34
- 0.04236492919921875,
35
- 0.04185190582275391,
 
 
36
  0.04237209701538086,
37
- 0.04184371185302734,
38
- 0.04237823867797851,
39
- 0.04193689727783203,
40
- 0.04254924774169922,
41
- 0.04188979339599609,
42
- 0.04238643264770508,
43
- 0.04189491271972656,
44
  0.042365951538085936,
45
- 0.04185513687133789,
 
 
 
 
 
 
46
  0.04237516784667969,
47
- 0.04209664154052734,
 
 
48
  0.04235161590576172,
49
- 0.04186111831665039,
50
- 0.04240486526489258,
51
- 0.04228607940673828,
52
- 0.04238336181640625,
53
- 0.0418785285949707,
54
- 0.0424007682800293,
55
- 0.04184678268432617,
56
- 0.042349567413330076,
57
- 0.041859073638916014,
58
- 0.04237020874023437,
59
- 0.04184473419189453,
60
  0.042382335662841795,
61
- 0.04188159942626953,
62
- 0.04237120056152344,
63
- 0.041855998992919925,
64
- 0.04238336181640625,
65
- 0.041867263793945314,
66
- 0.042355712890625,
67
- 0.04187648010253906,
68
- 0.042349567413330076,
69
- 0.041847808837890625,
70
- 0.042398719787597655,
71
- 0.04206796646118164,
72
- 0.04261478424072265,
73
- 0.04187955093383789,
74
- 0.04237721633911133,
75
- 0.041864192962646485,
76
- 0.042363903045654294,
77
- 0.04187750244140625,
78
- 0.042398719787597655,
79
- 0.04185804748535156,
80
- 0.04237635040283203,
81
- 0.04187238311767578,
82
- 0.04236207962036133,
83
- 0.041864192962646485,
84
- 0.042355712890625,
85
- 0.04189184188842773,
86
- 0.042387454986572266,
87
- 0.04232294464111328,
88
- 0.04237311935424805,
89
- 0.041866241455078126,
90
- 0.042369022369384765,
91
- 0.04188671875,
92
- 0.042343425750732425,
93
- 0.04193689727783203,
94
- 0.0423454704284668,
95
- 0.04187955093383789,
96
- 0.042349567413330076,
97
- 0.04190003204345703,
98
- 0.042355712890625,
99
- 0.04231270217895508,
100
- 0.04235673522949219,
101
- 0.04196681594848633,
102
- 0.04238438415527344,
103
- 0.041866241455078126,
104
- 0.042369022369384765,
105
- 0.04189388656616211,
106
- 0.0423785285949707,
107
- 0.04193689727783203,
108
- 0.042359809875488284,
109
- 0.0419317741394043,
110
- 0.042379264831542966,
111
- 0.04190719985961914,
112
- 0.04236185455322266,
113
- 0.04187340927124023,
114
- 0.04235161590576172,
115
- 0.04186111831665039,
116
- 0.04235366439819336,
117
- 0.04187443161010742,
118
- 0.042347518920898435,
119
- 0.04185190582275391,
120
- 0.04238556671142578,
121
- 0.04185702514648437,
122
- 0.04236492919921875,
123
- 0.04186316680908203,
124
- 0.042363903045654294,
125
- 0.041856224060058594,
126
- 0.04234649658203125,
127
- 0.0418950080871582,
128
- 0.04234239959716797,
129
- 0.041918464660644535,
130
- 0.042369022369384765,
131
- 0.04185804748535156,
132
  0.04236083221435547,
133
- 0.04193280029296875,
134
- 0.04235776138305664,
135
- 0.04231475067138672,
136
- 0.0423741455078125,
137
- 0.0419420166015625,
138
  0.04237619018554688,
139
- 0.04199321746826172,
140
- 0.04238131332397461,
141
  0.04203212738037109,
 
 
142
  0.042393600463867184,
143
- 0.04202598571777344,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
144
  0.04235776138305664,
145
- 0.04187750244140625,
 
 
 
 
 
 
 
 
 
 
146
  0.04236083221435547,
147
- 0.04218265533447266,
148
  0.042385406494140625,
149
- 0.041952255249023435,
150
- 0.04235776138305664,
151
- 0.041902080535888675,
152
- 0.04237516784667969,
153
- 0.0418600959777832,
154
- 0.04236697769165039,
155
- 0.042014720916748044,
156
- 0.04235161590576172,
157
- 0.04187033462524414,
158
- 0.04235673522949219,
159
- 0.04192256164550781,
160
  0.04237721633911133,
161
- 0.04187648010253906,
162
- 0.042343425750732425,
163
- 0.0419051513671875,
164
- 0.0423741455078125,
165
- 0.04198604965209961,
166
- 0.04236288070678711,
167
- 0.04187648010253906,
168
- 0.04237516784667969,
169
- 0.04206694412231445,
 
 
 
 
170
  0.04235161590576172,
171
- 0.04191436767578125,
172
- 0.044368896484375,
173
- 0.04288819122314453,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
174
  0.0423741455078125,
175
- 0.041855998992919925,
176
- 0.04235468673706055,
177
- 0.041896961212158204,
178
- 0.04238336181640625,
179
- 0.04206284713745117,
180
- 0.042355712890625,
181
- 0.04192051315307617,
182
- 0.04234035110473633,
183
- 0.04248473739624024,
184
- 0.04237619018554688,
185
- 0.04198809432983398,
186
- 0.042365951538085936,
187
- 0.042014942169189454,
188
- 0.04236083221435547,
189
- 0.04184473419189453,
190
- 0.04235366439819336,
191
- 0.04186316680908203,
192
- 0.042401790618896484,
193
- 0.042354782104492186,
 
 
194
  0.04240691375732422,
195
- 0.04187136077880859,
196
- 0.042374305725097657,
197
- 0.04206911849975586,
198
- 0.042365119934082034,
199
- 0.04197580718994141,
200
  0.042363903045654294,
201
- 0.04193382263183594,
202
- 0.042387454986572266,
203
- 0.04192563247680664,
204
- 0.04235878372192383,
205
- 0.04187750244140625,
206
- 0.04238336181640625,
207
- 0.04209356689453125,
208
- 0.04237619018554688,
209
- 0.041957374572753905,
210
- 0.04233932876586914,
211
- 0.04196454238891602,
212
  0.04238848114013672,
213
- 0.04195635223388672,
214
- 0.04237311935424805,
215
- 0.04188979339599609,
216
- 0.04236185455322266,
217
- 0.041968639373779294,
218
- 0.04237619018554688,
219
- 0.041902080535888675,
220
- 0.04238051223754883,
221
- 0.042036479949951175,
222
- 0.042349567413330076,
223
- 0.041918464660644535,
224
- 0.04236185455322266,
225
- 0.041968639373779294,
226
- 0.04236083221435547,
227
- 0.041908222198486327,
228
- 0.04236185455322266,
229
- 0.041855998992919925,
230
  0.042379264831542966,
231
- 0.042425342559814457,
232
  0.04237516784667969,
233
- 0.04187750244140625,
234
- 0.042369281768798825,
235
- 0.04196044921875,
236
- 0.04237619018554688,
237
- 0.04188703918457031,
238
- 0.04237619018554688,
239
- 0.04194105529785156,
240
  0.042382335662841795,
241
- 0.042172416687011716,
242
- 0.04245196914672852,
243
- 0.04191027069091797,
244
- 0.0423454704284668,
245
- 0.042281982421875,
246
- 0.04236697769165039,
247
- 0.04186316680908203,
248
- 0.042355712890625,
249
- 0.04190310287475586,
250
  0.04237619018554688,
251
- 0.04189593505859375
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
252
  ]
253
  },
254
  "throughput": {
255
  "unit": "tokens/s",
256
- "value": 6057.920190817801
257
  },
258
  "energy": null,
259
  "efficiency": null
@@ -261,23 +261,23 @@
261
  "decode": {
262
  "memory": {
263
  "unit": "MB",
264
- "max_ram": 982.437888,
265
  "max_vram": 5255.462912,
266
  "max_reserved": 4771.0208,
267
- "max_allocated": 4715.611648
268
  },
269
  "latency": {
270
  "unit": "s",
271
- "mean": 8.489722272872921,
272
- "stdev": 0.012863920211795055,
273
  "values": [
274
- 8.476858352661127,
275
- 8.502586193084717
276
  ]
277
  },
278
  "throughput": {
279
  "unit": "tokens/s",
280
- "value": 30.03631824503819
281
  },
282
  "energy": null,
283
  "efficiency": null
@@ -286,524 +286,524 @@
286
  "memory": null,
287
  "latency": {
288
  "unit": "s",
289
- "mean": 0.03329302852107029,
290
- "stdev": 0.0001376279300769796,
291
  "values": [
292
- 0.03315507125854492,
293
- 0.03353497695922852,
294
- 0.03332505416870117,
295
- 0.03326591873168945,
296
- 0.033143550872802734,
297
- 0.033260639190673826,
298
- 0.03330140686035156,
299
- 0.03323904037475586,
300
- 0.03323494338989258,
301
- 0.033186817169189455,
302
- 0.033143806457519534,
303
- 0.03326668930053711,
304
- 0.03321139144897461,
305
- 0.03326976013183594,
306
- 0.03401318359375,
307
- 0.0333007698059082,
308
- 0.03305648040771485,
309
- 0.033040382385253905,
310
- 0.033113086700439456,
311
- 0.03319091033935547,
312
- 0.03304243087768555,
313
- 0.03308236694335937,
314
- 0.03324518585205078,
315
- 0.03311820983886719,
316
- 0.033124351501464845,
317
- 0.03313868713378906,
318
- 0.03303833770751953,
319
- 0.03317452621459961,
320
- 0.03328921508789062,
321
- 0.03322265625,
322
- 0.033165313720703124,
323
- 0.03322367858886719,
324
- 0.03372851181030274,
325
- 0.033185791015625,
326
- 0.03314995193481445,
327
- 0.03333529663085937,
328
- 0.033186817169189455,
329
- 0.03325030517578125,
330
- 0.03328921508789062,
331
- 0.033260543823242186,
332
- 0.0332410888671875,
333
- 0.03316534423828125,
334
- 0.03322364807128906,
335
- 0.03316633605957031,
336
- 0.033172481536865236,
337
- 0.03330998229980469,
338
- 0.03313123321533203,
339
- 0.03381862258911133,
340
- 0.03307110214233398,
341
- 0.0331960334777832,
342
- 0.03316659164428711,
343
- 0.033193824768066406,
344
- 0.03315292739868164,
345
- 0.03325747299194336,
346
- 0.03307622528076172,
347
- 0.033031169891357424,
348
- 0.03310899353027344,
349
- 0.03341843032836914,
350
- 0.03297977447509766,
351
- 0.03315302276611328,
352
- 0.033127422332763674,
353
- 0.03314483261108398,
354
- 0.03308342361450195,
355
- 0.033077217102050784,
356
- 0.033291263580322264,
357
- 0.03320115280151367,
358
- 0.033083393096923826,
359
- 0.033178752899169925,
360
- 0.03321433639526367,
361
- 0.033209342956542966,
362
- 0.03310182571411133,
363
- 0.03337625503540039,
364
- 0.03318476867675781,
365
- 0.033438751220703125,
366
- 0.03312432098388672,
367
- 0.03304243087768555,
368
- 0.03305267333984375,
369
- 0.033143806457519534,
370
- 0.033058815002441407,
371
- 0.03324825668334961,
372
- 0.03322777557373047,
373
- 0.033233951568603516,
374
- 0.03321136093139648,
375
- 0.03331071853637695,
376
- 0.033350654602050785,
377
- 0.033279998779296875,
378
- 0.03313151931762695,
379
- 0.03329740905761719,
380
- 0.03326464080810547,
381
- 0.03327385711669922,
382
- 0.03329536056518555,
383
- 0.03327391815185547,
384
- 0.03313555145263672,
385
- 0.03367424011230469,
386
- 0.0333199348449707,
387
- 0.03324518585205078,
388
- 0.033175552368164066,
389
- 0.03320124816894531,
390
- 0.03319696044921875,
391
- 0.03317657470703125,
392
- 0.03317145538330078,
393
- 0.03331071853637695,
394
- 0.033339393615722655,
395
- 0.03322060775756836,
396
- 0.03315507125854492,
397
- 0.03337539291381836,
398
- 0.0333812141418457,
399
- 0.03341209411621094,
400
- 0.033486846923828126,
401
- 0.03326464080810547,
402
- 0.03314995193481445,
403
- 0.03321343994140625,
404
- 0.03326668930053711,
405
- 0.033337345123291014,
406
- 0.0335093765258789,
407
- 0.03333657455444336,
408
- 0.03333504104614258,
409
- 0.03328409576416016,
410
- 0.03325132751464844,
411
- 0.0332861442565918,
412
- 0.03321446228027344,
413
- 0.033334270477294925,
414
- 0.03328409576416016,
415
- 0.033364158630371094,
416
- 0.03328799819946289,
417
- 0.033396736145019534,
418
- 0.03326566314697266,
419
- 0.03334041595458984,
420
- 0.033331199645996096,
421
- 0.03330355072021484,
422
- 0.033160190582275394,
423
- 0.03320537567138672,
424
- 0.03315596771240235,
425
- 0.03327283096313476,
426
- 0.03318067169189453,
427
- 0.033323009490966796,
428
- 0.03323187255859375,
429
- 0.03327385711669922,
430
- 0.03320729446411133,
431
- 0.03323289489746094,
432
- 0.033293312072753906,
433
- 0.03315302276611328,
434
- 0.03324620819091797,
435
- 0.033219585418701174,
436
- 0.033192958831787106,
437
- 0.03319091033935547,
438
- 0.0331776008605957,
439
- 0.033271808624267575,
440
- 0.033135616302490234,
441
- 0.033175552368164066,
442
- 0.033175552368164066,
443
- 0.033323009490966796,
444
- 0.033119232177734374,
445
- 0.03321753692626953,
446
- 0.03366400146484375,
447
- 0.033230846405029296,
448
- 0.03325132751464844,
449
- 0.033462272644042966,
450
- 0.033230846405029296,
451
- 0.03319091033935547,
452
- 0.03315609741210938,
453
- 0.03331379318237305,
454
- 0.0332042236328125,
455
- 0.033328128814697267,
456
- 0.033301502227783206,
457
- 0.03336908721923828,
458
- 0.03324313735961914,
459
- 0.03333529663085937,
460
- 0.033667072296142575,
461
- 0.03329740905761719,
462
  0.033463294982910154,
463
- 0.033235233306884764,
464
- 0.033362655639648436,
465
- 0.03308544158935547,
466
- 0.03311718368530273,
467
- 0.03316428756713867,
468
- 0.03306496047973633,
469
- 0.03307827377319336,
470
- 0.0331141128540039,
471
- 0.03307417678833008,
472
- 0.03305984115600586,
473
- 0.03318067169189453,
474
- 0.03315507125854492,
475
- 0.032982017517089846,
476
- 0.03300864028930664,
477
- 0.03314790344238281,
478
- 0.03309875106811523,
479
- 0.033007614135742186,
480
- 0.03304857635498047,
481
- 0.03325747299194336,
482
- 0.03307417678833008,
483
- 0.033170433044433595,
484
- 0.03322675323486328,
485
- 0.03318476867675781,
486
- 0.03311206436157227,
487
- 0.033188865661621096,
488
- 0.03305984115600586,
489
- 0.03315609741210938,
490
- 0.033132545471191405,
491
- 0.0331776008605957,
492
  0.033438720703125,
493
- 0.03308441543579101,
494
- 0.033091583251953126,
495
- 0.033107967376708985,
496
- 0.03325439834594727,
497
- 0.033209342956542966,
498
- 0.0331253776550293,
499
- 0.03307417678833008,
500
- 0.033068031311035154,
501
- 0.0332564468383789,
502
- 0.03313868713378906,
503
- 0.033142784118652346,
504
- 0.03304652786254883,
505
- 0.033113086700439456,
506
- 0.03360665512084961,
507
- 0.033410049438476565,
508
- 0.033119232177734374,
509
- 0.03349200057983399,
510
- 0.033191902160644535,
511
- 0.03338979339599609,
512
- 0.033137439727783206,
513
- 0.033320960998535154,
514
- 0.03320627212524414,
515
- 0.03322367858886719,
516
- 0.033279998779296875,
517
- 0.03355347061157227,
518
- 0.03323897552490234,
519
- 0.03323801422119141,
520
- 0.033235969543457033,
521
- 0.03385036849975586,
522
- 0.033307647705078124,
523
- 0.03336601638793945,
524
- 0.03354521560668945,
525
  0.033358848571777344,
526
- 0.03334348678588867,
527
- 0.03326985549926758,
528
- 0.03338435363769531,
529
- 0.0332410888671875,
530
- 0.03324313735961914,
531
- 0.0332564468383789,
532
- 0.03326976013183594,
533
- 0.03331398391723633,
534
- 0.03333407974243164,
535
- 0.033331199645996096,
536
- 0.033379520416259766,
537
- 0.033417022705078125,
538
- 0.0332492790222168,
539
- 0.033432575225830076,
540
- 0.03322470474243164,
541
- 0.03325337600708008,
542
- 0.03328409576416016,
543
- 0.03337955093383789,
544
- 0.03337705612182617,
545
- 0.03328409576416016,
546
- 0.03338547134399414,
547
- 0.03331875228881836,
548
- 0.033247230529785156,
549
- 0.03322060775756836,
550
- 0.03324739074707031,
551
- 0.0332655029296875,
552
- 0.03320729446411133,
553
- 0.033255424499511715,
554
- 0.03323113632202149,
555
- 0.03315683364868164,
556
- 0.03327385711669922,
557
- 0.033242111206054685,
558
- 0.03320012664794922,
559
- 0.03324620819091797,
560
- 0.033268798828125,
561
- 0.03313657760620117,
562
- 0.0332760009765625,
563
- 0.03317238235473633,
564
- 0.03328118515014648,
565
- 0.033259361267089844,
566
- 0.03370195388793945,
567
- 0.033266624450683596,
568
- 0.03314176177978516,
569
- 0.03318374252319336,
570
- 0.033308830261230465,
571
- 0.03329315185546875,
572
- 0.03330047988891602,
573
- 0.0333199348449707,
574
- 0.03330876922607422,
575
- 0.033288097381591795,
576
- 0.03336294555664063,
577
- 0.03331174468994141,
578
- 0.03337830352783203,
579
- 0.03330252838134766,
580
- 0.033643585205078125,
581
- 0.033210304260253905,
582
- 0.03321343994140625,
583
- 0.03325439834594727,
584
- 0.03336908721923828,
585
- 0.033261566162109374,
586
- 0.033315135955810544,
587
- 0.03331961441040039,
588
- 0.03327283096313476,
589
- 0.03336191940307617,
590
- 0.03353497695922852,
591
- 0.03325132751464844,
592
- 0.033312767028808594,
593
- 0.033263614654541016,
594
- 0.03340800094604492,
595
- 0.03316428756713867,
596
- 0.03330047988891602,
597
- 0.03322982406616211,
598
- 0.03336115264892578,
599
- 0.033366783142089844,
600
- 0.03330047988891602,
601
- 0.03331686401367188,
602
- 0.033428577423095705,
603
- 0.03340995025634766,
604
  0.033363967895507815,
605
- 0.0332042236328125,
606
- 0.03325337600708008,
607
- 0.03333017730712891,
608
- 0.033261566162109374,
609
- 0.03321036911010742,
610
- 0.03328102493286133,
611
- 0.03342950439453125,
612
- 0.033328128814697267,
613
- 0.033296382904052735,
614
- 0.03334873580932617,
615
- 0.033309566497802735,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
616
  0.033329151153564454,
617
- 0.033331199645996096,
 
 
 
 
 
 
618
  0.03341209411621094,
619
- 0.03345510482788086,
620
- 0.033347583770751955,
621
- 0.03336703872680664,
622
- 0.03339571380615235,
623
- 0.03342335891723633,
624
- 0.0333199348449707,
625
- 0.0333199348449707,
626
- 0.03384012985229492,
627
- 0.03338444900512695,
628
- 0.03344179153442383,
629
- 0.03342233657836914,
630
- 0.03335372924804687,
631
- 0.03339980697631836,
632
- 0.03345510482788086,
633
- 0.03331379318237305,
634
- 0.03341721725463867,
635
- 0.03334860610961914,
636
- 0.03377260971069336,
637
- 0.033310657501220704,
638
- 0.03338751983642578,
639
- 0.033342464447021485,
640
- 0.03351551818847656,
641
- 0.033529857635498046,
642
- 0.03349708938598633,
643
- 0.033317886352539065,
644
- 0.03347260665893555,
645
- 0.033340320587158204,
646
- 0.03333529663085937,
647
- 0.03331379318237305,
648
- 0.03337420654296875,
649
- 0.03335782241821289,
650
- 0.033430782318115235,
651
- 0.03330227279663086,
652
- 0.03347251129150391,
653
- 0.033344512939453126,
654
  0.03339571380615235,
655
- 0.033277950286865234,
656
- 0.033274879455566404,
657
- 0.033329151153564454,
658
- 0.03336191940307617,
659
- 0.03326259231567383,
660
- 0.03332710266113281,
661
- 0.03323904037475586,
662
- 0.03338854217529297,
663
- 0.033285118103027346,
664
- 0.03341721725463867,
665
- 0.03327078247070313,
666
- 0.03327078247070313,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
667
  0.033312767028808594,
668
- 0.033372161865234375,
669
- 0.0333834228515625,
 
 
 
 
 
 
 
 
 
 
 
670
  0.0334284782409668,
671
- 0.033339393615722655,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
672
  0.03341107177734375,
673
- 0.03328841781616211,
674
- 0.03335248184204102,
675
- 0.033309696197509765,
676
- 0.033230846405029296,
677
- 0.033344512939453126,
678
- 0.03335372924804687,
679
- 0.03332505416870117,
680
- 0.03328204727172852,
681
- 0.03323699188232422,
682
- 0.033533119201660154,
683
- 0.03339961624145508,
684
- 0.03322982406616211,
685
- 0.03334860610961914,
686
- 0.03352371215820313,
687
- 0.033620990753173825,
688
- 0.03331071853637695,
689
- 0.033285118103027346,
690
- 0.03344076919555664,
691
  0.033430526733398434,
692
- 0.03321651077270508,
693
- 0.03342335891723633,
694
- 0.03354521560668945,
695
- 0.03337932968139649,
696
- 0.03327590560913086,
697
- 0.033304576873779294,
698
- 0.03339980697631836,
699
- 0.033258495330810545,
700
- 0.0334919662475586,
701
- 0.03374387359619141,
702
- 0.033426433563232424,
703
- 0.03347148895263672,
704
- 0.03333126449584961,
705
- 0.03327686309814453,
706
- 0.033350654602050785,
707
- 0.033342464447021485,
708
- 0.03321241760253906,
709
- 0.033290241241455076,
710
- 0.03330572891235352,
711
- 0.033309566497802735,
712
- 0.03338956832885742,
713
- 0.03322777557373047,
714
- 0.033486846923828126,
715
- 0.03322777557373047,
716
- 0.03335391998291016,
717
- 0.033289024353027344,
718
- 0.033495166778564456,
719
- 0.033320831298828124,
720
- 0.0332861442565918,
721
- 0.033309696197509765,
722
- 0.03337625503540039,
723
- 0.03327385711669922,
724
- 0.0333199348449707,
725
- 0.033288192749023435,
726
- 0.03337113571166992,
727
- 0.033271808624267575,
728
- 0.03324620819091797,
729
- 0.03320012664794922,
730
- 0.033274879455566404,
731
- 0.03336806488037109,
732
- 0.03329228973388672,
733
- 0.03322470474243164,
734
- 0.03323904037475586,
735
- 0.03333529663085937,
736
- 0.03325747299194336,
737
- 0.033432575225830076,
738
- 0.033317886352539065,
739
- 0.03331379318237305,
740
- 0.03335168075561523,
741
- 0.033375232696533204,
742
- 0.033345535278320314,
743
- 0.03330559921264648,
744
- 0.03334656143188477,
745
- 0.03329536056518555,
746
- 0.033301502227783206,
747
- 0.03385036849975586,
748
- 0.03324415969848633,
749
- 0.03343462371826172,
750
- 0.03332710266113281,
751
- 0.03319091033935547,
752
- 0.03343360137939453,
753
- 0.03332403182983398,
754
- 0.03321036911010742,
755
- 0.03340185546875,
756
- 0.033320960998535154,
757
- 0.03324518585205078,
758
- 0.033432575225830076,
759
- 0.033326080322265625,
760
- 0.03335168075561523,
761
- 0.03380223846435547,
762
- 0.03327590560913086,
763
- 0.033306625366210936,
764
- 0.03338137435913086,
765
  0.033416191101074216,
766
- 0.033442047119140624,
767
- 0.03320191955566406,
768
- 0.03322265625,
769
- 0.03342131042480469,
 
770
  0.03347558212280274,
771
- 0.03333631896972656,
772
- 0.03323801422119141,
773
- 0.033255424499511715,
774
- 0.033296382904052735,
 
 
 
775
  0.03349708938598633,
776
- 0.03344179153442383,
777
- 0.03343360137939453,
778
- 0.033358848571777344,
779
- 0.03338444900512695,
780
- 0.03333324813842774,
781
- 0.033342464447021485,
782
- 0.03333017730712891,
783
- 0.0334284782409668,
784
- 0.0334284782409668,
785
- 0.03329945755004883,
786
- 0.033271808624267575,
787
- 0.033173503875732424,
788
- 0.03332505416870117,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
789
  0.03348992156982422,
790
- 0.03328716659545899,
791
- 0.03332403182983398,
792
- 0.033219585418701174,
793
- 0.03335782241821289,
794
- 0.033339393615722655,
795
- 0.03322470474243164,
796
- 0.033423553466796874,
797
- 0.03352659225463867,
798
- 0.033291263580322264,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
799
  0.033478656768798826,
800
- 0.03340083312988281,
801
- 0.03338649749755859
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
802
  ]
803
  },
804
  "throughput": {
805
  "unit": "tokens/s",
806
- "value": 30.036318245038174
807
  },
808
  "energy": null,
809
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 993.992704,
6
  "max_vram": 4905.238528,
7
  "max_reserved": 4420.796416,
8
  "max_allocated": 4252.667392
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.04236017230392006,
13
+ "stdev": 0.000576452064979207,
14
  "values": [
15
+ 0.04680534362792969,
16
+ 0.044624897003173826,
17
+ 0.04397568130493164,
18
+ 0.04385996627807617,
19
+ 0.04318003082275391,
20
+ 0.04338175964355469,
21
+ 0.04339507293701172,
22
+ 0.04385279846191406,
23
+ 0.04769792175292969,
24
+ 0.044948768615722653,
25
+ 0.042513664245605466,
26
+ 0.04241305541992187,
27
+ 0.04255667114257813,
28
+ 0.04243046569824219,
29
+ 0.042534912109375,
30
+ 0.04235776138305664,
31
+ 0.042175487518310545,
32
  0.042379264831542966,
33
+ 0.042262527465820314,
34
+ 0.04238950347900391,
35
+ 0.04217036819458008,
36
+ 0.042380287170410154,
37
+ 0.04207513427734375,
38
  0.04237209701538086,
39
+ 0.04212736129760742,
40
+ 0.042380287170410154,
41
+ 0.04197683334350586,
42
+ 0.04235468673706055,
43
+ 0.04194815826416016,
 
 
44
  0.042365951538085936,
45
+ 0.04203519821166992,
46
+ 0.042359809875488284,
47
+ 0.041987071990966796,
48
+ 0.04235059356689453,
49
+ 0.042103809356689455,
50
+ 0.04236800003051758,
51
+ 0.042103809356689455,
52
  0.04237516784667969,
53
+ 0.04207206344604492,
54
+ 0.04238131332397461,
55
+ 0.041987071990966796,
56
  0.04235161590576172,
57
+ 0.04207001495361328,
58
+ 0.042395648956298826,
59
+ 0.04211404800415039,
60
+ 0.042372222900390624,
61
+ 0.041882625579833986,
62
+ 0.04239769744873047,
63
+ 0.04194918441772461,
64
+ 0.0423741455078125,
65
+ 0.04214374542236328,
 
 
66
  0.042382335662841795,
67
+ 0.0420136947631836,
68
+ 0.04239974212646484,
69
+ 0.042028030395507815,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
70
  0.04236083221435547,
71
+ 0.042024959564208986,
72
+ 0.04237004852294922,
73
+ 0.04215500640869141,
 
 
74
  0.04237619018554688,
 
 
75
  0.04203212738037109,
76
+ 0.04236800003051758,
77
+ 0.042533889770507816,
78
  0.042393600463867184,
79
+ 0.04199935913085937,
80
+ 0.04236800003051758,
81
+ 0.04215398406982422,
82
+ 0.04238643264770508,
83
+ 0.04209868621826172,
84
+ 0.04238249588012695,
85
+ 0.04219107055664063,
86
+ 0.04239769744873047,
87
+ 0.04200960159301758,
88
+ 0.04240387344360352,
89
+ 0.04211097717285156,
90
+ 0.04236800003051758,
91
+ 0.042090496063232424,
92
+ 0.042393600463867184,
93
+ 0.042033153533935545,
94
+ 0.042363903045654294,
95
+ 0.04212838363647461,
96
+ 0.04240691375732422,
97
+ 0.04217446517944336,
98
+ 0.042365951538085936,
99
+ 0.04201062393188477,
100
+ 0.04236697769165039,
101
+ 0.041954303741455076,
102
+ 0.04237004852294922,
103
+ 0.04208025741577148,
104
+ 0.0423741455078125,
105
+ 0.04204544067382812,
106
  0.04235776138305664,
107
+ 0.041935871124267575,
108
+ 0.0424007682800293,
109
+ 0.042060798645019534,
110
+ 0.04239379119873047,
111
+ 0.04198809432983398,
112
+ 0.042635265350341796,
113
+ 0.04254617691040039,
114
+ 0.04236288070678711,
115
+ 0.04196454238891602,
116
+ 0.04237311935424805,
117
+ 0.04196454238891602,
118
  0.04236083221435547,
119
+ 0.042068992614746094,
120
  0.042385406494140625,
121
+ 0.042019840240478515,
122
+ 0.04236185455322266,
123
+ 0.042159103393554685,
 
 
 
 
 
 
 
 
124
  0.04237721633911133,
125
+ 0.04225024032592774,
126
+ 0.04239257431030274,
127
+ 0.042054656982421876,
128
+ 0.042401790618896484,
129
+ 0.041973758697509765,
130
+ 0.04236185455322266,
131
+ 0.04198310470581055,
132
+ 0.04237823867797851,
133
+ 0.042243072509765625,
134
+ 0.04244377517700195,
135
+ 0.042178848266601565,
136
+ 0.04235468673706055,
137
+ 0.042261505126953126,
138
  0.04235161590576172,
139
+ 0.042229759216308595,
140
+ 0.04241113662719727,
141
+ 0.04233011245727539,
142
+ 0.04236697769165039,
143
+ 0.04229836654663086,
144
+ 0.042352638244628905,
145
+ 0.042090496063232424,
146
+ 0.04239257431030274,
147
+ 0.04217036819458008,
148
+ 0.04238979339599609,
149
+ 0.04210892868041992,
150
+ 0.04236697769165039,
151
+ 0.04209664154052734,
152
+ 0.04236288070678711,
153
+ 0.04214988708496094,
154
+ 0.04236185455322266,
155
+ 0.041957374572753905,
156
+ 0.04234649658203125,
157
+ 0.04209868621826172,
158
+ 0.04237209701538086,
159
+ 0.041957374572753905,
160
+ 0.04237004852294922,
161
+ 0.04242124938964844,
162
  0.0423741455078125,
163
+ 0.04202598571777344,
164
+ 0.04237004852294922,
165
+ 0.04204032135009766,
166
+ 0.04237721633911133,
167
+ 0.0421212158203125,
168
+ 0.04237107086181641,
169
+ 0.042052608489990234,
170
+ 0.042363903045654294,
171
+ 0.04207820892333984,
172
+ 0.04239974212646484,
173
+ 0.04204467010498047,
174
+ 0.04238848114013672,
175
+ 0.042057727813720705,
176
+ 0.04237721633911133,
177
+ 0.04198092651367188,
178
+ 0.042382431030273435,
179
+ 0.04211814498901367,
180
+ 0.04235161590576172,
181
+ 0.04206489562988281,
182
+ 0.042385406494140625,
183
+ 0.042191871643066405,
184
  0.04240691375732422,
185
+ 0.04207820892333984,
 
 
 
 
186
  0.042363903045654294,
187
+ 0.04212838363647461,
 
 
 
 
 
 
 
 
 
 
188
  0.04238848114013672,
189
+ 0.04204339218139649,
190
+ 0.042363903045654294,
191
+ 0.04208844757080078,
192
+ 0.04237007904052734,
193
+ 0.042233089447021484,
194
+ 0.042385406494140625,
195
+ 0.042155105590820315,
196
+ 0.04237516784667969,
197
+ 0.042241024017333983,
198
+ 0.042369022369384765,
199
+ 0.04214169692993164,
 
 
 
 
 
 
200
  0.042379264831542966,
201
+ 0.04200755310058594,
202
  0.04237516784667969,
203
+ 0.04221644973754883,
204
+ 0.04237004852294922,
205
+ 0.04222054290771484,
 
 
 
 
206
  0.042382335662841795,
207
+ 0.0421396484375,
 
 
 
 
 
 
 
 
208
  0.04237619018554688,
209
+ 0.042635265350341796,
210
+ 0.04239052963256836,
211
+ 0.04208332824707031,
212
+ 0.042396671295166014,
213
+ 0.04214169692993164,
214
+ 0.042420223236083986,
215
+ 0.04225024032592774,
216
+ 0.042428417205810545,
217
+ 0.042177536010742187,
218
+ 0.04245328140258789,
219
+ 0.042164222717285156,
220
+ 0.04282572937011719,
221
+ 0.042234878540039066,
222
+ 0.04246527862548828,
223
+ 0.04213555145263672,
224
+ 0.04244172668457031,
225
+ 0.042241024017333983,
226
+ 0.042469375610351565,
227
+ 0.042120193481445314,
228
+ 0.04245708847045898,
229
+ 0.041998336791992184,
230
+ 0.04244070434570312,
231
+ 0.04219100952148438,
232
+ 0.04245811080932617,
233
+ 0.042147838592529296,
234
+ 0.04245401763916016,
235
+ 0.04230144119262695,
236
+ 0.042471424102783206,
237
+ 0.04219903945922852,
238
+ 0.042462368011474606,
239
+ 0.04220723342895508,
240
+ 0.04247859191894531,
241
+ 0.04230144119262695,
242
+ 0.042420223236083986,
243
+ 0.0420136947631836,
244
+ 0.0424510383605957,
245
+ 0.042332256317138675,
246
+ 0.04247347259521484,
247
+ 0.042246177673339845,
248
+ 0.04244172668457031,
249
+ 0.04203007888793946,
250
+ 0.04246131134033203,
251
+ 0.04205158233642578
252
  ]
253
  },
254
  "throughput": {
255
  "unit": "tokens/s",
256
+ "value": 6043.4126226703165
257
  },
258
  "energy": null,
259
  "efficiency": null
 
261
  "decode": {
262
  "memory": {
263
  "unit": "MB",
264
+ "max_ram": 993.992704,
265
  "max_vram": 5255.462912,
266
  "max_reserved": 4771.0208,
267
+ "max_allocated": 4715.61216
268
  },
269
  "latency": {
270
  "unit": "s",
271
+ "mean": 8.584606702804567,
272
+ "stdev": 0.012920709609988812,
273
  "values": [
274
+ 8.597527412414557,
275
+ 8.57168599319458
276
  ]
277
  },
278
  "throughput": {
279
  "unit": "tokens/s",
280
+ "value": 29.704331115913813
281
  },
282
  "energy": null,
283
  "efficiency": null
 
286
  "memory": null,
287
  "latency": {
288
  "unit": "s",
289
+ "mean": 0.03366512432472383,
290
+ "stdev": 0.0008075856248906625,
291
  "values": [
292
+ 0.03338943862915039,
293
+ 0.03398678588867188,
294
+ 0.03342214584350586,
295
+ 0.033371105194091796,
296
+ 0.03382067108154297,
297
+ 0.03350143814086914,
298
+ 0.03323878479003906,
299
+ 0.03339571380615235,
300
+ 0.033360126495361325,
301
+ 0.0334273910522461,
302
+ 0.03330131149291992,
303
+ 0.033317886352539065,
304
+ 0.033451103210449216,
305
+ 0.033478561401367186,
306
+ 0.03342335891723633,
307
+ 0.03355750274658203,
308
+ 0.033438720703125,
309
+ 0.033372417449951175,
310
+ 0.03343027114868164,
311
+ 0.03374694442749023,
312
+ 0.033312767028808594,
313
+ 0.03350527954101563,
314
+ 0.03364556884765625,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
315
  0.033463294982910154,
316
+ 0.0334284782409668,
317
+ 0.033459201812744144,
318
+ 0.033420318603515624,
319
+ 0.03340284729003906,
320
+ 0.03374387359619141,
321
+ 0.03347353744506836,
322
+ 0.03338240051269531,
323
+ 0.033462272644042966,
324
+ 0.033318145751953125,
325
+ 0.03343334579467774,
326
+ 0.03338137435913086,
327
+ 0.03347967910766601,
328
+ 0.03346944046020508,
329
+ 0.03356364822387695,
330
+ 0.03350630569458008,
331
+ 0.03352268981933594,
332
+ 0.03346764755249024,
333
+ 0.03343657684326172,
334
+ 0.03349513626098633,
335
+ 0.03339750289916992,
 
 
 
 
 
 
 
 
 
336
  0.033438720703125,
337
+ 0.033416191101074216,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
338
  0.033358848571777344,
339
+ 0.033716224670410154,
340
+ 0.03358745574951172,
341
+ 0.033355552673339846,
342
+ 0.033523681640625,
343
+ 0.03346044921875,
344
+ 0.03342115020751953,
345
+ 0.0334345588684082,
346
+ 0.03344179153442383,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
347
  0.033363967895507815,
348
+ 0.033345535278320314,
349
+ 0.03341209411621094,
350
+ 0.0335175666809082,
351
+ 0.033519615173339845,
352
+ 0.03346124649047852,
353
+ 0.03347257614135742,
354
+ 0.0334345588684082,
355
+ 0.033519615173339845,
356
+ 0.03408281707763672,
357
+ 0.03343667221069336,
358
+ 0.033428543090820315,
359
+ 0.033484737396240236,
360
+ 0.03342544174194336,
361
+ 0.03349615859985351,
362
+ 0.03346233749389648,
363
+ 0.03336070251464844,
364
+ 0.0333383674621582,
365
+ 0.033298431396484376,
366
+ 0.033393665313720705,
367
+ 0.033503231048583985,
368
+ 0.0334571533203125,
369
+ 0.03333222579956055,
370
+ 0.033432575225830076,
371
+ 0.03372355270385742,
372
+ 0.033423423767089844,
373
+ 0.03358185577392578,
374
+ 0.033446910858154294,
375
+ 0.033484798431396484,
376
+ 0.03343769454956055,
377
+ 0.03339775848388672,
378
+ 0.033392799377441405,
379
+ 0.03349795150756836,
380
+ 0.03346022415161133,
381
+ 0.03348889541625977,
382
+ 0.03346944046020508,
383
+ 0.03344076919555664,
384
+ 0.033448959350585936,
385
+ 0.033495040893554685,
386
+ 0.033500160217285156,
387
+ 0.03350425720214844,
388
+ 0.033506431579589845,
389
+ 0.03343859100341797,
390
  0.033329151153564454,
391
+ 0.033448959350585936,
392
+ 0.033617919921875,
393
+ 0.033460289001464846,
394
+ 0.03367734527587891,
395
+ 0.03338947296142578,
396
+ 0.03341641616821289,
397
+ 0.03336272048950195,
398
  0.03341209411621094,
399
+ 0.03331916809082031,
400
+ 0.03346918487548828,
401
+ 0.03339497756958008,
402
+ 0.033419998168945315,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
403
  0.03339571380615235,
404
+ 0.03351859283447266,
405
+ 0.0334246711730957,
406
+ 0.033495006561279295,
407
+ 0.033521408081054686,
408
+ 0.03341315078735352,
409
+ 0.03335369491577148,
410
+ 0.03343667221069336,
411
+ 0.0332492790222168,
412
+ 0.033269790649414065,
413
+ 0.033390560150146485,
414
+ 0.03363020706176758,
415
+ 0.03348992156982422,
416
+ 0.033484798431396484,
417
+ 0.03378995132446289,
418
+ 0.03370614242553711,
419
+ 0.03338838577270508,
420
+ 0.033539070129394534,
421
+ 0.033501182556152344,
422
+ 0.033432575225830076,
423
+ 0.033377281188964845,
424
+ 0.03328307342529297,
425
+ 0.033364990234375,
426
+ 0.03348787307739258,
427
+ 0.03339775848388672,
428
+ 0.033377281188964845,
429
+ 0.03345305633544922,
430
+ 0.033361183166503904,
431
+ 0.033774303436279296,
432
+ 0.033511425018310545,
433
+ 0.033309696197509765,
434
+ 0.03349734497070313,
435
+ 0.03345280075073242,
436
+ 0.0335206413269043,
437
+ 0.033391616821289063,
438
+ 0.033516544342041016,
439
+ 0.03326464080810547,
440
+ 0.033600513458251956,
441
+ 0.03341107177734375,
442
+ 0.033438720703125,
443
  0.033312767028808594,
444
+ 0.03356979370117188,
445
+ 0.03354316711425781,
446
+ 0.03347251129150391,
447
+ 0.03335782241821289,
448
+ 0.03340492630004883,
449
+ 0.03364659118652344,
450
+ 0.03351555252075195,
451
+ 0.033349601745605466,
452
+ 0.033347583770751955,
453
+ 0.033274974822998044,
454
+ 0.03369257736206055,
455
+ 0.03335497665405274,
456
+ 0.03340367889404297,
457
  0.0334284782409668,
458
+ 0.03346022415161133,
459
+ 0.03338240051269531,
460
+ 0.033492992401123044,
461
+ 0.03343667221069336,
462
+ 0.03348787307739258,
463
+ 0.033363967895507815,
464
+ 0.03360995101928711,
465
+ 0.03344771194458008,
466
+ 0.03347251129150391,
467
+ 0.033495040893554685,
468
+ 0.03343974304199219,
469
+ 0.033492992401123044,
470
+ 0.03348582458496094,
471
+ 0.033525920867919924,
472
+ 0.03347747039794922,
473
+ 0.03346432113647461,
474
+ 0.03349401473999023,
475
+ 0.033481727600097655,
476
+ 0.03358003234863281,
477
+ 0.033788928985595705,
478
+ 0.03366604614257813,
479
+ 0.03353702545166016,
480
+ 0.03352166366577149,
481
+ 0.03353190231323242,
482
+ 0.033598464965820314,
483
+ 0.03341823959350586,
484
+ 0.03353926467895508,
485
+ 0.033567550659179685,
486
+ 0.03352691268920899,
487
+ 0.036181888580322265,
488
+ 0.03810201644897461,
489
+ 0.03954995346069336,
490
+ 0.03883212661743164,
491
+ 0.03791155242919922,
492
+ 0.03795558547973633,
493
+ 0.03790950393676758,
494
+ 0.03722768020629883,
495
+ 0.038012767791748045,
496
+ 0.037926910400390625,
497
+ 0.0352174072265625,
498
+ 0.034977054595947264,
499
+ 0.0352918701171875,
500
+ 0.036751361846923826,
501
+ 0.03619942474365234,
502
+ 0.03588198471069336,
503
+ 0.0339947509765625,
504
+ 0.0335994873046875,
505
+ 0.03356364822387695,
506
+ 0.03345817565917969,
507
+ 0.03349935913085938,
508
+ 0.03351865768432617,
509
+ 0.03349094390869141,
510
+ 0.03415625762939453,
511
+ 0.033898494720458985,
512
+ 0.03359539031982422,
513
+ 0.033549312591552735,
514
+ 0.033501182556152344,
515
+ 0.03368268966674805,
516
+ 0.03379276657104492,
517
+ 0.03378995132446289,
518
+ 0.033514495849609374,
519
+ 0.033432575225830076,
520
+ 0.03348384094238281,
521
+ 0.03355539321899414,
522
+ 0.03356675338745117,
523
+ 0.03345916748046875,
524
+ 0.03362201690673828,
525
+ 0.03345532989501953,
526
+ 0.03349817657470703,
527
+ 0.0334681282043457,
528
+ 0.03339775848388672,
529
+ 0.033633281707763675,
530
+ 0.033600513458251956,
531
+ 0.033582080841064454,
532
+ 0.03341926574707031,
533
+ 0.033416191101074216,
534
+ 0.033545246124267576,
535
+ 0.03388639831542969,
536
+ 0.03340163040161133,
537
  0.03341107177734375,
538
+ 0.03357519912719727,
539
+ 0.03354185485839844,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
540
  0.033430526733398434,
541
+ 0.033565696716308595,
542
+ 0.033508350372314456,
543
+ 0.03342745590209961,
544
+ 0.03358310317993164,
545
+ 0.033582080841064454,
546
+ 0.03366400146484375,
547
+ 0.033670398712158205,
548
+ 0.033971904754638675,
549
+ 0.03348889541625977,
550
+ 0.03351244735717773,
551
+ 0.03350732803344727,
552
+ 0.03363225555419922,
553
+ 0.03361382293701172,
554
+ 0.033568767547607424,
555
+ 0.033567745208740236,
556
+ 0.033495040893554685,
557
+ 0.03340902328491211,
558
+ 0.033430526733398434,
559
+ 0.033413120269775394,
560
+ 0.03338143920898438,
561
+ 0.03348297500610352,
562
+ 0.03358998489379883,
563
+ 0.03361894226074219,
564
+ 0.0335810546875,
565
+ 0.033641792297363284,
566
+ 0.03351827239990234,
567
+ 0.033535999298095705,
568
+ 0.033552383422851564,
569
+ 0.03355033493041992,
570
+ 0.03381043243408203,
571
+ 0.03360768127441406,
572
+ 0.033576961517333984,
573
+ 0.03360768127441406,
574
+ 0.033691646575927735,
575
+ 0.033600513458251956,
576
+ 0.03356159973144531,
577
+ 0.03351859283447266,
578
+ 0.03352067184448242,
579
+ 0.033581024169921876,
580
+ 0.03356364822387695,
581
+ 0.03353702545166016,
582
+ 0.03359561538696289,
583
+ 0.033702686309814454,
584
+ 0.03357299041748047,
585
+ 0.033516414642333986,
586
+ 0.033562625885009766,
587
+ 0.03350527954101563,
588
+ 0.03343564987182617,
589
+ 0.034904064178466795,
590
+ 0.040970241546630856,
591
+ 0.03864390563964844,
592
+ 0.03719148635864258,
593
+ 0.03498905563354492,
594
+ 0.03358924865722656,
595
+ 0.03352371215820313,
596
+ 0.03365478515625,
597
+ 0.033597728729248044,
598
+ 0.033610591888427736,
599
+ 0.0341635856628418,
600
+ 0.03346944046020508,
601
+ 0.03350527954101563,
602
+ 0.033552383422851564,
 
 
 
 
 
 
 
 
 
 
 
603
  0.033416191101074216,
604
+ 0.03345100784301758,
605
+ 0.03351347351074219,
606
+ 0.033614849090576174,
607
+ 0.03357593536376953,
608
+ 0.03394355010986328,
609
  0.03347558212280274,
610
+ 0.03351347351074219,
611
+ 0.033519615173339845,
612
+ 0.03357798385620117,
613
+ 0.03370598220825195,
614
+ 0.03351039886474609,
615
+ 0.03357798385620117,
616
+ 0.03352576065063476,
617
  0.03349708938598633,
618
+ 0.03343564987182617,
619
+ 0.03348598480224609,
620
+ 0.03346518325805664,
621
+ 0.033685504913330076,
622
+ 0.033486846923828126,
623
+ 0.03360358428955078,
624
+ 0.033529857635498046,
625
+ 0.033616897583007815,
626
+ 0.03362713623046875,
627
+ 0.03355955123901367,
628
+ 0.033549312591552735,
629
+ 0.03355340957641602,
630
+ 0.03346432113647461,
631
+ 0.03357183837890625,
632
+ 0.03360870361328125,
633
+ 0.033805313110351565,
634
+ 0.0337151985168457,
635
+ 0.03364659118652344,
636
+ 0.03357593536376953,
637
+ 0.033800193786621094,
638
+ 0.03346636962890625,
639
+ 0.03344704055786133,
640
+ 0.033489791870117185,
641
+ 0.03355267333984375,
642
+ 0.033667808532714845,
643
+ 0.033565696716308595,
644
+ 0.03355750274658203,
645
+ 0.033560577392578124,
646
+ 0.033492992401123044,
647
+ 0.03346233749389648,
648
+ 0.0334796142578125,
649
+ 0.03374182510375977,
650
+ 0.033655807495117186,
651
+ 0.03349708938598633,
652
+ 0.03366604614257813,
653
+ 0.03388518524169922,
654
+ 0.0335093765258789,
655
+ 0.033519615173339845,
656
+ 0.0337367057800293,
657
+ 0.03350342559814453,
658
+ 0.0334477424621582,
659
+ 0.033532928466796875,
660
+ 0.033503231048583985,
661
+ 0.033568767547607424,
662
+ 0.033540287017822266,
663
+ 0.03367929458618164,
664
+ 0.03362086486816406,
665
+ 0.03359334564208984,
666
+ 0.033565696716308595,
667
+ 0.03343462371826172,
668
+ 0.03383603286743164,
669
+ 0.033587200164794925,
670
+ 0.03348889541625977,
671
+ 0.03375718307495117,
672
+ 0.033414142608642575,
673
+ 0.033588222503662106,
674
+ 0.03347763061523437,
675
+ 0.03347763061523437,
676
+ 0.033337345123291014,
677
+ 0.033503231048583985,
678
+ 0.03336294555664063,
679
+ 0.033465343475341795,
680
+ 0.03362918472290039,
681
+ 0.03353190231323242,
682
+ 0.03345305633544922,
683
+ 0.03349094390869141,
684
+ 0.033516544342041016,
685
+ 0.033514751434326175,
686
+ 0.03344367980957031,
687
+ 0.033514400482177735,
688
+ 0.033461311340332034,
689
+ 0.03348678588867188,
690
+ 0.03369472122192383,
691
+ 0.0335247688293457,
692
+ 0.03361276626586914,
693
+ 0.033328128814697267,
694
+ 0.03353497695922852,
695
+ 0.03355955123901367,
696
+ 0.033859809875488284,
697
+ 0.03348867034912109,
698
+ 0.033459201812744144,
699
+ 0.033452030181884765,
700
+ 0.033474624633789064,
701
+ 0.03349113464355469,
702
+ 0.033398529052734376,
703
+ 0.03338137435913086,
704
+ 0.0337448959350586,
705
+ 0.033459201812744144,
706
+ 0.03349401473999023,
707
+ 0.03330691146850586,
708
+ 0.033372161865234375,
709
+ 0.03338723373413086,
710
+ 0.033410049438476565,
711
+ 0.03351347351074219,
712
+ 0.033576961517333984,
713
+ 0.03346944046020508,
714
+ 0.033807361602783206,
715
+ 0.033500160217285156,
716
+ 0.033498111724853515,
717
+ 0.03347382354736328,
718
+ 0.03347017669677734,
719
+ 0.03367222213745117,
720
+ 0.033472480773925783,
721
+ 0.03373056030273437,
722
+ 0.033329151153564454,
723
+ 0.03344998550415039,
724
+ 0.033372161865234375,
725
+ 0.03342233657836914,
726
+ 0.033447071075439455,
727
+ 0.03367308807373047,
728
+ 0.03379606246948242,
729
+ 0.03354111862182617,
730
+ 0.03330867385864258,
731
+ 0.033406238555908206,
732
+ 0.033344223022460935,
733
+ 0.03347251129150391,
734
+ 0.03360255813598633,
735
+ 0.03360255813598633,
736
+ 0.03338854217529297,
737
+ 0.03337343978881836,
738
+ 0.03332992172241211,
739
+ 0.03338137435913086,
740
+ 0.033442817687988284,
741
+ 0.033516544342041016,
742
  0.03348992156982422,
743
+ 0.03335168075561523,
744
+ 0.0334317741394043,
745
+ 0.033481502532958986,
746
+ 0.03336294555664063,
747
+ 0.03345510482788086,
748
+ 0.033649665832519535,
749
+ 0.033530879974365234,
750
+ 0.033484798431396484,
751
+ 0.033414142608642575,
752
+ 0.033345535278320314,
753
+ 0.03343564987182617,
754
+ 0.03360563278198242,
755
+ 0.03374195098876953,
756
+ 0.033631103515625,
757
+ 0.033495040893554685,
758
+ 0.033393665313720705,
759
+ 0.03339775848388672,
760
+ 0.03355033493041992,
761
+ 0.03340390396118164,
762
+ 0.03345305633544922,
763
+ 0.0335175666809082,
764
+ 0.033396961212158204,
765
+ 0.03345078277587891,
766
+ 0.033524734497070316,
767
+ 0.033546398162841794,
768
+ 0.03352479934692383,
769
+ 0.03351631927490235,
770
+ 0.03348992156982422,
771
+ 0.03357491302490234,
772
+ 0.033463294982910154,
773
+ 0.03350630569458008,
774
+ 0.033860607147216795,
775
+ 0.0334284782409668,
776
+ 0.03344815826416016,
777
+ 0.033487648010253904,
778
+ 0.033600513458251956,
779
+ 0.0334951057434082,
780
+ 0.03370284652709961,
781
+ 0.03373382568359375,
782
+ 0.033530689239501955,
783
  0.033478656768798826,
784
+ 0.03353702545166016,
785
+ 0.03354111862182617,
786
+ 0.033486846923828126,
787
+ 0.03347455978393555,
788
+ 0.03395481491088867,
789
+ 0.03349094390869141,
790
+ 0.033721343994140625,
791
+ 0.033454078674316406,
792
+ 0.03344076919555664,
793
+ 0.033503231048583985,
794
+ 0.0336363525390625,
795
+ 0.03350630569458008,
796
+ 0.03344384002685547,
797
+ 0.033521854400634765,
798
+ 0.033528640747070314,
799
+ 0.0335206413269043,
800
+ 0.03358924865722656,
801
+ 0.03347267150878906
802
  ]
803
  },
804
  "throughput": {
805
  "unit": "tokens/s",
806
+ "value": 29.70433111591378
807
  },
808
  "energy": null,
809
  "efficiency": null