kreas commited on
Commit
ec1bdb6
·
verified ·
1 Parent(s): 56ac8f2

Upload /gemma-7b/fp4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
gemma-7b/fp4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,202 +2,202 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 1089.10592,
6
  "max_vram": 6534.725632,
7
  "max_reserved": 6312.42752,
8
  "max_allocated": 6191.16288
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.0554408369327777,
13
- "stdev": 0.00046867886188081725,
14
  "values": [
15
- 0.06065068817138672,
16
- 0.05728492736816406,
17
- 0.05781708908081055,
18
- 0.05692211151123047,
19
- 0.055831550598144535,
20
- 0.05569740676879883,
21
- 0.05571993637084961,
22
- 0.05533695983886719,
23
- 0.05533900833129883,
24
- 0.055228416442871096,
25
- 0.05532057571411133,
26
- 0.05521612930297851,
27
- 0.055268383026123045,
28
- 0.05524172973632813,
29
- 0.05533494567871094,
30
- 0.05518745422363281,
31
- 0.0553639030456543,
32
- 0.05525708770751953,
33
- 0.055431167602539064,
34
- 0.05526323318481445,
35
- 0.0553853759765625,
36
- 0.05528268814086914,
37
- 0.055403518676757815,
38
- 0.055305217742919924,
39
- 0.055390209197998044,
40
- 0.05535232162475586,
41
- 0.05541580963134766,
42
- 0.05530316925048828,
43
- 0.05540454483032226,
44
- 0.05530112075805664,
45
  0.055393280029296874,
46
- 0.0553454704284668,
47
- 0.05542521667480469,
48
- 0.055332862854003906,
49
- 0.055375873565673826,
50
- 0.055375873565673826,
51
- 0.05537279891967774,
52
- 0.05539123153686523,
53
- 0.05534515380859375,
54
- 0.05535232162475586,
55
- 0.05535027313232422,
56
- 0.05538611221313477,
57
- 0.0553809928894043,
58
- 0.055401470184326174,
59
- 0.055365631103515625,
60
- 0.055357662200927735,
61
- 0.055365631103515625,
62
- 0.055377983093261716,
63
- 0.055362560272216796,
64
- 0.05537811279296875,
65
- 0.055378944396972656,
66
- 0.05538304138183594,
67
- 0.05538508987426758,
68
- 0.05540249633789063,
69
- 0.055362560272216796,
70
- 0.05538611221313477,
71
- 0.05536767959594727,
72
- 0.05538304138183594,
73
- 0.055362560272216796,
74
- 0.05539123153686523,
75
- 0.055381183624267576,
76
- 0.05536483383178711,
77
- 0.055375873565673826,
78
- 0.05538105773925781,
79
- 0.05536675262451172,
80
- 0.05537996673583984,
81
- 0.055376895904541014,
82
- 0.055378944396972656,
83
- 0.055347198486328124,
84
- 0.055398399353027344,
85
- 0.05538304138183594,
86
  0.05535539245605469,
87
- 0.055398399353027344,
88
- 0.0556124153137207,
89
- 0.05536972808837891,
90
- 0.055376895904541014,
91
- 0.05539865493774414,
92
- 0.055392257690429686,
93
- 0.05539430236816406,
94
  0.05538918304443359,
95
- 0.05537279891967774,
96
- 0.05538412857055664,
97
- 0.0553779182434082,
98
- 0.05537996673583984,
99
- 0.05535334396362305,
100
- 0.055349246978759765,
101
- 0.055375873565673826,
102
- 0.055375873565673826,
103
- 0.0553779182434082,
104
- 0.0553963508605957,
105
- 0.05537513732910156,
106
- 0.0553779182434082,
107
- 0.05537295913696289,
108
- 0.05536153411865234,
109
- 0.05535232162475586,
110
  0.055398399353027344,
111
- 0.05538816070556641,
112
- 0.055363582611083983,
113
- 0.055376895904541014,
114
- 0.0553994255065918,
115
- 0.05540454483032226,
116
- 0.05537388610839844,
117
- 0.05540761566162109,
118
- 0.055392257690429686,
119
- 0.05535129547119141,
120
- 0.055403518676757815,
121
- 0.05538304138183594,
122
- 0.05538611221313477,
123
- 0.05537279891967774,
124
- 0.05540761566162109,
125
- 0.05536870574951172,
126
- 0.055375873565673826,
127
- 0.05537177658081055,
128
- 0.055398399353027344,
129
- 0.055375873565673826,
130
- 0.055401470184326174,
131
- 0.05539430236816406,
132
- 0.055387134552001956,
133
- 0.055363582611083983,
134
- 0.05536460876464844,
135
- 0.05536665725708008,
136
- 0.055390209197998044,
137
- 0.055392257690429686,
138
- 0.05537411117553711,
139
- 0.055370750427246096,
140
- 0.055381088256835936,
141
- 0.05536972808837891,
142
- 0.05537897491455078,
143
- 0.05540454483032226,
144
- 0.05538918304443359,
145
- 0.05537177658081055,
146
- 0.0553809928894043,
147
- 0.05535641479492188,
148
- 0.0553809928894043,
149
- 0.05538508987426758,
150
- 0.05542911911010742,
151
- 0.05536153411865234,
152
- 0.055387134552001956,
153
- 0.05537279891967774,
154
- 0.055375873565673826,
155
- 0.0553779182434082,
156
- 0.05536767959594727,
157
- 0.055387134552001956,
158
- 0.055382015228271485,
159
- 0.05536870574951172,
160
- 0.05536460876464844,
161
- 0.0553779182434082,
162
- 0.055401470184326174,
163
- 0.0553809928894043,
164
- 0.055363582611083983,
165
- 0.055357440948486325,
166
- 0.05538508987426758,
167
- 0.05536460876464844,
168
- 0.055400447845458986,
169
- 0.055375873565673826,
170
- 0.05537279891967774,
171
- 0.055387134552001956,
172
- 0.055375873565673826,
173
- 0.05535948944091797,
174
- 0.0553809928894043,
175
- 0.055387134552001956,
176
- 0.055401470184326174,
177
  0.055370750427246096,
178
- 0.055393310546875,
179
- 0.0553963508605957,
180
- 0.055385215759277344,
181
- 0.0553809928894043,
182
- 0.05537279891967774,
183
  0.05538611221313477,
184
- 0.05538508987426758,
185
- 0.055393280029296874,
186
- 0.05536972808837891,
187
- 0.055378944396972656,
188
- 0.055393280029296874,
189
- 0.0553963508605957,
190
- 0.05536460876464844,
191
- 0.055370750427246096,
192
- 0.05540966415405273,
193
- 0.055401470184326174,
194
- 0.05537996673583984,
195
- 0.055411712646484375
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
196
  ]
197
  },
198
  "throughput": {
199
  "unit": "tokens/s",
200
- "value": 4617.534910419937
201
  },
202
  "energy": null,
203
  "efficiency": null
@@ -205,23 +205,23 @@
205
  "decode": {
206
  "memory": {
207
  "unit": "MB",
208
- "max_ram": 1089.10592,
209
  "max_vram": 7212.105728,
210
  "max_reserved": 6727.663616,
211
  "max_allocated": 6570.75456
212
  },
213
  "latency": {
214
  "unit": "s",
215
- "mean": 8.009259902954101,
216
- "stdev": 0.0027145023345926944,
217
  "values": [
218
- 8.011974405288694,
219
- 8.006545400619508
220
  ]
221
  },
222
  "throughput": {
223
  "unit": "tokens/s",
224
- "value": 31.838147730222477
225
  },
226
  "energy": null,
227
  "efficiency": null
@@ -230,524 +230,524 @@
230
  "memory": null,
231
  "latency": {
232
  "unit": "s",
233
- "mean": 0.031408862364525884,
234
- "stdev": 0.00011838795661826258,
235
  "values": [
236
- 0.0313515510559082,
237
- 0.03122585678100586,
238
- 0.03126169586181641,
239
- 0.031351808547973634,
240
- 0.03133030319213867,
241
- 0.03134883117675781,
242
- 0.03142351913452148,
243
- 0.031348608016967774,
244
- 0.031246335983276367,
245
- 0.0312729606628418,
246
- 0.0313702392578125,
247
- 0.031268863677978515,
248
- 0.03145638465881348,
249
- 0.03136092758178711,
250
- 0.0312391357421875,
251
- 0.03131494331359863,
252
- 0.03134694480895996,
253
- 0.03131673622131348,
254
- 0.03124550437927246,
255
- 0.03128505516052246,
256
- 0.031239168167114258,
257
- 0.03129446411132813,
258
- 0.03127807998657227,
259
- 0.031262943267822266,
260
- 0.031309600830078124,
261
- 0.03122790336608887,
262
- 0.03130060768127441,
263
- 0.031321088790893556,
264
- 0.03131596755981445,
265
- 0.03141324806213379,
266
- 0.031255680084228514,
267
- 0.031226751327514648,
268
- 0.03124838447570801,
269
- 0.03136102485656738,
270
- 0.031351039886474606,
271
- 0.031331167221069336,
272
- 0.03125545692443848,
273
- 0.031352832794189454,
274
- 0.03134976005554199,
275
- 0.03154944038391113,
276
- 0.03124742317199707,
277
- 0.03141932868957519,
278
- 0.03138764762878418,
279
- 0.03138457679748535,
280
- 0.031431936264038084,
281
- 0.031840000152587894,
282
- 0.03137126350402832,
283
- 0.03138457679748535,
284
- 0.0314019832611084,
285
- 0.031330368041992185,
286
- 0.0314707202911377,
287
- 0.03133225631713867,
288
- 0.03136822319030762,
289
- 0.031348608016967774,
290
- 0.031437824249267575,
291
- 0.031394943237304684,
292
- 0.031468416213989256,
293
- 0.03138662338256836,
294
- 0.031475711822509765,
295
- 0.0313753604888916,
296
- 0.031768575668334964,
297
- 0.03143987274169922,
298
- 0.03141836738586426,
299
- 0.0314071044921875,
300
- 0.03148006439208984,
301
- 0.031409151077270506,
302
- 0.031357696533203125,
303
- 0.03142860794067383,
304
- 0.03141222381591797,
305
- 0.031494144439697266,
306
- 0.03140096092224121,
307
- 0.03146444892883301,
308
- 0.031306751251220705,
309
- 0.03133440017700195,
310
- 0.03158220863342285,
311
- 0.03141119956970215,
312
- 0.03134464073181152,
313
- 0.03154022407531738,
314
- 0.03144704055786133,
315
- 0.03135193634033203,
316
- 0.031316864013671876,
317
- 0.03135807991027832,
318
- 0.031485824584960936,
319
- 0.03136204719543457,
320
- 0.03138047981262207,
321
- 0.03136511993408203,
322
- 0.03146563148498535,
323
- 0.031412063598632814,
324
- 0.03136000061035156,
325
- 0.031380544662475585,
326
- 0.03141856002807617,
327
- 0.0315534725189209,
328
- 0.031408031463623046,
329
- 0.03143587112426758,
330
- 0.03136083221435547,
331
- 0.03132825660705566,
332
- 0.03139174461364746,
333
- 0.03150233650207519,
334
- 0.031335424423217774,
335
- 0.03136204719543457,
336
- 0.03136102485656738,
337
- 0.031628288269042966,
338
- 0.03137945556640625,
339
- 0.03160883140563965,
340
- 0.03131494331359863,
341
- 0.03146240043640137,
342
- 0.03144704055786133,
343
- 0.031425535202026365,
344
- 0.03140403175354004,
345
- 0.031903743743896484,
346
- 0.03148512077331543,
347
- 0.031428415298461916,
348
- 0.031425535202026365,
349
- 0.031507455825805664,
350
- 0.031455232620239255,
351
- 0.031421440124511715,
352
- 0.03134873580932617,
353
- 0.031458303451538085,
354
- 0.031321088790893556,
355
- 0.0314726390838623,
356
- 0.03136819267272949,
357
- 0.03143987274169922,
358
- 0.03144499206542969,
359
- 0.03143065643310547,
360
- 0.0314839038848877,
361
- 0.03158118438720703,
362
- 0.03141529655456543,
363
- 0.03143270492553711,
364
- 0.031268863677978515,
365
- 0.03153510475158691,
366
- 0.03142451286315918,
367
- 0.03144704055786133,
368
- 0.031459327697753905,
369
- 0.031341567993164066,
370
- 0.031512575149536134,
371
- 0.031524864196777344,
372
- 0.03142963218688965,
373
- 0.031526912689208986,
374
- 0.03164672088623047,
375
- 0.03140300750732422,
376
- 0.03156582450866699,
377
- 0.03143577575683594,
378
- 0.031527936935424807,
379
- 0.03147776031494141,
380
- 0.031527936935424807,
381
- 0.03138355255126953,
382
- 0.031542272567749025,
383
- 0.031525983810424804,
384
- 0.031510431289672854,
385
- 0.03146463966369629,
386
- 0.031534912109375,
387
- 0.03142451286315918,
388
- 0.03149926376342774,
389
- 0.03144704055786133,
390
- 0.031437824249267575,
391
- 0.031440895080566404,
392
- 0.03150233650207519,
393
- 0.031456256866455076,
394
- 0.031442943572998046,
395
- 0.031441919326782225,
396
- 0.031488000869750975,
397
- 0.0314726390838623,
398
- 0.03146751976013184,
399
- 0.03146751976013184,
400
- 0.0314839038848877,
401
- 0.03147164726257324,
402
- 0.03157705688476563,
403
- 0.031460351943969726,
404
- 0.03143065643310547,
405
- 0.0314654712677002,
406
- 0.031491071701049804,
407
- 0.03152179145812988,
408
- 0.03146956825256347,
409
- 0.0318525447845459,
410
- 0.031525888442993165,
411
- 0.031456256866455076,
412
- 0.031512575149536134,
413
- 0.031488000869750975,
414
- 0.03146854400634766,
415
- 0.031508480072021484,
416
- 0.03150028800964356,
417
- 0.031496320724487305,
418
- 0.031504255294799804,
419
- 0.031512575149536134,
420
- 0.03148902320861816,
421
- 0.03155891227722168,
422
- 0.03148467254638672,
423
- 0.031527936935424807,
424
- 0.031513599395751955,
425
- 0.031666175842285156,
426
- 0.03143475151062012,
427
- 0.03140505599975586,
428
- 0.03135385513305664,
429
- 0.03137126350402832,
430
- 0.03134771156311035,
431
- 0.031438848495483396,
432
- 0.031486976623535154,
433
- 0.03129446411132813,
434
- 0.03139481544494629,
435
- 0.03137740707397461,
436
- 0.031348896026611325,
437
- 0.03142127990722656,
438
- 0.03130060768127441,
439
- 0.03139891242980957,
440
- 0.03129343986511231,
441
- 0.03141734313964844,
442
- 0.0314204158782959,
443
- 0.031401119232177734,
444
- 0.031381343841552736,
445
- 0.03150540733337402,
446
- 0.031422464370727536,
447
- 0.03136716842651367,
448
- 0.031356927871704104,
449
- 0.0314839038848877,
450
- 0.03143680000305176,
451
- 0.03139788818359375,
452
- 0.031453184127807614,
453
- 0.03139891242980957,
454
- 0.03149516868591309,
455
- 0.0314019832611084,
456
- 0.031409151077270506,
457
- 0.03141647911071777,
458
- 0.03126358413696289,
459
- 0.03133551979064941,
460
- 0.03134249687194824,
461
- 0.03156582450866699,
462
- 0.031291391372680666,
463
- 0.031441919326782225,
464
- 0.0313753604888916,
465
- 0.031352832794189454,
466
- 0.03127910423278808,
467
- 0.031457279205322264,
468
- 0.031460351943969726,
469
- 0.03149004745483398,
470
- 0.031339519500732424,
471
- 0.03143065643310547,
472
- 0.0315035514831543,
473
- 0.03153286361694336,
474
- 0.031440895080566404,
475
- 0.03132620811462403,
476
- 0.031308799743652346,
477
- 0.03137638473510742,
478
- 0.031351808547973634,
479
- 0.03137955284118652,
480
- 0.031256479263305666,
481
- 0.03151283264160156,
482
- 0.031357696533203125,
483
- 0.03136511993408203,
484
- 0.031357952117919925,
485
- 0.03146342468261719,
486
- 0.03138764762878418,
487
- 0.031421632766723634,
488
- 0.03139155197143555,
489
- 0.03177574348449707,
490
- 0.031253503799438476,
491
- 0.03136716842651367,
492
- 0.03134771156311035,
493
- 0.03122380828857422,
494
- 0.031291391372680666,
495
- 0.03122585678100586,
496
- 0.03141024017333984,
497
- 0.03135379219055176,
498
- 0.03135398483276367,
499
- 0.03129747200012207,
500
- 0.03135276794433594,
501
- 0.03103036880493164,
502
- 0.030929023742675782,
503
- 0.03122265625,
504
- 0.03134249687194824,
505
- 0.03126169586181641,
506
- 0.03139072036743164,
507
- 0.031263744354248044,
508
- 0.031357952117919925,
509
- 0.031301631927490234,
510
- 0.03136214447021484,
511
- 0.03135785675048828,
512
- 0.0313702392578125,
513
- 0.03124224090576172,
514
- 0.031335424423217774,
515
- 0.031410175323486327,
516
- 0.031318016052246093,
517
- 0.031237119674682616,
518
- 0.03133132743835449,
519
- 0.03131603240966797,
520
- 0.03149920082092285,
521
- 0.03143475151062012,
522
- 0.03121561622619629,
523
- 0.031191135406494142,
524
- 0.031353759765625,
525
- 0.03117568016052246,
526
- 0.03140096092224121,
527
- 0.031197183609008788,
528
- 0.03138675117492676,
529
- 0.03128934478759766,
530
- 0.03129228782653808,
531
- 0.03122697639465332,
532
- 0.03134249687194824,
533
- 0.031243263244628908,
534
- 0.031325183868408206,
535
- 0.031266975402832034,
536
- 0.031735744476318356,
537
- 0.031108095169067384,
538
- 0.031227807998657226,
539
- 0.031226879119873048,
540
- 0.03131699180603027,
541
- 0.031193216323852538,
542
- 0.03119500732421875,
543
- 0.03114905548095703,
544
- 0.031247360229492187,
545
- 0.031246335983276367,
546
- 0.03127398490905762,
547
- 0.031188991546630858,
548
- 0.031346912384033206,
549
- 0.03125635147094727,
550
- 0.031246335983276367,
551
- 0.03161702346801758,
552
- 0.031275007247924806,
553
- 0.031247360229492187,
554
- 0.031252479553222655,
555
- 0.03118182373046875,
556
- 0.031357952117919925,
557
- 0.031491071701049804,
558
- 0.031278207778930665,
559
- 0.03130662345886231,
560
- 0.03129343986511231,
561
- 0.031297536849975584,
562
- 0.031488000869750975,
563
- 0.03136409568786621,
564
- 0.03142451286315918,
565
- 0.031235071182250978,
566
- 0.03139200019836426,
567
- 0.03126348876953125,
568
- 0.031302656173706055,
569
- 0.03136307144165039,
570
- 0.031306751251220705,
571
- 0.03138355255126953,
572
- 0.03128230476379395,
573
- 0.031282047271728515,
574
- 0.03132928085327148,
575
- 0.03146751976013184,
576
- 0.03129958343505859,
577
- 0.03135897636413574,
578
- 0.03149926376342774,
579
- 0.031355903625488284,
580
- 0.031303871154785154,
581
- 0.03134854316711426,
582
- 0.0315228157043457,
583
- 0.031514623641967776,
584
- 0.031440895080566404,
585
- 0.03134873580932617,
586
- 0.031437824249267575,
587
- 0.03158016014099121,
588
- 0.03133337593078613,
589
- 0.031355903625488284,
590
- 0.03144806480407715,
591
- 0.03137433624267578,
592
- 0.03132928085327148,
593
- 0.03141119956970215,
594
- 0.031409151077270506,
595
- 0.03141632080078125,
596
- 0.0313118724822998,
597
- 0.03138252830505371,
598
- 0.03140630340576172,
599
- 0.0314355525970459,
600
- 0.031634464263916015,
601
- 0.031334367752075196,
602
- 0.03129548835754394,
603
- 0.03127910423278808,
604
- 0.03140403175354004,
605
- 0.031453184127807614,
606
- 0.031369216918945314,
607
- 0.031410175323486327,
608
- 0.031438848495483396,
609
- 0.031357952117919925,
610
- 0.03142758369445801,
611
- 0.031409151077270506,
612
- 0.03131391906738281,
613
- 0.03129958343505859,
614
- 0.03136204719543457,
615
- 0.03145113563537598,
616
- 0.03151974487304687,
617
- 0.031474687576293944,
618
- 0.03139686393737793,
619
- 0.0314019832611084,
620
- 0.03139891242980957,
621
- 0.03144396781921387,
622
- 0.03158332824707031,
623
- 0.03150147247314453,
624
- 0.031518463134765626,
625
- 0.031384639739990235,
626
- 0.03139577674865723,
627
- 0.031474687576293944,
628
- 0.03165302467346191,
629
- 0.031514463424682615,
630
- 0.03150540733337402,
631
- 0.031480831146240236,
632
- 0.0316376953125,
633
- 0.03143046379089356,
634
- 0.031491071701049804,
635
- 0.0315361270904541,
636
- 0.03150643157958984,
637
- 0.0318403205871582,
638
- 0.031548351287841794,
639
- 0.03155046463012695,
640
- 0.031410175323486327,
641
- 0.03141427230834961,
642
- 0.03153919982910156,
643
- 0.031388671875,
644
- 0.03147267150878906,
645
- 0.031532064437866214,
646
- 0.03155449676513672,
647
- 0.03147980880737305,
648
- 0.031486976623535154,
649
- 0.03148185539245606,
650
- 0.03157423973083496,
651
- 0.031641504287719724,
652
- 0.03142848014831543,
653
- 0.03163443183898926,
654
- 0.03136819267272949,
655
- 0.03143270492553711,
656
- 0.03159974479675293,
657
- 0.03149606323242188,
658
- 0.031513599395751955,
659
- 0.03153305625915527,
660
- 0.03151897621154785,
661
- 0.03151337623596191,
662
- 0.03151459121704102,
663
- 0.03144112014770508,
664
- 0.03196291160583496,
665
- 0.031513599395751955,
666
- 0.03143680000305176,
667
- 0.031474687576293944,
668
- 0.03159449577331543,
669
- 0.031558656692504884,
670
- 0.03152076721191406,
671
- 0.031573152542114256,
672
- 0.03151753616333008,
673
- 0.03156070327758789,
674
- 0.03160902404785156,
675
- 0.03148268890380859,
676
- 0.03157119941711426,
677
- 0.031612672805786134,
678
- 0.031526912689208986,
679
- 0.031751167297363284,
680
- 0.031753215789794925,
681
- 0.03163462448120117,
682
- 0.0314714241027832,
683
- 0.0315043830871582,
684
- 0.03154431915283203,
685
- 0.03150028800964356,
686
- 0.031422464370727536,
687
- 0.03144704055786133,
688
- 0.031355903625488284,
689
- 0.031558656692504884,
690
- 0.03138355255126953,
691
- 0.03142348861694336,
692
- 0.03126067161560059,
693
- 0.03134873580932617,
694
- 0.03143680000305176,
695
- 0.03138559913635254,
696
- 0.03150460815429688,
697
- 0.031519519805908204,
698
- 0.03144601631164551,
699
- 0.031421440124511715,
700
- 0.03132825660705566,
701
- 0.03140505599975586,
702
- 0.031470592498779294,
703
- 0.03148595237731933,
704
- 0.03135385513305664,
705
- 0.03141632080078125,
706
- 0.03144499206542969,
707
- 0.031357952117919925,
708
- 0.03137868881225586,
709
- 0.03152767944335937,
710
- 0.03132928085327148,
711
- 0.03140505599975586,
712
- 0.03136000061035156,
713
- 0.031421440124511715,
714
- 0.031306751251220705,
715
- 0.0314071044921875,
716
- 0.03136511993408203,
717
- 0.03153817558288574,
718
- 0.0313384952545166,
719
- 0.03129651260375976,
720
- 0.031263744354248044,
721
- 0.031346912384033206,
722
- 0.031263519287109375,
723
- 0.03125555229187012,
724
- 0.031204351425170897,
725
- 0.03134259223937988,
726
- 0.03131814384460449,
727
- 0.03133017539978027,
728
- 0.0316866569519043,
729
- 0.03134873580932617,
730
- 0.031341567993164066,
731
- 0.03138559913635254,
732
- 0.03136511993408203,
733
- 0.03139379119873047,
734
- 0.03134771156311035,
735
- 0.03134464073181152,
736
- 0.03131091117858887,
737
- 0.031375295639038084,
738
- 0.031421440124511715,
739
- 0.031355903625488284,
740
- 0.03126681518554687,
741
- 0.03128755187988281,
742
- 0.03126860809326172,
743
- 0.03128217506408691,
744
- 0.03164159965515137,
745
- 0.031355903625488284
746
  ]
747
  },
748
  "throughput": {
749
  "unit": "tokens/s",
750
- "value": 31.838147730222477
751
  },
752
  "energy": null,
753
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 1087.24224,
6
  "max_vram": 6534.725632,
7
  "max_reserved": 6312.42752,
8
  "max_allocated": 6191.16288
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.055581806309315376,
13
+ "stdev": 0.00076348828430563,
14
  "values": [
15
+ 0.06490351867675781,
16
+ 0.05785599899291992,
17
+ 0.0582737922668457,
18
+ 0.05636608123779297,
19
+ 0.05612543869018555,
20
+ 0.05633638381958008,
21
+ 0.056554622650146484,
22
+ 0.05614694213867188,
23
+ 0.05634867095947266,
24
+ 0.05610700988769531,
25
+ 0.055670783996582034,
26
+ 0.05552640151977539,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
27
  0.055393280029296874,
28
+ 0.05532262420654297,
29
+ 0.05543936157226562,
30
+ 0.055298046112060545,
31
+ 0.05541580963134766,
32
+ 0.05536665725708008,
33
+ 0.05547724914550781,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
34
  0.05535539245605469,
35
+ 0.05541273498535156,
 
 
 
 
 
 
36
  0.05538918304443359,
37
+ 0.055452766418457033,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
38
  0.055398399353027344,
39
+ 0.05543833541870117,
40
+ 0.055430145263671876,
41
+ 0.05548659133911133,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
42
  0.055370750427246096,
43
+ 0.055444480895996094,
44
+ 0.05539337539672851,
45
+ 0.05545062255859375,
 
 
46
  0.05538611221313477,
47
+ 0.05544755172729492,
48
+ 0.05545471954345703,
49
+ 0.05544755172729492,
50
+ 0.0554967041015625,
51
+ 0.05545676803588867,
52
+ 0.05547126388549805,
53
+ 0.05547520065307617,
54
+ 0.05546393585205078,
55
+ 0.05545497512817383,
56
+ 0.05545676803588867,
57
+ 0.055462913513183595,
58
+ 0.055501823425292966,
59
+ 0.05545574569702148,
60
+ 0.05546700668334961,
61
+ 0.05546700668334961,
62
+ 0.05545471954345703,
63
+ 0.05544755172729492,
64
+ 0.05548339080810547,
65
+ 0.055458847045898436,
66
+ 0.05547417449951172,
67
+ 0.055428096771240234,
68
+ 0.05547110366821289,
69
+ 0.05546803283691406,
70
+ 0.055479297637939455,
71
+ 0.05545078277587891,
72
+ 0.055479297637939455,
73
+ 0.05547942352294922,
74
+ 0.05545574569702148,
75
+ 0.05547212982177734,
76
+ 0.05544038391113281,
77
+ 0.05545676803588867,
78
+ 0.0554700813293457,
79
+ 0.055444480895996094,
80
+ 0.05547520065307617,
81
+ 0.05546720123291016,
82
+ 0.05545676803588867,
83
+ 0.05544550323486328,
84
+ 0.05546803283691406,
85
+ 0.05545676803588867,
86
+ 0.05546393585205078,
87
+ 0.055449600219726565,
88
+ 0.05548031997680664,
89
+ 0.05546188735961914,
90
+ 0.05548339080810547,
91
+ 0.05545881652832031,
92
+ 0.05545267105102539,
93
+ 0.0554516487121582,
94
+ 0.05548550415039062,
95
+ 0.05545471954345703,
96
+ 0.05547110366821289,
97
+ 0.055435359954833986,
98
+ 0.055456928253173825,
99
+ 0.05545881652832031,
100
+ 0.05546188735961914,
101
+ 0.05546495819091797,
102
+ 0.05547724914550781,
103
+ 0.05548646545410156,
104
+ 0.055478271484375,
105
+ 0.0554598388671875,
106
+ 0.05545369720458984,
107
+ 0.05544755172729492,
108
+ 0.05547110366821289,
109
+ 0.05546700668334961,
110
+ 0.055482368469238284,
111
+ 0.05549798583984375,
112
+ 0.055479297637939455,
113
+ 0.05545267105102539,
114
+ 0.05543731307983398,
115
+ 0.05544038391113281,
116
+ 0.05547724914550781,
117
+ 0.05543936157226562,
118
+ 0.055465984344482425,
119
+ 0.055431167602539064,
120
+ 0.055462913513183595,
121
+ 0.055419998168945314,
122
+ 0.05547110366821289,
123
+ 0.055444480895996094,
124
+ 0.05549772644042969,
125
+ 0.05552864074707031,
126
+ 0.05546700668334961,
127
+ 0.05546710586547852,
128
+ 0.05546495819091797,
129
+ 0.055462913513183595,
130
+ 0.05547622299194336,
131
+ 0.05547110366821289,
132
+ 0.0555335693359375,
133
+ 0.055488510131835936,
134
+ 0.05580492782592773,
135
+ 0.05545273590087891,
136
+ 0.05545779037475586,
137
+ 0.05544345474243164,
138
+ 0.055521278381347655,
139
+ 0.05551001739501953,
140
+ 0.05551308822631836,
141
+ 0.05549055862426758,
142
+ 0.05548953628540039,
143
+ 0.05546915054321289,
144
+ 0.05548137664794922,
145
+ 0.05546905517578125,
146
+ 0.05549260711669922,
147
+ 0.05547417449951172,
148
+ 0.055512065887451174,
149
+ 0.055465984344482425,
150
+ 0.05554585647583008,
151
+ 0.05546495819091797,
152
+ 0.05549465560913086,
153
+ 0.05548134231567383,
154
+ 0.05551513671875,
155
+ 0.05575065612792969,
156
+ 0.05548543930053711,
157
+ 0.055488510131835936,
158
+ 0.05551103973388672,
159
+ 0.05545062255859375,
160
+ 0.05548646545410156,
161
+ 0.05545779037475586,
162
+ 0.05548543930053711,
163
+ 0.055474433898925785,
164
+ 0.055477470397949216,
165
+ 0.05547622299194336,
166
+ 0.05549260711669922,
167
+ 0.05548134231567383,
168
+ 0.055495681762695315,
169
+ 0.055446529388427736,
170
+ 0.055482368469238284,
171
+ 0.05547417449951172,
172
+ 0.05550899124145508,
173
+ 0.0554967041015625,
174
+ 0.05549158477783203,
175
+ 0.05548953628540039,
176
+ 0.05548748779296875,
177
+ 0.05547212982177734,
178
+ 0.055478271484375,
179
+ 0.05547622299194336,
180
+ 0.05549363327026367,
181
+ 0.055479297637939455,
182
+ 0.05548441696166992,
183
+ 0.05547622299194336,
184
+ 0.0554967041015625,
185
+ 0.055444480895996094,
186
+ 0.055478271484375,
187
+ 0.055479297637939455,
188
+ 0.05547542572021484,
189
+ 0.05551923370361328,
190
+ 0.0554700813293457,
191
+ 0.05545267105102539,
192
+ 0.05548441696166992,
193
+ 0.05545574569702148,
194
+ 0.055501823425292966,
195
+ 0.05545369720458984
196
  ]
197
  },
198
  "throughput": {
199
  "unit": "tokens/s",
200
+ "value": 4605.8236858181235
201
  },
202
  "energy": null,
203
  "efficiency": null
 
205
  "decode": {
206
  "memory": {
207
  "unit": "MB",
208
+ "max_ram": 1087.24224,
209
  "max_vram": 7212.105728,
210
  "max_reserved": 6727.663616,
211
  "max_allocated": 6570.75456
212
  },
213
  "latency": {
214
  "unit": "s",
215
+ "mean": 8.930721275329589,
216
+ "stdev": 0.011337223052979795,
217
  "values": [
218
+ 8.942058498382568,
219
+ 8.919384052276609
220
  ]
221
  },
222
  "throughput": {
223
  "unit": "tokens/s",
224
+ "value": 28.553124897584404
225
  },
226
  "energy": null,
227
  "efficiency": null
 
230
  "memory": null,
231
  "latency": {
232
  "unit": "s",
233
+ "mean": 0.035022436373841524,
234
+ "stdev": 0.00043531219846223377,
235
  "values": [
236
+ 0.03505152130126953,
237
+ 0.034987071990966796,
238
+ 0.03497260665893555,
239
+ 0.03494297790527344,
240
+ 0.03500236892700195,
241
+ 0.03491852951049805,
242
+ 0.035028865814208984,
243
+ 0.03506175994873047,
244
+ 0.03483647918701172,
245
+ 0.03494297790527344,
246
+ 0.03506073760986328,
247
+ 0.03512319946289062,
248
+ 0.035130367279052735,
249
+ 0.03506175994873047,
250
+ 0.0350013427734375,
251
+ 0.03515596771240234,
252
+ 0.03501465606689453,
253
+ 0.03498188781738281,
254
+ 0.03513446426391602,
255
+ 0.03509145736694336,
256
+ 0.03503411102294922,
257
+ 0.03522150421142578,
258
+ 0.03497574234008789,
259
+ 0.03497702407836914,
260
+ 0.03503897476196289,
261
+ 0.03506905746459961,
262
+ 0.03493977737426758,
263
+ 0.035097599029541016,
264
+ 0.03499724960327148,
265
+ 0.03495638275146484,
266
+ 0.03491420745849609,
267
+ 0.03488060760498047,
268
+ 0.03513436889648437,
269
+ 0.03503020858764649,
270
+ 0.03503494262695313,
271
+ 0.03506687927246094,
272
+ 0.03499520111083984,
273
+ 0.03494604873657227,
274
+ 0.034939903259277344,
275
+ 0.03493273544311523,
276
+ 0.035095550537109374,
277
+ 0.03499008178710938,
278
+ 0.03514470291137695,
279
+ 0.03502284622192383,
280
+ 0.03500236892700195,
281
+ 0.03507001495361328,
282
+ 0.035116992950439456,
283
+ 0.03501260757446289,
284
+ 0.03496550369262695,
285
+ 0.034931713104248044,
286
+ 0.034974720001220705,
287
+ 0.03488460922241211,
288
+ 0.034938880920410156,
289
+ 0.03496345520019531,
290
+ 0.034994174957275394,
291
+ 0.035127296447753906,
292
+ 0.03504127883911133,
293
+ 0.035135486602783206,
294
+ 0.0350904312133789,
295
+ 0.034955265045166016,
296
+ 0.0349224967956543,
297
+ 0.03502489471435547,
298
+ 0.03495423889160156,
299
+ 0.03506687927246094,
300
+ 0.03495423889160156,
301
+ 0.03498905563354492,
302
+ 0.035004417419433595,
303
+ 0.034915328979492184,
304
+ 0.03508224105834961,
305
+ 0.03495423889160156,
306
+ 0.03500032043457031,
307
+ 0.03495219039916992,
308
+ 0.0348671989440918,
309
+ 0.03495017623901367,
310
+ 0.034881504058837894,
311
+ 0.03498393630981445,
312
+ 0.034915328979492184,
313
+ 0.03497881698608398,
314
+ 0.03477503967285156,
315
+ 0.03500339126586914,
316
+ 0.034909183502197266,
317
+ 0.03487539291381836,
318
+ 0.03487846374511719,
319
+ 0.03490611267089844,
320
+ 0.03488256072998047,
321
+ 0.034977790832519534,
322
+ 0.03502592086791992,
323
+ 0.03500851058959961,
324
+ 0.034931713104248044,
325
+ 0.03503104019165039,
326
+ 0.034852863311767575,
327
+ 0.035043327331542966,
328
+ 0.0350115852355957,
329
+ 0.03500851058959961,
330
+ 0.03483852767944336,
331
+ 0.03495935821533203,
332
+ 0.03499008178710938,
333
+ 0.034938880920410156,
334
+ 0.035094528198242186,
335
+ 0.035097599029541016,
336
+ 0.034909183502197266,
337
+ 0.03497983932495117,
338
+ 0.035020801544189455,
339
+ 0.03491430282592774,
340
+ 0.03491020965576172,
341
+ 0.03493180847167969,
342
+ 0.03499715042114258,
343
+ 0.03510784149169922,
344
+ 0.0350013427734375,
345
+ 0.03496550369262695,
346
+ 0.03499520111083984,
347
+ 0.03496755218505859,
348
+ 0.03497369766235352,
349
+ 0.034977790832519534,
350
+ 0.034991104125976565,
351
+ 0.03511705780029297,
352
+ 0.034920448303222655,
353
+ 0.034969600677490234,
354
+ 0.035043327331542966,
355
+ 0.034966529846191405,
356
+ 0.03498188781738281,
357
+ 0.03505459213256836,
358
+ 0.0350382080078125,
359
+ 0.03498086547851562,
360
+ 0.03494604873657227,
361
+ 0.035135486602783206,
362
+ 0.034912254333496096,
363
+ 0.03516211318969727,
364
+ 0.035062782287597655,
365
+ 0.03510476684570313,
366
+ 0.035093505859375,
367
+ 0.035163135528564454,
368
+ 0.034976768493652347,
369
+ 0.03499827194213867,
370
+ 0.03505459213256836,
371
+ 0.03504230499267578,
372
+ 0.03501567840576172,
373
+ 0.03522150421142578,
374
+ 0.035181568145751956,
375
+ 0.03508224105834961,
376
+ 0.03504947280883789,
377
+ 0.034966529846191405,
378
+ 0.03508531188964844,
379
+ 0.03505049514770508,
380
+ 0.034988033294677735,
381
+ 0.034923519134521484,
382
+ 0.03495935821533203,
383
+ 0.03496857452392578,
384
+ 0.03495219039916992,
385
+ 0.03504230499267578,
386
+ 0.035043327331542966,
387
+ 0.03505766296386719,
388
+ 0.03511500930786133,
389
+ 0.03504947280883789,
390
+ 0.035149822235107424,
391
+ 0.03508736038208008,
392
+ 0.035053569793701174,
393
+ 0.03502489471435547,
394
+ 0.03500032043457031,
395
+ 0.03501363372802734,
396
+ 0.03500851058959961,
397
+ 0.03506892776489258,
398
+ 0.03511603164672852,
399
+ 0.03499929428100586,
400
+ 0.035135486602783206,
401
+ 0.03500851058959961,
402
+ 0.035089408874511716,
403
+ 0.035130367279052735,
404
+ 0.03501670455932617,
405
+ 0.035026943206787106,
406
+ 0.035076095581054685,
407
+ 0.03495116806030273,
408
+ 0.035053569793701174,
409
+ 0.03510681533813476,
410
+ 0.03497267150878906,
411
+ 0.03500236892700195,
412
+ 0.034988033294677735,
413
+ 0.034988033294677735,
414
+ 0.03505254364013672,
415
+ 0.035023872375488284,
416
+ 0.03505868911743164,
417
+ 0.03502284622192383,
418
+ 0.034902015686035154,
419
+ 0.034985984802246094,
420
+ 0.03500543975830078,
421
+ 0.03501670455932617,
422
+ 0.035023872375488284,
423
+ 0.03489689636230469,
424
+ 0.034953216552734374,
425
+ 0.03491328048706055,
426
+ 0.03490508651733398,
427
+ 0.03505152130126953,
428
+ 0.03482316970825195,
429
+ 0.034912254333496096,
430
+ 0.03503615951538086,
431
+ 0.03497062301635742,
432
+ 0.03499008178710938,
433
+ 0.034920448303222655,
434
+ 0.034928638458251955,
435
+ 0.03516928100585937,
436
+ 0.0349409294128418,
437
+ 0.035004478454589844,
438
+ 0.03496441650390625,
439
+ 0.03495423889160156,
440
+ 0.03502284622192383,
441
+ 0.03504435348510742,
442
+ 0.034887680053710936,
443
+ 0.03502182388305664,
444
+ 0.03483852767944336,
445
+ 0.03499827194213867,
446
+ 0.03497574234008789,
447
+ 0.0351539192199707,
448
+ 0.0350013427734375,
449
+ 0.035130367279052735,
450
+ 0.035097599029541016,
451
+ 0.03515084838867188,
452
+ 0.034941951751708986,
453
+ 0.0350750732421875,
454
+ 0.03508224105834961,
455
+ 0.03505049514770508,
456
+ 0.03502284622192383,
457
+ 0.03693260955810547,
458
+ 0.03824947357177735,
459
+ 0.039553024291992187,
460
+ 0.03717529678344727,
461
+ 0.03567308807373047,
462
+ 0.0354150390625,
463
+ 0.03525734329223633,
464
+ 0.035119102478027346,
465
+ 0.035269630432128905,
466
+ 0.035318782806396484,
467
+ 0.03530137634277344,
468
+ 0.03519692611694336,
469
+ 0.03510067367553711,
470
+ 0.03502284622192383,
471
+ 0.03520716857910156,
472
+ 0.03528704071044922,
473
+ 0.035143680572509765,
474
+ 0.035122177124023435,
475
+ 0.03504127883911133,
476
+ 0.03506585693359375,
477
+ 0.03507814407348633,
478
+ 0.03493273544311523,
479
+ 0.03501055908203125,
480
+ 0.035004417419433595,
481
+ 0.03496243286132812,
482
+ 0.03496857452392578,
483
+ 0.034917377471923826,
484
+ 0.0349194221496582,
485
+ 0.035059711456298825,
486
+ 0.035105792999267575,
487
+ 0.035020801544189455,
488
+ 0.03492659378051758,
489
+ 0.03497369766235352,
490
+ 0.03503513717651367,
491
+ 0.03499724960327148,
492
+ 0.034872318267822264,
493
+ 0.034748416900634765,
494
+ 0.03489484786987305,
495
+ 0.03474943923950195,
496
+ 0.03486003112792969,
497
+ 0.034928638458251955,
498
+ 0.03489689636230469,
499
+ 0.034769920349121096,
500
+ 0.03482726287841797,
501
+ 0.03479654312133789,
502
+ 0.0348671989440918,
503
+ 0.03494911956787109,
504
+ 0.03494604873657227,
505
+ 0.03483750534057617,
506
+ 0.03498495864868164,
507
+ 0.0348037109375,
508
+ 0.03489996719360351,
509
+ 0.034857982635498046,
510
+ 0.03482316970825195,
511
+ 0.034770942687988284,
512
+ 0.03486521530151367,
513
+ 0.03498899078369141,
514
+ 0.03487558364868164,
515
+ 0.034820926666259765,
516
+ 0.03488972854614258,
517
+ 0.03468185424804687,
518
+ 0.034958335876464845,
519
+ 0.03502899169921875,
520
+ 0.0350300178527832,
521
+ 0.03497574234008789,
522
+ 0.034993152618408206,
523
+ 0.03490611267089844,
524
+ 0.03495219039916992,
525
+ 0.03488358306884766,
526
+ 0.03494400024414063,
527
+ 0.03496345520019531,
528
+ 0.03502592086791992,
529
+ 0.03488870239257812,
530
+ 0.034902015686035154,
531
+ 0.03487744140625,
532
+ 0.03511808013916016,
533
+ 0.03481702423095703,
534
+ 0.03487846374511719,
535
+ 0.034802688598632815,
536
+ 0.03506687927246094,
537
+ 0.03501567840576172,
538
+ 0.035079166412353514,
539
+ 0.034895870208740236,
540
+ 0.034791488647460934,
541
+ 0.03482515335083008,
542
+ 0.034904064178466795,
543
+ 0.034936832427978515,
544
+ 0.03480678558349609,
545
+ 0.034909183502197266,
546
+ 0.03496038436889649,
547
+ 0.03492659378051758,
548
+ 0.034985984802246094,
549
+ 0.0349306869506836,
550
+ 0.03484672164916992,
551
+ 0.03488153457641602,
552
+ 0.03507712173461914,
553
+ 0.03500646209716797,
554
+ 0.03494400024414063,
555
+ 0.03484569549560547,
556
+ 0.03499212646484375,
557
+ 0.034895870208740236,
558
+ 0.03485184097290039,
559
+ 0.034938880920410156,
560
+ 0.03496857452392578,
561
+ 0.03496345520019531,
562
+ 0.034961406707763674,
563
+ 0.03502492904663086,
564
+ 0.034938846588134766,
565
+ 0.03502489471435547,
566
+ 0.03510988616943359,
567
+ 0.03501875305175781,
568
+ 0.04081459045410156,
569
+ 0.03914547348022461,
570
+ 0.035097599029541016,
571
+ 0.03495935821533203,
572
+ 0.03486310577392578,
573
+ 0.03482316970825195,
574
+ 0.034953216552734374,
575
+ 0.0349194221496582,
576
+ 0.034969600677490234,
577
+ 0.03508633422851563,
578
+ 0.03483647918701172,
579
+ 0.03484467315673828,
580
+ 0.03504032135009766,
581
+ 0.03505145645141602,
582
+ 0.034909183502197266,
583
+ 0.0349194221496582,
584
+ 0.03480473709106445,
585
+ 0.034917377471923826,
586
+ 0.03489177703857422,
587
+ 0.034740222930908206,
588
+ 0.034956287384033204,
589
+ 0.03502284622192383,
590
+ 0.03497881698608398,
591
+ 0.034857982635498046,
592
+ 0.03485696029663086,
593
+ 0.03504537582397461,
594
+ 0.03474227142333984,
595
+ 0.03500646209716797,
596
+ 0.03493596649169922,
597
+ 0.035028831481933594,
598
+ 0.03497881698608398,
599
+ 0.034923519134521484,
600
+ 0.03490611267089844,
601
+ 0.03483852767944336,
602
+ 0.03483750534057617,
603
+ 0.03500339126586914,
604
+ 0.03495423889160156,
605
+ 0.03489177703857422,
606
+ 0.03496550369262695,
607
+ 0.03490816116333008,
608
+ 0.034841598510742186,
609
+ 0.034751487731933595,
610
+ 0.03488256072998047,
611
+ 0.0348590087890625,
612
+ 0.03479347229003906,
613
+ 0.034735103607177735,
614
+ 0.03480985641479492,
615
+ 0.03475763320922851,
616
+ 0.03490816116333008,
617
+ 0.03486515045166016,
618
+ 0.03473715209960938,
619
+ 0.034958335876464845,
620
+ 0.03482931137084961,
621
+ 0.03489382553100586,
622
+ 0.03506175994873047,
623
+ 0.03500236892700195,
624
+ 0.0351723518371582,
625
+ 0.03492966461181641,
626
+ 0.03502899169921875,
627
+ 0.034938880920410156,
628
+ 0.03499724960327148,
629
+ 0.03502899169921875,
630
+ 0.03492966461181641,
631
+ 0.034936832427978515,
632
+ 0.03495935821533203,
633
+ 0.034874366760253905,
634
+ 0.03504844665527344,
635
+ 0.035151870727539065,
636
+ 0.034939903259277344,
637
+ 0.03502796936035156,
638
+ 0.03499827194213867,
639
+ 0.035043327331542966,
640
+ 0.0349409294128418,
641
+ 0.03505049514770508,
642
+ 0.035056640625,
643
+ 0.03490816116333008,
644
+ 0.0350750732421875,
645
+ 0.03493580627441406,
646
+ 0.034925567626953126,
647
+ 0.03503411102294922,
648
+ 0.03502899169921875,
649
+ 0.03525939178466797,
650
+ 0.035007488250732424,
651
+ 0.035171329498291014,
652
+ 0.035160064697265625,
653
+ 0.035124225616455076,
654
+ 0.03506687927246094,
655
+ 0.03497983932495117,
656
+ 0.034958335876464845,
657
+ 0.03502592086791992,
658
+ 0.035194881439208986,
659
+ 0.03497881698608398,
660
+ 0.03514572906494141,
661
+ 0.035060768127441404,
662
+ 0.035085281372070315,
663
+ 0.03511808013916016,
664
+ 0.03515289688110351,
665
+ 0.035095550537109374,
666
+ 0.03506892776489258,
667
+ 0.03501055908203125,
668
+ 0.0350013427734375,
669
+ 0.035020801544189455,
670
+ 0.035064830780029296,
671
+ 0.03501055908203125,
672
+ 0.035062782287597655,
673
+ 0.03500543975830078,
674
+ 0.035076095581054685,
675
+ 0.0350115852355957,
676
+ 0.03504537582397461,
677
+ 0.03506585693359375,
678
+ 0.03505868911743164,
679
+ 0.035007488250732424,
680
+ 0.035156993865966796,
681
+ 0.03500339126586914,
682
+ 0.03506073760986328,
683
+ 0.03489177703857422,
684
+ 0.034966529846191405,
685
+ 0.03495731353759766,
686
+ 0.03489894485473633,
687
+ 0.03504127883911133,
688
+ 0.03490828704833984,
689
+ 0.03490598297119141,
690
+ 0.03493273544311523,
691
+ 0.03496448135375976,
692
+ 0.034941951751708986,
693
+ 0.035043327331542966,
694
+ 0.03484774398803711,
695
+ 0.034994174957275394,
696
+ 0.03484979248046875,
697
+ 0.03488051223754883,
698
+ 0.03491839981079101,
699
+ 0.03488153457641602,
700
+ 0.03482112121582031,
701
+ 0.034700286865234374,
702
+ 0.034974720001220705,
703
+ 0.0350300178527832,
704
+ 0.03492473602294922,
705
+ 0.034847553253173826,
706
+ 0.03484672164916992,
707
+ 0.03494911956787109,
708
+ 0.034863231658935546,
709
+ 0.03501350402832031,
710
+ 0.03488358306884766,
711
+ 0.0348037109375,
712
+ 0.03479040145874023,
713
+ 0.03499520111083984,
714
+ 0.03484569549560547,
715
+ 0.034900993347167966,
716
+ 0.03499724960327148,
717
+ 0.034825214385986326,
718
+ 0.03478015899658203,
719
+ 0.034902015686035154,
720
+ 0.034872318267822264,
721
+ 0.03481087875366211,
722
+ 0.034799617767333986,
723
+ 0.034985984802246094,
724
+ 0.03480985641479492,
725
+ 0.03489484786987305,
726
+ 0.034841598510742186,
727
+ 0.03484262466430664,
728
+ 0.03499520111083984,
729
+ 0.034939903259277344,
730
+ 0.03485184097290039,
731
+ 0.03498188781738281,
732
+ 0.03503411102294922,
733
+ 0.034840576171875,
734
+ 0.03491430282592774,
735
+ 0.034854911804199216,
736
+ 0.03480902481079102,
737
+ 0.03493462371826172,
738
+ 0.034914272308349606,
739
+ 0.03498700714111328,
740
+ 0.03498086547851562,
741
+ 0.034925567626953126,
742
+ 0.03484467315673828,
743
+ 0.034871295928955076,
744
+ 0.034871295928955076,
745
+ 0.034786304473876956
746
  ]
747
  },
748
  "throughput": {
749
  "unit": "tokens/s",
750
+ "value": 28.5531248975844
751
  },
752
  "energy": null,
753
  "efficiency": null