kreas commited on
Commit
2b319fd
1 Parent(s): 90a430e

Upload /Mistral-7B-v0.1-GPTQ-2bit/gptq2bit_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Mistral-7B-v0.1-GPTQ-2bit/gptq2bit_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,86 +2,86 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 4916.57216,
6
  "max_vram": 3894.411264,
7
  "max_reserved": 3409.969152,
8
  "max_allocated": 3289.072128
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.1552674811730018,
13
- "stdev": 0.000814409700089198,
14
  "values": [
15
- 0.16154566955566407,
16
- 0.1562265625,
17
- 0.1552752685546875,
18
- 0.1549291534423828,
19
- 0.15519129943847657,
20
- 0.15499078369140626,
21
- 0.15516058349609374,
22
- 0.15486976623535156,
23
- 0.15526296997070313,
24
- 0.1549055938720703,
25
- 0.15521382141113282,
26
- 0.15493426513671876,
27
- 0.15539814758300782,
28
- 0.15493734741210938,
29
- 0.15524659729003906,
30
- 0.1549496307373047,
31
- 0.1552506866455078,
32
- 0.15494554138183594,
33
- 0.15522918701171876,
34
- 0.15492813110351564,
35
  0.15518821716308595,
36
- 0.15490867614746093,
37
- 0.1552496643066406,
38
- 0.15493043518066407,
39
- 0.15528038024902344,
40
- 0.15494554138183594,
41
- 0.15518515014648437,
42
- 0.15499798583984375,
43
- 0.15519129943847657,
44
- 0.1548904571533203,
45
- 0.15522816467285155,
46
- 0.1549311981201172,
47
- 0.15524453735351562,
48
- 0.1549322204589844,
49
- 0.15524668884277343,
50
- 0.15496397399902342,
51
- 0.15528550720214843,
52
- 0.15506031799316405,
53
- 0.1553684844970703,
54
- 0.15508070373535157,
55
- 0.15539814758300782,
56
- 0.15505101013183595,
57
- 0.1553500213623047,
58
- 0.15511859130859376,
59
- 0.15532952880859374,
60
- 0.1551134796142578,
61
- 0.15538380432128907,
62
- 0.15508685302734376,
63
- 0.15541964721679688,
64
- 0.15504179382324218,
65
- 0.15532850646972657,
66
- 0.15507661437988282,
67
- 0.15537458801269532,
68
- 0.15504179382324218,
69
- 0.15536947631835937,
70
- 0.15507673645019532,
71
- 0.15536026000976563,
72
- 0.15503155517578124,
73
- 0.15561830139160157,
74
- 0.15505229187011718,
75
- 0.15538893127441405,
76
- 0.15507661437988282,
77
- 0.15533465576171876,
78
- 0.1550786590576172,
79
- 0.15538380432128907
 
 
 
 
 
 
 
 
 
 
 
 
 
 
80
  ]
81
  },
82
  "throughput": {
83
  "unit": "tokens/s",
84
- "value": 1648.767649645583
85
  },
86
  "energy": null,
87
  "efficiency": null
@@ -89,23 +89,23 @@
89
  "decode": {
90
  "memory": {
91
  "unit": "MB",
92
- "max_ram": 4918.669312,
93
- "max_vram": 4045.406208,
94
  "max_reserved": 3563.061248,
95
  "max_allocated": 3355.39968
96
  },
97
  "latency": {
98
  "unit": "s",
99
- "mean": 8.150193651199341,
100
- "stdev": 0.0013184185028123352,
101
  "values": [
102
- 8.148875232696529,
103
- 8.151512069702154
104
  ]
105
  },
106
  "throughput": {
107
  "unit": "tokens/s",
108
- "value": 31.287600137264896
109
  },
110
  "energy": null,
111
  "efficiency": null
@@ -114,524 +114,524 @@
114
  "memory": null,
115
  "latency": {
116
  "unit": "s",
117
- "mean": 0.0319615437301935,
118
- "stdev": 0.0002464774699415256,
119
  "values": [
120
- 0.03496579360961914,
121
- 0.03364217758178711,
122
- 0.03199488067626953,
123
- 0.03208703994750976,
124
- 0.03205120086669922,
125
- 0.03206860733032227,
126
- 0.03200204849243164,
127
- 0.032130046844482424,
128
- 0.031955968856811526,
129
- 0.03192934417724609,
130
- 0.03199692726135254,
131
- 0.031903743743896484,
132
- 0.03201638412475586,
133
- 0.031971328735351565,
134
- 0.03199385643005371,
135
- 0.032161792755126956,
136
- 0.031975519180297854,
137
- 0.03192207908630371,
138
- 0.031954944610595705,
139
- 0.03193139266967773,
140
- 0.03228364944458008,
141
- 0.03205017471313477,
142
- 0.03191705513000488,
143
- 0.032080894470214845,
144
- 0.03193343925476074,
145
- 0.032020481109619144,
146
- 0.03196416091918945,
147
- 0.03199692726135254,
148
- 0.03193548774719238,
149
- 0.03189760017395019,
150
- 0.03180764770507812,
151
- 0.032000862121582034,
152
- 0.03197235107421875,
153
- 0.03189145660400391,
154
- 0.03186175918579102,
155
- 0.03189248085021973,
156
- 0.03192527961730957,
157
- 0.03191087913513184,
158
- 0.03202867126464844,
159
- 0.03201536178588867,
160
- 0.03196313667297363,
161
- 0.03194879913330078,
162
- 0.03206655883789063,
163
  0.03184025573730469,
164
- 0.031955968856811526,
165
- 0.03192831993103027,
166
- 0.03196928024291992,
167
- 0.03203276824951172,
168
- 0.03192934417724609,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
169
  0.03184332847595215,
170
- 0.03178188705444336,
171
- 0.03177369689941406,
172
- 0.031884288787841795,
173
- 0.031764480590820314,
174
- 0.03179929542541504,
175
- 0.03197747230529785,
176
- 0.031867904663085936,
177
- 0.03191500854492187,
178
- 0.03190681648254395,
179
- 0.03181875228881836,
180
- 0.03200204849243164,
181
- 0.03190784072875977,
182
- 0.031818784713745114,
183
- 0.031791072845458984,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
184
  0.0317890567779541,
185
- 0.03187609672546387,
186
- 0.03196006393432617,
187
- 0.0319682559967041,
188
- 0.03184639930725098,
189
- 0.03184435272216797,
 
190
  0.03179110336303711,
191
- 0.031927295684814457,
192
- 0.03189043235778809,
193
- 0.031866880416870115,
194
- 0.031865856170654294,
195
- 0.03193036842346191,
196
- 0.03189657592773437,
197
- 0.031893503189086916,
198
- 0.032148479461669925,
199
- 0.03196723175048828,
200
- 0.03183206367492676,
201
- 0.03192422485351563,
202
- 0.03196620750427246,
203
- 0.031849472045898435,
204
- 0.03164672088623047,
205
- 0.03263488006591797,
206
- 0.033258495330810545,
207
- 0.0319866886138916,
208
- 0.03193343925476074,
209
- 0.031835136413574217,
210
- 0.03181977653503418,
211
- 0.03187814331054688,
212
- 0.03180031967163086,
213
- 0.03180646324157715,
214
- 0.031851520538330076,
215
- 0.03191296005249023,
216
- 0.03172966384887695,
217
- 0.031884288787841795,
218
- 0.03186278343200684,
219
- 0.031939584732055666,
220
  0.03172761535644531,
221
- 0.031870975494384765,
222
- 0.03182694435119629,
223
- 0.03199283218383789,
224
- 0.03191500854492187,
225
- 0.031916032791137694,
 
 
 
 
 
 
 
 
226
  0.031833087921142575,
227
- 0.031920127868652344,
228
- 0.033754112243652344,
229
- 0.03198259162902832,
230
- 0.03187814331054688,
231
- 0.03202867126464844,
232
- 0.031821823120117186,
233
- 0.03196928024291992,
234
- 0.031888383865356446,
235
- 0.031921152114868165,
236
- 0.031982656478881835,
237
- 0.031908800125122073,
238
- 0.03188531112670898,
239
- 0.03187609672546387,
240
- 0.03179724884033203,
241
- 0.031888383865356446,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
242
  0.03181670379638672,
243
- 0.031941631317138675,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
244
  0.03173990440368652,
245
- 0.03186483192443847,
246
- 0.03181363105773926,
247
- 0.03188121604919433,
248
- 0.03221913528442383,
249
- 0.03183718490600586,
250
- 0.032008190155029294,
251
- 0.03201744079589844,
252
- 0.0319579849243164,
253
- 0.031923200607299806,
254
- 0.032020481109619144,
255
- 0.03189043235778809,
256
- 0.0319815673828125,
257
- 0.031920127868652344,
258
- 0.031959039688110355,
259
- 0.03194470405578613,
260
- 0.03191705513000488,
261
- 0.03198361587524414,
262
- 0.031886335372924804,
263
- 0.031932416915893554,
264
- 0.031942655563354495,
265
- 0.031854591369628905,
266
- 0.031764480590820314,
267
- 0.03184639930725098,
268
- 0.03219558334350586,
269
- 0.0319109115600586,
270
- 0.031869951248168944,
271
- 0.031920127868652344,
272
- 0.03184537506103516,
273
- 0.03195187187194824,
274
- 0.03175935935974121,
275
- 0.031854591369628905,
276
- 0.03183718490600586,
277
- 0.03190784072875977,
278
- 0.03183616065979004,
279
- 0.03187711906433106,
280
  0.03177164840698242,
281
- 0.031867904663085936,
 
 
 
 
 
 
 
 
 
 
282
  0.03180953598022461,
283
- 0.031850496292114255,
284
- 0.03179315185546875,
285
- 0.031870975494384765,
286
- 0.03191398429870605,
287
- 0.03185663986206055,
288
  0.03184332847595215,
289
- 0.031904767990112305,
290
- 0.031866880416870115,
291
- 0.0319682559967041,
292
- 0.03232767868041992,
293
- 0.03202150344848633,
294
- 0.03200614547729492,
295
- 0.0319498233795166,
296
- 0.032048126220703126,
297
- 0.03198259162902832,
298
- 0.031987712860107424,
299
- 0.03204204940795898,
300
- 0.03198867225646972,
301
- 0.03195187187194824,
302
- 0.032008190155029294,
303
- 0.031936511993408204,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
304
  0.03160371208190918,
305
- 0.03188640022277832,
306
- 0.03198150444030762,
307
- 0.03198566436767578,
308
- 0.03197952079772949,
309
- 0.03203071975708008,
310
- 0.031954944610595705,
311
- 0.031941631317138675,
312
- 0.031764480590820314,
313
- 0.03193343925476074,
314
- 0.03193548774719238,
315
- 0.03199897575378418,
316
- 0.031922176361083986,
317
- 0.03193036842346191,
318
- 0.03195084762573242,
319
- 0.031884288787841795,
320
- 0.03242496109008789,
321
- 0.03191705513000488,
322
- 0.03189657592773437,
323
- 0.031889408111572266,
324
- 0.031958015441894534,
325
- 0.03190784072875977,
326
- 0.03193446350097656,
327
- 0.03192831993103027,
328
- 0.03184639930725098,
329
- 0.031922176361083986,
330
- 0.03191910362243652,
331
- 0.03194777679443359,
332
- 0.03188531112670898,
333
- 0.03191296005249023,
334
- 0.031927295684814457,
335
- 0.03195187187194824,
336
- 0.0319180793762207,
337
- 0.03196006393432617,
338
- 0.0318525447845459,
339
  0.03188019180297851,
340
- 0.031908863067626955,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
341
  0.03182387161254883,
342
- 0.03177471923828125,
343
- 0.032023551940917966,
344
- 0.0319498233795166,
345
- 0.03194367980957031,
346
- 0.03183718490600586,
347
- 0.03186892890930176,
348
- 0.031908863067626955,
349
- 0.03203276824951172,
350
- 0.031987712860107424,
351
- 0.03197952079772949,
352
- 0.032538623809814454,
353
- 0.03212492752075195,
354
- 0.0320819206237793,
355
- 0.03197644805908203,
356
- 0.03187814331054688,
357
- 0.03202560043334961,
358
- 0.03204608154296875,
359
- 0.03200102233886719,
360
- 0.031955968856811526,
361
- 0.03203071975708008,
362
  0.03177881622314453,
363
- 0.03189760017395019,
364
- 0.031886335372924804,
365
- 0.03203071975708008,
366
- 0.032010238647460935,
367
- 0.0317706241607666,
368
- 0.03150131225585937,
369
- 0.03219251251220703,
370
- 0.03197849655151367,
371
- 0.03163955116271973,
372
- 0.03148902320861816,
373
- 0.03180544090270996,
374
- 0.03160268783569336,
375
- 0.032355422973632815,
376
- 0.032312225341796875,
377
- 0.03195084762573242,
378
- 0.03204198455810547,
379
- 0.03193036842346191,
380
- 0.03192422485351563,
381
- 0.03197644805908203,
382
- 0.03200204849243164,
383
- 0.031867904663085936,
384
- 0.03188121604919433,
385
- 0.03191296005249023,
386
- 0.031898624420166014,
387
- 0.031926271438598636,
388
- 0.03193139266967773,
389
- 0.031875200271606445,
390
- 0.032033664703369144,
391
- 0.03181363105773926,
392
- 0.031916032791137694,
393
- 0.03189452743530274,
394
- 0.03183206367492676,
395
- 0.031817760467529294,
396
- 0.03195593643188477,
397
- 0.031853567123413085,
398
- 0.032129024505615236,
399
- 0.03189555168151856,
400
- 0.032026718139648434,
401
- 0.03185756874084473,
402
- 0.03189145660400391,
403
- 0.03185971260070801,
404
- 0.0318474235534668,
405
- 0.03186380767822266,
406
- 0.03198464012145996,
407
- 0.03183206367492676,
 
 
 
 
 
 
 
 
 
 
 
408
  0.03181670379638672,
409
- 0.03180031967163086,
410
- 0.03184127998352051,
411
- 0.03208499145507813,
412
- 0.03194675254821777,
413
- 0.03187609672546387,
414
- 0.03196108818054199,
415
- 0.03187404823303223,
416
- 0.0318034553527832,
417
- 0.03184940719604492,
418
- 0.031889408111572266,
419
- 0.03196313667297363,
420
- 0.03179622459411621,
421
- 0.03184639930725098,
422
- 0.031942975997924804,
423
- 0.031826623916625975,
424
- 0.03166108894348144,
425
- 0.03170096015930176,
426
- 0.031765504837036135,
427
  0.03175014305114746,
428
- 0.03175849533081055,
429
- 0.03174383926391602,
430
- 0.03189657592773437,
431
- 0.03174195289611816,
432
- 0.0318525447845459,
433
- 0.03177984046936035,
 
 
 
 
 
 
 
 
 
434
  0.031838207244873046,
435
- 0.03191910362243652,
436
- 0.03193343925476074,
437
- 0.0319109115600586,
438
- 0.032004096984863284,
439
- 0.03179417610168457,
440
- 0.031833087921142575,
441
- 0.03181056022644043,
442
  0.03181363105773926,
443
- 0.03173785591125488,
444
- 0.03176652717590332,
445
- 0.03198464012145996,
446
- 0.03184435272216797,
447
- 0.03177164840698242,
448
- 0.03185663986206055,
449
- 0.031865856170654294,
450
- 0.0316231689453125,
451
- 0.031765504837036135,
452
- 0.031783935546875,
453
- 0.03199488067626953,
454
- 0.03209830474853516,
455
- 0.031920127868652344,
456
- 0.03194367980957031,
457
- 0.032026622772216795,
458
- 0.0314337272644043,
459
- 0.031730688095092774,
460
- 0.03201126480102539,
461
- 0.03191398429870605,
462
- 0.032115711212158206,
463
- 0.031925247192382815,
464
- 0.032007167816162106,
465
- 0.03196518325805664,
466
- 0.03189555168151856,
467
- 0.03200307083129883,
468
- 0.03200511932373047,
469
- 0.032086017608642575,
470
- 0.03216691207885742,
471
- 0.03200614547729492,
472
- 0.032031742095947266,
473
- 0.03200511932373047,
474
- 0.03205017471313477,
475
- 0.0319866886138916,
476
- 0.03196211242675781,
477
- 0.03198876762390137,
478
- 0.03203785705566406,
479
- 0.03196928024291992,
480
  0.031922176361083986,
481
- 0.03191193580627441,
482
- 0.031938560485839845,
483
- 0.03402035140991211,
484
- 0.03201331329345703,
485
- 0.032140289306640625,
486
- 0.03209011077880859,
487
- 0.03205836868286133,
488
- 0.03205120086669922,
489
- 0.032074752807617186,
490
- 0.03209625625610352,
491
- 0.032048126220703126,
492
- 0.03199590492248535,
493
- 0.03201331329345703,
494
- 0.03196006393432617,
495
- 0.032036865234375,
496
- 0.03198464012145996,
497
- 0.03210956954956055,
498
- 0.03201536178588867,
499
- 0.03199180793762207,
500
- 0.031921152114868165,
501
- 0.03188121604919433,
502
- 0.03182412719726563,
503
- 0.032014080047607425,
504
- 0.032054271697998044,
505
- 0.0319866886138916,
506
- 0.03197849655151367,
507
- 0.032031742095947266,
508
- 0.03208703994750976,
509
- 0.03199385643005371,
510
- 0.031987712860107424,
511
- 0.032043006896972655,
512
- 0.031937536239624024,
513
- 0.03206655883789063,
514
- 0.03207372665405273,
515
- 0.03202969741821289,
516
- 0.03204608154296875,
517
- 0.032059391021728514,
518
- 0.03203891372680664,
519
- 0.03206041717529297,
520
- 0.03190681648254395,
521
- 0.032007167816162106,
522
- 0.03199100875854492,
523
- 0.031939424514770505,
524
- 0.03200096130371094,
525
- 0.03196723175048828,
526
- 0.031974399566650394,
527
- 0.03196211242675781,
528
- 0.031835136413574217,
529
- 0.03188121604919433,
530
- 0.031953920364379884,
531
- 0.03203583908081055,
532
- 0.03199078369140625,
533
- 0.0319866886138916,
534
- 0.03197766494750977,
535
- 0.03198137664794922,
536
- 0.03199084854125977,
537
- 0.03204703903198242,
538
- 0.03195699119567871,
539
- 0.0319682559967041,
540
- 0.0319866886138916,
541
- 0.03197353553771973,
542
- 0.031981407165527345,
543
- 0.03201331329345703,
544
- 0.03201536178588867,
545
- 0.03195289611816406,
546
- 0.03200921630859375,
547
- 0.03325030517578125,
548
- 0.032113662719726564,
549
- 0.03204095840454101,
550
- 0.032024574279785153,
551
- 0.03203481674194336,
552
- 0.03201331329345703,
553
- 0.03203276824951172,
554
- 0.03198384094238281,
555
- 0.03208476638793945,
556
- 0.03200307083129883,
557
- 0.03207167816162109,
558
- 0.03195699119567871,
559
- 0.032097278594970705,
560
- 0.03201740646362305,
561
- 0.03203071975708008,
562
- 0.032024574279785153,
563
- 0.03205120086669922,
564
- 0.032089088439941404,
565
- 0.032039936065673826,
566
- 0.032064510345458985,
567
- 0.032059391021728514,
568
- 0.03197644805908203,
569
- 0.03209545516967773,
570
- 0.03204687881469727,
571
- 0.03205641555786133,
572
- 0.032005023956298825,
573
- 0.03197235107421875,
574
- 0.032031742095947266,
575
- 0.03265945434570312,
576
- 0.03201638412475586,
577
- 0.03200921630859375,
578
- 0.03201753616333008,
579
- 0.03202956771850586,
580
- 0.03199692726135254,
581
- 0.03201536178588867,
582
- 0.03198361587524414,
583
- 0.03200511932373047,
584
- 0.032031742095947266,
585
- 0.03201126480102539,
586
- 0.031970304489135744,
587
- 0.03203276824951172,
588
- 0.031932416915893554,
589
- 0.03203583908081055,
590
- 0.031959039688110355,
591
- 0.03202764892578125,
592
- 0.03200511932373047,
593
- 0.03202764892578125,
594
- 0.0320552978515625,
595
- 0.03202150344848633,
596
- 0.03202969741821289,
597
- 0.03197039985656738,
598
- 0.03195792007446289,
599
- 0.03187814331054688,
600
- 0.03193343925476074,
601
- 0.03187609672546387,
602
- 0.03198566436767578,
603
- 0.031817728042602536,
604
- 0.03194572830200195,
605
- 0.03189068794250488,
606
- 0.03183283233642578,
607
- 0.03253760147094727,
608
- 0.031954944610595705,
609
- 0.03202560043334961,
610
- 0.03194572830200195,
611
- 0.03191296005249023,
612
- 0.03184025573730469,
613
- 0.031768575668334964,
614
- 0.031927295684814457,
615
- 0.031835136413574217,
616
- 0.031854591369628905,
617
- 0.031870975494384765,
618
- 0.03199590492248535,
619
- 0.03196928024291992,
620
- 0.03196211242675781,
621
- 0.031954944610595705,
622
  0.03194572830200195,
623
- 0.03179315185546875,
624
- 0.03174502372741699,
625
- 0.031869951248168944,
626
- 0.03159654426574707,
627
- 0.03179622459411621,
628
- 0.031682559967041016,
629
- 0.03161907196044922
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
630
  ]
631
  },
632
  "throughput": {
633
  "unit": "tokens/s",
634
- "value": 31.287600137264896
635
  },
636
  "energy": null,
637
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 4855.201792,
6
  "max_vram": 3894.411264,
7
  "max_reserved": 3409.969152,
8
  "max_allocated": 3289.072128
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.1551446951059194,
13
+ "stdev": 0.000794693441641556,
14
  "values": [
15
+ 0.16114207458496094,
16
+ 0.15676313781738282,
17
+ 0.15520460510253906,
18
+ 0.15488409423828126,
19
+ 0.1551974334716797,
20
+ 0.15482572937011718,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
21
  0.15518821716308595,
22
+ 0.15485848999023438,
23
+ 0.15516978454589844,
24
+ 0.15486163330078126,
25
+ 0.1551329345703125,
26
+ 0.15482266235351563,
27
+ 0.15513600158691407,
28
+ 0.15487078857421874,
29
+ 0.15519334411621094,
30
+ 0.15485848999023438,
31
+ 0.15508377075195312,
32
+ 0.15488409423828126,
33
+ 0.1551513671875,
34
+ 0.1548759002685547,
35
+ 0.15511244201660157,
36
+ 0.1549045715332031,
37
+ 0.15514419555664063,
38
+ 0.15484211730957032,
39
+ 0.15518931579589842,
40
+ 0.15485848999023438,
41
+ 0.155177978515625,
42
+ 0.1548748779296875,
43
+ 0.15517184448242188,
44
+ 0.15486770629882812,
45
+ 0.15516476440429688,
46
+ 0.15491378784179688,
47
+ 0.15509400939941406,
48
+ 0.15486872863769532,
49
+ 0.15519949340820313,
50
+ 0.15485031127929688,
51
+ 0.15515367126464844,
52
+ 0.154893310546875,
53
+ 0.1553203125,
54
+ 0.15492095947265624,
55
+ 0.15523738098144532,
56
+ 0.15489637756347657,
57
+ 0.1551278076171875,
58
+ 0.15486566162109375,
59
+ 0.15515238952636717,
60
+ 0.1548748779296875,
61
+ 0.15520358276367188,
62
+ 0.15492198181152345,
63
+ 0.1551585235595703,
64
+ 0.15483084106445313,
65
+ 0.1551893768310547,
66
+ 0.15488204956054688,
67
+ 0.15517593383789063,
68
+ 0.1548289031982422,
69
+ 0.15518310546875,
70
+ 0.15486872863769532,
71
+ 0.1552209930419922,
72
+ 0.15487692260742186,
73
+ 0.15514111328125,
74
+ 0.15486976623535156,
75
+ 0.15517900085449218,
76
+ 0.15484005737304687,
77
+ 0.15522714233398438,
78
+ 0.15485235595703126,
79
+ 0.15517286682128906
80
  ]
81
  },
82
  "throughput": {
83
  "unit": "tokens/s",
84
+ "value": 1650.0725327748094
85
  },
86
  "energy": null,
87
  "efficiency": null
 
89
  "decode": {
90
  "memory": {
91
  "unit": "MB",
92
+ "max_ram": 4857.298944,
93
+ "max_vram": 4047.50336,
94
  "max_reserved": 3563.061248,
95
  "max_allocated": 3355.39968
96
  },
97
  "latency": {
98
  "unit": "s",
99
+ "mean": 8.09360997676849,
100
+ "stdev": 0.0014038953781101426,
101
  "values": [
102
+ 8.0950138721466,
103
+ 8.09220608139038
104
  ]
105
  },
106
  "throughput": {
107
  "unit": "tokens/s",
108
+ "value": 31.50633657069463
109
  },
110
  "energy": null,
111
  "efficiency": null
 
114
  "memory": null,
115
  "latency": {
116
  "unit": "s",
117
+ "mean": 0.03173964696771957,
118
+ "stdev": 0.00022031687389000343,
119
  "values": [
120
+ 0.03464191818237305,
121
+ 0.033396736145019534,
122
+ 0.03189555168151856,
123
+ 0.031628288269042966,
124
+ 0.03180748748779297,
125
+ 0.0318023681640625,
126
+ 0.03180544090270996,
127
+ 0.031925247192382815,
128
+ 0.03182694435119629,
129
+ 0.03160371208190918,
130
+ 0.03164057540893555,
131
+ 0.03175833511352539,
132
+ 0.03181363105773926,
133
+ 0.031676416397094724,
134
+ 0.03179827117919922,
135
+ 0.031870975494384765,
136
+ 0.031749120712280275,
137
+ 0.031692800521850584,
138
+ 0.031736831665039066,
139
+ 0.03168972778320313,
140
+ 0.03168767929077149,
141
+ 0.031780864715576174,
142
+ 0.03167436790466309,
143
+ 0.031838207244873046,
144
+ 0.031681535720825195,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
145
  0.03184025573730469,
146
+ 0.031752191543579104,
147
+ 0.031714303970336914,
148
+ 0.03176345634460449,
149
+ 0.03165081596374512,
150
+ 0.03176243209838867,
151
+ 0.03179212760925293,
152
+ 0.03167334365844727,
153
+ 0.031751167297363284,
154
+ 0.03170918464660644,
155
+ 0.03165695953369141,
156
+ 0.03159654426574707,
157
+ 0.031674432754516604,
158
+ 0.03162412834167481,
159
+ 0.03180953598022461,
160
+ 0.031735807418823245,
161
+ 0.03178291130065918,
162
+ 0.031714303970336914,
163
+ 0.03174092864990234,
164
+ 0.03175526428222656,
165
+ 0.03172352027893066,
166
+ 0.03178598403930664,
167
+ 0.03182387161254883,
168
+ 0.03169718360900879,
169
+ 0.03171196746826172,
170
+ 0.03167948722839355,
171
+ 0.03175833511352539,
172
+ 0.031661056518554685,
173
+ 0.0316549129486084,
174
+ 0.03182796859741211,
175
+ 0.03183923149108887,
176
+ 0.031784959793090824,
177
+ 0.03179724884033203,
178
+ 0.03187411117553711,
179
+ 0.031794111251831056,
180
  0.03184332847595215,
181
+ 0.03177267265319824,
182
+ 0.031736831665039066,
183
+ 0.03180544090270996,
184
+ 0.03171225547790527,
185
+ 0.0316682243347168,
186
+ 0.031681535720825195,
187
+ 0.031752191543579104,
188
+ 0.03160166358947754,
189
+ 0.031720447540283206,
190
+ 0.031676416397094724,
191
+ 0.03176959991455078,
192
+ 0.0316549129486084,
193
+ 0.03175628852844238,
194
+ 0.03177676773071289,
195
+ 0.03186483192443847,
196
+ 0.03176755142211914,
197
+ 0.03167231941223145,
198
+ 0.03194367980957031,
199
+ 0.031733760833740236,
200
+ 0.031660032272338864,
201
+ 0.0317255687713623,
202
+ 0.031870975494384765,
203
+ 0.03171737670898438,
204
+ 0.031488000869750975,
205
+ 0.03236249542236328,
206
+ 0.03291545486450195,
207
+ 0.03179007911682129,
208
+ 0.031649791717529296,
209
+ 0.031647743225097655,
210
+ 0.03165798377990723,
211
+ 0.031645696640014646,
212
+ 0.031509504318237305,
213
+ 0.031545343399047854,
214
+ 0.031697919845581055,
215
+ 0.031736831665039066,
216
+ 0.03167334365844727,
217
+ 0.03166924858093262,
218
+ 0.03144806480407715,
219
+ 0.03158016014099121,
220
+ 0.03146240043640137,
221
+ 0.03167436790466309,
222
+ 0.03158527946472168,
223
+ 0.031734783172607424,
224
+ 0.0315996150970459,
225
  0.0317890567779541,
226
+ 0.03163340759277344,
227
+ 0.03174297523498535,
228
+ 0.033173503875732424,
229
+ 0.03188531112670898,
230
+ 0.031698944091796875,
231
+ 0.03187711906433106,
232
  0.03179110336303711,
233
+ 0.031752191543579104,
234
+ 0.03168767929077149,
235
+ 0.031681535720825195,
236
+ 0.03150028800964356,
237
+ 0.031660032272338864,
238
+ 0.03156070327758789,
239
+ 0.03163545608520508,
240
+ 0.031666175842285156,
241
+ 0.03177471923828125,
242
+ 0.0317071361541748,
243
+ 0.031736831665039066,
244
+ 0.03160166358947754,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
245
  0.03172761535644531,
246
+ 0.03161497688293457,
247
+ 0.031597600936889646,
248
+ 0.031730655670166016,
249
+ 0.03162419128417969,
250
+ 0.031715328216552735,
251
+ 0.03172352027893066,
252
+ 0.031751167297363284,
253
+ 0.031718399047851564,
254
+ 0.03167231941223145,
255
+ 0.03161087989807129,
256
+ 0.03161907196044922,
257
+ 0.031680511474609374,
258
+ 0.03179520034790039,
259
  0.031833087921142575,
260
+ 0.03181875228881836,
261
+ 0.03171737670898438,
262
+ 0.031753215789794925,
263
+ 0.031696895599365234,
264
+ 0.03174399948120117,
265
+ 0.0317890567779541,
266
+ 0.031698944091796875,
267
+ 0.03177676773071289,
268
+ 0.032145408630371096,
269
+ 0.03176959991455078,
270
+ 0.031710208892822264,
271
+ 0.03177676773071289,
272
+ 0.03170201683044434,
273
+ 0.031730688095092774,
274
+ 0.03170201683044434,
275
+ 0.031693824768066405,
276
+ 0.031579135894775394,
277
+ 0.031699968338012696,
278
+ 0.031719423294067385,
279
+ 0.03169484710693359,
280
+ 0.031661056518554685,
281
+ 0.0316231689453125,
282
+ 0.03157196807861328,
283
+ 0.0316231689453125,
284
+ 0.031611072540283204,
285
+ 0.03161887931823731,
286
+ 0.031644672393798826,
287
+ 0.031615999221801756,
288
+ 0.031512575149536134,
289
+ 0.031632383346557616,
290
+ 0.03155353546142578,
291
+ 0.03155558395385742,
292
+ 0.03196518325805664,
293
+ 0.031704063415527346,
294
+ 0.03169075202941894,
295
+ 0.031678464889526366,
296
+ 0.03174297523498535,
297
+ 0.03176243209838867,
298
+ 0.0316753921508789,
299
+ 0.03158937644958496,
300
+ 0.031677440643310545,
301
+ 0.0316753921508789,
302
+ 0.03175014305114746,
303
+ 0.03173785591125488,
304
+ 0.031780864715576174,
305
+ 0.031710208892822264,
306
+ 0.03168870353698731,
307
+ 0.03160985565185547,
308
+ 0.03165695953369141,
309
+ 0.03175833511352539,
310
+ 0.03171123123168945,
311
+ 0.0315863037109375,
312
+ 0.031486976623535154,
313
+ 0.031581472396850586,
314
+ 0.03167407989501953,
315
+ 0.03172761535644531,
316
  0.03181670379638672,
317
+ 0.031662080764770506,
318
+ 0.03160268783569336,
319
+ 0.03155251121520996,
320
+ 0.032159744262695314,
321
+ 0.03174604797363281,
322
+ 0.031732736587524416,
323
+ 0.03176959991455078,
324
+ 0.0317573127746582,
325
+ 0.031649791717529296,
326
+ 0.0316866569519043,
327
+ 0.03171225547790527,
328
+ 0.031659008026123044,
329
+ 0.031749120712280275,
330
+ 0.0315729923248291,
331
+ 0.03164262390136719,
332
+ 0.03160166358947754,
333
+ 0.031697919845581055,
334
+ 0.031730688095092774,
335
+ 0.03172966384887695,
336
+ 0.03172147178649903,
337
  0.03173990440368652,
338
+ 0.03163545608520508,
339
+ 0.0316753921508789,
340
+ 0.03152383995056152,
341
+ 0.03166924858093262,
342
+ 0.03164672088623047,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
343
  0.03177164840698242,
344
+ 0.03152179145812988,
345
+ 0.03162521553039551,
346
+ 0.031715328216552735,
347
+ 0.03177267265319824,
348
+ 0.031699968338012696,
349
+ 0.031733760833740236,
350
+ 0.03179110336303711,
351
+ 0.031661056518554685,
352
+ 0.03220787048339844,
353
+ 0.031893503189086916,
354
+ 0.03181260871887207,
355
  0.03180953598022461,
356
+ 0.031666175842285156,
357
+ 0.03177471923828125,
358
+ 0.03184127998352051,
359
+ 0.0317255687713623,
360
+ 0.031854591369628905,
361
  0.03184332847595215,
362
+ 0.03162009620666504,
363
+ 0.03182694435119629,
364
+ 0.031908863067626955,
365
+ 0.03198464012145996,
366
+ 0.03205734252929687,
367
+ 0.03177676773071289,
368
+ 0.03143577575683594,
369
+ 0.03211673736572265,
370
+ 0.03171737670898438,
371
+ 0.03149004745483398,
372
+ 0.03137126350402832,
373
+ 0.03160780715942383,
374
+ 0.031503360748291014,
375
+ 0.032263168334960936,
376
+ 0.03208396911621094,
377
+ 0.03172761535644531,
378
+ 0.031734783172607424,
379
+ 0.03175129508972168,
380
+ 0.03175718307495117,
381
+ 0.03175628852844238,
382
+ 0.0317573127746582,
383
+ 0.03155251121520996,
384
+ 0.03162214469909668,
385
+ 0.031710208892822264,
386
+ 0.031721567153930666,
387
+ 0.03172854423522949,
388
+ 0.03170921516418457,
389
+ 0.03158627128601074,
390
+ 0.03163852882385254,
391
+ 0.03158118438720703,
392
+ 0.031663103103637694,
393
+ 0.03167868804931641,
394
+ 0.0316331844329834,
395
+ 0.03153510475158691,
396
+ 0.031604736328125,
397
+ 0.0315545597076416,
398
+ 0.03183433532714844,
399
+ 0.03169872093200683,
400
+ 0.03179007911682129,
401
+ 0.03156787109375,
402
+ 0.03152288055419922,
403
+ 0.03154735946655273,
404
+ 0.031654048919677734,
405
+ 0.03160147285461426,
406
+ 0.03174297523498535,
407
+ 0.03162521553039551,
408
+ 0.031665151596069335,
409
+ 0.03162419128417969,
410
+ 0.03160166358947754,
411
+ 0.03179520034790039,
412
+ 0.031697919845581055,
413
+ 0.03171123123168945,
414
+ 0.031747072219848634,
415
+ 0.031678464889526366,
416
+ 0.03163142395019531,
417
+ 0.03166201591491699,
418
+ 0.031692800521850584,
419
+ 0.03172147178649903,
420
+ 0.03159244728088379,
421
+ 0.03162838363647461,
422
+ 0.03176848030090332,
423
+ 0.031601696014404296,
424
+ 0.031608800888061526,
425
  0.03160371208190918,
426
+ 0.031731712341308595,
427
+ 0.03155148887634277,
428
+ 0.03162214469909668,
429
+ 0.031525888442993165,
430
+ 0.03176576042175293,
431
+ 0.031596288681030274,
432
+ 0.0317379207611084,
433
+ 0.03156985664367676,
434
+ 0.03163545608520508,
435
+ 0.03155251121520996,
436
+ 0.0317071361541748,
437
+ 0.03184435272216797,
438
+ 0.03183744049072266,
439
+ 0.0316628475189209,
440
+ 0.03165798377990723,
441
+ 0.031631359100341795,
442
+ 0.031680511474609374,
443
+ 0.031720447540283206,
444
+ 0.031693824768066405,
445
+ 0.031753215789794925,
446
+ 0.031660032272338864,
447
+ 0.03158937644958496,
448
+ 0.03167231941223145,
449
+ 0.031664127349853514,
450
+ 0.03161497688293457,
451
+ 0.03171737670898438,
452
+ 0.03170099258422852,
453
+ 0.03167436790466309,
 
 
 
 
 
 
454
  0.03188019180297851,
455
+ 0.03172454452514648,
456
+ 0.0317706241607666,
457
+ 0.031699968338012696,
458
+ 0.03139379119873047,
459
+ 0.031426559448242186,
460
+ 0.03157708740234375,
461
+ 0.03149516868591309,
462
+ 0.03182592010498047,
463
+ 0.0316866569519043,
464
+ 0.03175526428222656,
465
+ 0.03160883140563965,
466
+ 0.03164998435974121,
467
+ 0.03166496086120606,
468
+ 0.03173990440368652,
469
+ 0.031871999740600586,
470
+ 0.03181465530395508,
471
  0.03182387161254883,
472
+ 0.031753215789794925,
473
+ 0.03191398429870605,
474
+ 0.03166924858093262,
475
+ 0.031731712341308595,
476
+ 0.031718399047851564,
477
+ 0.031643648147583005,
478
+ 0.03167129516601563,
479
+ 0.03170201683044434,
480
+ 0.03170816040039062,
481
+ 0.03175833511352539,
482
+ 0.03172352027893066,
483
+ 0.03337011337280273,
484
+ 0.03177164840698242,
485
+ 0.03181875228881836,
486
+ 0.03184643173217774,
487
+ 0.03183510398864746,
 
 
 
 
488
  0.03177881622314453,
489
+ 0.03177267265319824,
490
+ 0.031665151596069335,
491
+ 0.031647743225097655,
492
+ 0.03178803253173828,
493
+ 0.03168870353698731,
494
+ 0.031715328216552735,
495
+ 0.031679584503173826,
496
+ 0.03175312042236328,
497
+ 0.03162112045288086,
498
+ 0.03158732795715332,
499
+ 0.03158835220336914,
500
+ 0.0316866569519043,
501
+ 0.0316549129486084,
502
+ 0.03165798377990723,
503
+ 0.03196006393432617,
504
+ 0.03175014305114746,
505
+ 0.031768575668334964,
506
+ 0.031834112167358396,
507
+ 0.03178313636779785,
508
+ 0.031778591156005856,
509
+ 0.03166720008850098,
510
+ 0.031659008026123044,
511
+ 0.03170201683044434,
512
+ 0.03169177627563476,
513
+ 0.031732736587524416,
514
+ 0.03176959991455078,
515
+ 0.0317890567779541,
516
+ 0.031631359100341795,
517
+ 0.03168870353698731,
518
+ 0.03167027282714844,
519
+ 0.03172352027893066,
520
+ 0.03172454452514648,
521
+ 0.03174604797363281,
522
+ 0.03173990440368652,
523
+ 0.032045055389404296,
524
+ 0.03182080078125,
525
+ 0.03180953598022461,
526
+ 0.03181875228881836,
527
+ 0.0318156795501709,
528
+ 0.03173990440368652,
529
+ 0.03171123123168945,
530
+ 0.03178188705444336,
531
+ 0.03172761535644531,
532
+ 0.031941631317138675,
533
+ 0.03177779197692871,
534
+ 0.031703039169311525,
535
+ 0.031714303970336914,
536
+ 0.03175935935974121,
537
+ 0.031834112167358396,
538
+ 0.03179110336303711,
539
+ 0.03179007911682129,
540
+ 0.031833087921142575,
541
+ 0.03172249603271484,
542
+ 0.03183923149108887,
543
+ 0.031748096466064454,
544
+ 0.03181260871887207,
545
  0.03181670379638672,
546
+ 0.03174092864990234,
547
+ 0.0320819206237793,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
548
  0.03175014305114746,
549
+ 0.03187302398681641,
550
+ 0.03187711906433106,
551
+ 0.03200102233886719,
552
+ 0.03187814331054688,
553
+ 0.03177779197692871,
554
+ 0.031704063415527346,
555
+ 0.03181260871887207,
556
+ 0.03171225547790527,
557
+ 0.03176038360595703,
558
+ 0.031736831665039066,
559
+ 0.03181670379638672,
560
+ 0.031631359100341795,
561
+ 0.03176038360595703,
562
+ 0.031666175842285156,
563
+ 0.03175833511352539,
564
  0.031838207244873046,
565
+ 0.03170611190795898,
566
+ 0.03175424003601074,
567
+ 0.03182694435119629,
568
+ 0.031904767990112305,
569
+ 0.031882240295410154,
570
+ 0.0317706241607666,
 
571
  0.03181363105773926,
572
+ 0.03178598403930664,
573
+ 0.03178700828552246,
574
+ 0.03178803253173828,
575
+ 0.03230003356933594,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
576
  0.031922176361083986,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
577
  0.03194572830200195,
578
+ 0.0318023681640625,
579
+ 0.03182796859741211,
580
+ 0.03186483192443847,
581
+ 0.03187302398681641,
582
+ 0.03185766410827637,
583
+ 0.0319180793762207,
584
+ 0.03193343925476074,
585
+ 0.031898624420166014,
586
+ 0.03177574348449707,
587
+ 0.031747072219848634,
588
+ 0.03176755142211914,
589
+ 0.0318156795501709,
590
+ 0.03171123123168945,
591
+ 0.031718591690063476,
592
+ 0.0317459831237793,
593
+ 0.031738752365112304,
594
+ 0.031698944091796875,
595
+ 0.03178803253173828,
596
+ 0.031747072219848634,
597
+ 0.03168668746948242,
598
+ 0.031657951354980465,
599
+ 0.0317010555267334,
600
+ 0.03168864059448242,
601
+ 0.03175526428222656,
602
+ 0.031856927871704105,
603
+ 0.03167612838745117,
604
+ 0.031648767471313476,
605
+ 0.03156480026245117,
606
+ 0.03150131225585937,
607
+ 0.032140289306640625,
608
+ 0.0316549129486084,
609
+ 0.031784959793090824,
610
+ 0.03164159965515137,
611
+ 0.031665151596069335,
612
+ 0.03153116798400879,
613
+ 0.03154006385803223,
614
+ 0.03177676773071289,
615
+ 0.031749120712280275,
616
+ 0.03165286445617676,
617
+ 0.03163340759277344,
618
+ 0.03174399948120117,
619
+ 0.03170611190795898,
620
+ 0.03172147178649903,
621
+ 0.03181875228881836,
622
+ 0.0317255687713623,
623
+ 0.03170099258422852,
624
+ 0.031644672393798826,
625
+ 0.03165388870239258,
626
+ 0.03157196807861328,
627
+ 0.03170611190795898,
628
+ 0.03141632080078125,
629
+ 0.031457279205322264
630
  ]
631
  },
632
  "throughput": {
633
  "unit": "tokens/s",
634
+ "value": 31.506336570694632
635
  },
636
  "energy": null,
637
  "efficiency": null