kreas commited on
Commit
7dd07f7
1 Parent(s): 8d0bd14

Upload /Mistral-7B-v0.1-AWQ/AWQ_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Mistral-7B-v0.1-AWQ/AWQ_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,287 +2,54 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 991.27296,
6
- "max_vram": 2585.788416,
7
- "max_reserved": 2101.346304,
8
- "max_allocated": 2014.912
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.03763389647634405,
13
- "stdev": 0.0005429230982830213,
14
  "values": [
15
- 0.04083331298828125,
16
- 0.0396492805480957,
17
- 0.03877785491943359,
18
- 0.03871334457397461,
19
- 0.03868057632446289,
20
- 0.038803455352783206,
21
- 0.04250624084472656,
22
- 0.0422737922668457,
23
- 0.03878297424316406,
24
- 0.0376360969543457,
25
- 0.03747046279907226,
26
- 0.03753472137451172,
27
- 0.037720062255859374,
28
- 0.037548030853271484,
29
- 0.03764019012451172,
30
- 0.03959296035766602,
31
- 0.039024639129638675,
32
- 0.03762790298461914,
33
- 0.037493759155273435,
34
- 0.037577728271484374,
35
- 0.0373831672668457,
36
- 0.03742105484008789,
37
- 0.037416961669921874,
38
- 0.03785420989990235,
39
- 0.037594112396240234,
40
- 0.037510177612304685,
41
- 0.0375838737487793,
42
- 0.03751424026489258,
43
- 0.03747430419921875,
44
- 0.03755724716186523,
45
- 0.03748044967651367,
46
- 0.037501953125,
47
- 0.03742924880981445,
48
- 0.03751424026489258,
49
- 0.037493759155273435,
50
- 0.03752140808105469,
51
- 0.037631999969482424,
52
- 0.03749478530883789,
53
- 0.037585918426513674,
54
- 0.037539840698242184,
55
- 0.03801190567016602,
56
- 0.03746713638305664,
57
- 0.037438465118408204,
58
- 0.03745894241333008,
59
- 0.03748147201538086,
60
- 0.03748966217041016,
61
- 0.037531646728515625,
62
- 0.03762995147705078,
63
- 0.037571807861328126,
64
- 0.03756748962402344,
65
- 0.03741388702392578,
66
- 0.03745587158203125,
67
- 0.037408767700195314,
68
- 0.03791667175292969,
69
- 0.037465087890625,
70
- 0.03755724716186523,
71
- 0.03749289703369141,
72
- 0.03757363128662109,
73
- 0.03751321411132812,
74
- 0.037698558807373043,
75
- 0.03751436614990234,
76
- 0.03745177459716797,
77
- 0.03744473648071289,
78
- 0.03752140808105469,
79
- 0.03765555191040039,
80
- 0.03749587249755859,
81
- 0.037424129486083986,
82
- 0.037612545013427735,
83
- 0.03747654342651367,
84
- 0.03746815872192383,
85
- 0.03738214492797851,
86
- 0.037526527404785154,
87
- 0.03740671920776367,
88
- 0.037539840698242184,
89
- 0.03758899307250976,
90
- 0.037498878479003905,
91
- 0.037375999450683595,
92
- 0.0374835205078125,
93
- 0.037253120422363284,
94
- 0.037397502899169925,
95
- 0.03752140808105469,
96
- 0.03740262222290039,
97
- 0.03747148895263672,
98
- 0.03748659133911133,
99
- 0.03748454284667969,
100
- 0.037356544494628906,
101
- 0.03755417633056641,
102
- 0.037479423522949216,
103
- 0.03739033508300781,
104
- 0.037285888671875,
105
- 0.03739875030517578,
106
- 0.03747123336791992,
107
- 0.03744153594970703,
108
- 0.03727667236328125,
109
- 0.03795251083374023,
110
- 0.03746303939819336,
111
- 0.037449726104736326,
112
- 0.03740671920776367,
113
- 0.03774259185791016,
114
- 0.0375849609375,
115
- 0.03748966217041016,
116
- 0.03739340972900391,
117
- 0.03735551834106445,
118
- 0.03747020721435547,
119
- 0.03750707244873047,
120
- 0.037427425384521484,
121
- 0.03745894241333008,
122
- 0.03791999816894531,
123
- 0.03744768142700195,
124
- 0.03762073516845703,
125
- 0.03748659133911133,
126
- 0.037461280822753906,
127
- 0.037321727752685545,
128
- 0.03740979385375977,
129
- 0.03756972885131836,
130
- 0.03764019012451172,
131
- 0.03747430419921875,
132
- 0.03753676986694336,
133
- 0.03746201705932617,
134
- 0.03761356735229492,
135
- 0.03756748962402344,
136
- 0.038596607208251955,
137
- 0.03748966217041016,
138
- 0.037658687591552734,
139
- 0.037543201446533205,
140
- 0.03762278366088867,
141
- 0.037607425689697264,
142
- 0.037610496520996094,
143
- 0.03763507080078125,
144
- 0.037550079345703126,
145
- 0.037564414978027344,
146
- 0.037550079345703126,
147
- 0.03762688064575195,
148
- 0.037435489654541014,
149
- 0.03760844802856445,
150
- 0.03762073516845703,
151
- 0.03759820938110352,
152
- 0.03747635269165039,
153
- 0.03746713638305664,
154
- 0.03780198287963867,
155
- 0.037628929138183595,
156
- 0.03754393768310547,
157
- 0.037512191772460936,
158
- 0.037525505065917966,
159
- 0.03752140808105469,
160
- 0.03739852905273437,
161
- 0.037602302551269534,
162
- 0.03771187210083008,
163
- 0.03778662490844727,
164
- 0.03755321502685547,
165
- 0.0375551986694336,
166
- 0.03760025787353516,
167
- 0.03767091369628906,
168
- 0.03760947036743164,
169
- 0.037459968566894535,
170
- 0.03748659133911133,
171
- 0.03765862274169922,
172
- 0.03752243041992188,
173
- 0.03760332870483398,
174
- 0.03758796691894531,
175
- 0.037966846466064456,
176
- 0.03758694458007812,
177
- 0.03755212783813477,
178
- 0.037722110748291016,
179
- 0.03750707244873047,
180
- 0.03765248107910156,
181
- 0.037651454925537106,
182
- 0.03752447891235351,
183
- 0.037582847595214845,
184
- 0.03757056045532227,
185
- 0.03769241714477539,
186
- 0.03759820938110352,
187
- 0.03764121627807617,
188
- 0.03753881454467774,
189
- 0.03757878494262695,
190
- 0.037571582794189456,
191
- 0.03770675277709961,
192
- 0.03759001541137695,
193
- 0.03759513473510742,
194
- 0.037577728271484374,
195
- 0.03751321411132812,
196
- 0.03750809478759766,
197
- 0.03749683380126953,
198
- 0.03736576080322265,
199
- 0.03752959823608398,
200
- 0.03752959823608398,
201
- 0.03756748962402344,
202
- 0.037533695220947266,
203
- 0.03778355026245117,
204
- 0.037574657440185545,
205
- 0.037427200317382815,
206
- 0.03747430419921875,
207
- 0.037427200317382815,
208
- 0.037424129486083986,
209
- 0.03734233474731445,
210
- 0.03745382308959961,
211
- 0.0374466552734375,
212
- 0.03764121627807617,
213
- 0.037425151824951174,
214
- 0.03752345657348633,
215
- 0.0374917106628418,
216
- 0.03790643310546875,
217
- 0.037384193420410154,
218
- 0.037427200317382815,
219
- 0.03742822265625,
220
- 0.0374917106628418,
221
- 0.03751424026489258,
222
- 0.037548030853271484,
223
- 0.03739648056030274,
224
- 0.03751321411132812,
225
- 0.03755440139770508,
226
- 0.037579776763916016,
227
- 0.03755929565429687,
228
- 0.037591041564941405,
229
- 0.037835777282714846,
230
- 0.037550079345703126,
231
- 0.03752457427978516,
232
- 0.037572608947753904,
233
- 0.03750707244873047,
234
- 0.03764326477050781,
235
- 0.03754393768310547,
236
- 0.03741491317749023,
237
- 0.037429344177246096,
238
- 0.037440513610839846,
239
- 0.037408767700195314,
240
- 0.03741193771362305,
241
- 0.037364734649658206,
242
- 0.037393566131591796,
243
- 0.03759718322753906,
244
- 0.037493759155273435,
245
- 0.037466110229492186,
246
- 0.03753779220581055,
247
- 0.037440513610839846,
248
- 0.03744153594970703,
249
- 0.037465087890625,
250
- 0.037526527404785154,
251
- 0.03742627334594727,
252
- 0.03760435104370117,
253
- 0.03751833724975586,
254
- 0.037563392639160156,
255
- 0.03736678314208984,
256
- 0.037585918426513674,
257
- 0.03748659133911133,
258
- 0.03735859298706055,
259
- 0.037515262603759765,
260
- 0.037602302551269534,
261
- 0.0375203857421875,
262
- 0.037531871795654294,
263
- 0.037550079345703126,
264
- 0.03755929565429687,
265
- 0.037561344146728515,
266
- 0.03752959823608398,
267
- 0.037628929138183595,
268
- 0.03765964889526367,
269
- 0.03752959823608398,
270
- 0.03793203353881836,
271
- 0.037667839050292966,
272
- 0.03751424026489258,
273
- 0.03759206390380859,
274
- 0.03753062438964844,
275
- 0.03756851196289063,
276
- 0.03755724716186523,
277
- 0.03762073516845703,
278
- 0.03755110549926758,
279
- 0.037589118957519534,
280
- 0.03769241714477539
281
  ]
282
  },
283
  "throughput": {
284
  "unit": "tokens/s",
285
- "value": 6802.378280466301
286
  },
287
  "energy": null,
288
  "efficiency": null
@@ -290,23 +57,22 @@
290
  "decode": {
291
  "memory": {
292
  "unit": "MB",
293
- "max_ram": 991.27296,
294
- "max_vram": 2858.418176,
295
- "max_reserved": 2373.976064,
296
- "max_allocated": 2326.085632
297
  },
298
  "latency": {
299
  "unit": "s",
300
- "mean": 7.318287711143492,
301
- "stdev": 0.003758425712581559,
302
  "values": [
303
- 7.322046136856073,
304
- 7.31452928543091
305
  ]
306
  },
307
  "throughput": {
308
  "unit": "tokens/s",
309
- "value": 34.84421630646111
310
  },
311
  "energy": null,
312
  "efficiency": null
@@ -315,524 +81,269 @@
315
  "memory": null,
316
  "latency": {
317
  "unit": "s",
318
- "mean": 0.028699167494680367,
319
- "stdev": 0.00011730269864838747,
320
  "values": [
321
- 0.029384384155273436,
322
- 0.02918604850769043,
323
- 0.02877644729614258,
324
- 0.028843008041381835,
325
- 0.02877542304992676,
326
- 0.02872831916809082,
327
- 0.02874675178527832,
328
- 0.029063167572021483,
329
- 0.02921881675720215,
330
- 0.029207551956176758,
331
- 0.028906496047973632,
332
- 0.028685312271118164,
333
- 0.028679168701171875,
334
- 0.028735488891601563,
335
- 0.028726272583007813,
336
- 0.0287774715423584,
337
- 0.028890111923217773,
338
- 0.028852224349975586,
339
- 0.028719104766845704,
340
- 0.028703744888305665,
341
- 0.028848127365112306,
342
- 0.029024255752563476,
343
- 0.02877952003479004,
344
- 0.02880614471435547,
345
- 0.02876006317138672,
346
- 0.028825599670410155,
347
- 0.02878156852722168,
348
- 0.028655616760253907,
349
- 0.02874470329284668,
350
- 0.028888063430786134,
351
- 0.028821504592895508,
352
- 0.02873139190673828,
353
- 0.028710912704467774,
354
- 0.02870681571960449,
355
- 0.028647424697875977,
356
- 0.028654592514038086,
357
- 0.028767232894897462,
358
- 0.028709888458251953,
359
- 0.028799999237060548,
360
- 0.02876825523376465,
361
- 0.028955776214599608,
362
- 0.02864627265930176,
363
- 0.02874880027770996,
364
- 0.028682239532470705,
365
- 0.02875596809387207,
366
- 0.028837888717651368,
367
- 0.02893721580505371,
368
- 0.028835840225219726,
369
- 0.02877337646484375,
370
- 0.02876108741760254,
371
- 0.028898303985595702,
372
- 0.028799999237060548,
373
- 0.02894233512878418,
374
- 0.028688383102416993,
375
- 0.02919628715515137,
376
- 0.02878054428100586,
377
- 0.02872319984436035,
378
- 0.028759040832519532,
379
- 0.028810239791870116,
380
- 0.028725248336791992,
381
- 0.028832767486572267,
382
- 0.028658687591552736,
383
- 0.028824575424194337,
384
- 0.028836864471435547,
385
- 0.02867308807373047,
386
- 0.028733375549316407,
387
- 0.02870681571960449,
388
- 0.028729343414306642,
389
- 0.028664831161499024,
390
- 0.02877542304992676,
391
- 0.028712959289550782,
392
- 0.029117439270019533,
393
- 0.02875289535522461,
394
- 0.028820480346679687,
395
- 0.02875801658630371,
396
- 0.028694528579711914,
397
- 0.028794879913330077,
398
- 0.028832767486572267,
399
- 0.02875699234008789,
400
- 0.028791807174682618,
401
- 0.028706016540527343,
402
- 0.028621599197387694,
403
- 0.02856345558166504,
404
- 0.028799999237060548,
405
- 0.02874367904663086,
406
- 0.0286167049407959,
407
- 0.02871500778198242,
408
- 0.028659711837768553,
409
- 0.028602367401123048,
410
- 0.028643327713012694,
411
- 0.0285849609375,
412
- 0.028891136169433593,
413
- 0.028677120208740234,
414
- 0.02873855972290039,
415
- 0.028643327713012694,
416
- 0.028742656707763672,
417
- 0.028712959289550782,
418
- 0.028693504333496093,
419
- 0.028684352874755858,
420
- 0.02864531135559082,
421
- 0.028692480087280273,
422
- 0.028645376205444335,
423
- 0.02858700752258301,
424
- 0.028683263778686522,
425
- 0.028579839706420897,
426
- 0.028681215286254884,
427
- 0.028622848510742187,
428
- 0.028656639099121094,
429
- 0.028604415893554686,
430
- 0.028676095962524413,
431
- 0.02855219268798828,
432
- 0.028638208389282226,
433
- 0.028671199798583985,
434
- 0.028682016372680665,
435
- 0.028705791473388673,
436
- 0.02874470329284668,
437
- 0.028639232635498047,
438
- 0.028632064819335938,
439
- 0.028504064559936523,
440
- 0.02854195213317871,
441
- 0.028662784576416016,
442
- 0.028703744888305665,
443
- 0.02858598327636719,
444
- 0.028598272323608398,
445
- 0.028837888717651368,
446
- 0.028683263778686522,
447
- 0.028672000885009766,
448
- 0.028826623916625976,
449
- 0.028628992080688476,
450
- 0.028672000885009766,
451
- 0.028624895095825196,
452
- 0.028663808822631837,
453
- 0.028618751525878908,
454
- 0.028614656448364258,
455
- 0.02855936050415039,
456
- 0.028609535217285157,
457
- 0.0285296630859375,
458
- 0.028687360763549805,
459
- 0.028609535217285157,
460
- 0.028638208389282226,
461
- 0.028614656448364258,
462
- 0.029031423568725585,
463
- 0.028727296829223634,
464
- 0.028609535217285157,
465
- 0.028618751525878908,
466
- 0.028605440139770507,
467
- 0.028621824264526367,
468
- 0.02872422409057617,
469
- 0.028624895095825196,
470
- 0.028624895095825196,
471
- 0.028666879653930662,
472
- 0.028688383102416993,
473
- 0.028626943588256838,
474
- 0.028641279220581056,
475
- 0.02854911994934082,
476
- 0.028621824264526367,
477
- 0.028735488891601563,
478
- 0.028654592514038086,
479
- 0.02860339164733887,
480
- 0.028676095962524413,
481
- 0.028667903900146483,
482
- 0.028717056274414062,
483
- 0.02873139190673828,
484
- 0.028690431594848635,
485
- 0.028624895095825196,
486
- 0.028654592514038086,
487
- 0.028654592514038086,
488
- 0.028770303726196288,
489
- 0.02875289535522461,
490
- 0.028735488891601563,
491
- 0.028651647567749024,
492
- 0.028687231063842772,
493
- 0.02873958396911621,
494
- 0.028750848770141602,
495
- 0.0285614070892334,
496
- 0.028809215545654295,
497
- 0.028589216232299805,
498
- 0.02868515205383301,
499
- 0.0286167049407959,
500
- 0.028661760330200195,
501
- 0.028672000885009766,
502
- 0.02873958396911621,
503
- 0.02881331253051758,
504
- 0.02878156852722168,
505
- 0.02857369613647461,
506
- 0.02855936050415039,
507
- 0.028695552825927735,
508
- 0.028753919601440428,
509
- 0.028658687591552736,
510
- 0.028676095962524413,
511
- 0.028646400451660156,
512
- 0.028820480346679687,
513
- 0.02873651123046875,
514
- 0.02876006317138672,
515
- 0.028647424697875977,
516
- 0.029197311401367186,
517
- 0.02854604721069336,
518
- 0.028712959289550782,
519
- 0.028491775512695314,
520
- 0.028677120208740234,
521
- 0.028614656448364258,
522
- 0.02860032081604004,
523
- 0.028717056274414062,
524
- 0.028617727279663087,
525
- 0.028645376205444335,
526
- 0.02878156852722168,
527
- 0.0286167049407959,
528
- 0.02857062339782715,
529
- 0.028690528869628907,
530
- 0.02871900749206543,
531
- 0.02858700752258301,
532
- 0.02878873634338379,
533
- 0.028786687850952147,
534
- 0.02873958396911621,
535
- 0.028633087158203126,
536
- 0.028621824264526367,
537
- 0.028590080261230468,
538
- 0.028815359115600587,
539
- 0.028633087158203126,
540
- 0.028710912704467774,
541
- 0.028664831161499024,
542
- 0.028645376205444335,
543
- 0.02856959915161133,
544
- 0.028625919342041017,
545
- 0.028648448944091798,
546
- 0.028718080520629883,
547
- 0.028618751525878908,
548
- 0.028677120208740234,
549
- 0.028669952392578125,
550
- 0.028729343414306642,
551
- 0.028668928146362304,
552
- 0.028712959289550782,
553
- 0.028633087158203126,
554
- 0.028612607955932616,
555
- 0.028645376205444335,
556
- 0.028650495529174806,
557
- 0.02874060821533203,
558
- 0.028737535476684572,
559
- 0.02857369613647461,
560
- 0.028817407608032225,
561
- 0.028645376205444335,
562
- 0.028682239532470705,
563
- 0.028688383102416993,
564
- 0.02882252883911133,
565
- 0.028712959289550782,
566
- 0.028655616760253907,
567
- 0.028528640747070313,
568
- 0.028660736083984374,
569
- 0.028589088439941405,
570
- 0.028756959915161133,
571
- 0.028620800018310546,
572
- 0.028669952392578125,
573
- 0.02855241584777832,
574
- 0.028652320861816405,
575
- 0.02857164764404297,
576
- 0.0287457275390625,
577
- 0.02872012710571289,
578
- 0.02869964790344238,
579
- 0.028674047470092775,
580
- 0.02875596809387207,
581
- 0.028625919342041017,
582
- 0.028673023223876954,
583
- 0.02869964790344238,
584
- 0.028685312271118164,
585
- 0.029190143585205077,
586
- 0.02873139190673828,
587
- 0.02878361511230469,
588
- 0.028750848770141602,
589
- 0.028676095962524413,
590
- 0.028666879653930662,
591
- 0.028667903900146483,
592
- 0.028694528579711914,
593
- 0.02871603202819824,
594
- 0.028678144454956055,
595
- 0.02875494384765625,
596
- 0.028651519775390624,
597
- 0.02875801658630371,
598
- 0.02874675178527832,
599
- 0.02877235221862793,
600
- 0.02873139190673828,
601
- 0.028992511749267577,
602
- 0.02875187110900879,
603
- 0.028684288024902343,
604
- 0.028785663604736327,
605
- 0.028711936950683595,
606
- 0.02872012710571289,
607
- 0.028865535736083983,
608
- 0.028841983795166014,
609
- 0.02877132797241211,
610
- 0.02860851287841797,
611
- 0.028832767486572267,
612
- 0.028737535476684572,
613
- 0.02878054428100586,
614
- 0.02872831916809082,
615
- 0.028831743240356447,
616
- 0.028669952392578125,
617
- 0.028711936950683595,
618
- 0.028666879653930662,
619
- 0.028807167053222657,
620
- 0.028737535476684572,
621
- 0.02872012710571289,
622
- 0.028628992080688476,
623
- 0.028835840225219726,
624
- 0.028676095962524413,
625
- 0.02875187110900879,
626
- 0.028712959289550782,
627
- 0.028827648162841796,
628
- 0.02876620864868164,
629
- 0.028710912704467774,
630
- 0.028677120208740234,
631
- 0.02880512046813965,
632
- 0.028727296829223634,
633
- 0.028770303726196288,
634
- 0.028725248336791992,
635
- 0.028767232894897462,
636
- 0.028718080520629883,
637
- 0.028677120208740234,
638
- 0.02875699234008789,
639
- 0.02876927947998047,
640
- 0.028742656707763672,
641
- 0.02877132797241211,
642
- 0.028607519149780273,
643
- 0.02867299270629883,
644
- 0.02870681571960449,
645
- 0.0285849609375,
646
- 0.028579839706420897,
647
- 0.028625919342041017,
648
- 0.028697599411010744,
649
- 0.028687360763549805,
650
- 0.028655616760253907,
651
- 0.028658687591552736,
652
- 0.028718080520629883,
653
- 0.028656639099121094,
654
- 0.028641279220581056,
655
- 0.02901299285888672,
656
- 0.028620927810668946,
657
- 0.028702592849731444,
658
- 0.028696575164794923,
659
- 0.028727296829223634,
660
- 0.028709888458251953,
661
- 0.028636159896850585,
662
- 0.028597248077392577,
663
- 0.028665855407714845,
664
- 0.028678144454956055,
665
- 0.028799999237060548,
666
- 0.02860748863220215,
667
- 0.028669952392578125,
668
- 0.028703744888305665,
669
- 0.028662784576416016,
670
- 0.028659711837768553,
671
- 0.028679168701171875,
672
- 0.028997856140136717,
673
- 0.028719903945922852,
674
- 0.028668928146362304,
675
- 0.02859519958496094,
676
- 0.028630016326904296,
677
- 0.028618751525878908,
678
- 0.02857779121398926,
679
- 0.028632064819335938,
680
- 0.028484607696533205,
681
- 0.028670976638793946,
682
- 0.02857676887512207,
683
- 0.028695552825927735,
684
- 0.028656639099121094,
685
- 0.028733440399169922,
686
- 0.02851430320739746,
687
- 0.02869964790344238,
688
- 0.028594175338745118,
689
- 0.028679168701171875,
690
- 0.028630016326904296,
691
- 0.02859110450744629,
692
- 0.028503040313720703,
693
- 0.028614656448364258,
694
- 0.028515327453613282,
695
- 0.028645376205444335,
696
- 0.02855219268798828,
697
- 0.028673023223876954,
698
- 0.028508159637451173,
699
- 0.028762111663818358,
700
- 0.028620800018310546,
701
- 0.028622848510742187,
702
- 0.028635135650634767,
703
- 0.028590080261230468,
704
- 0.028717056274414062,
705
- 0.028684288024902343,
706
- 0.028622848510742187,
707
- 0.02874675178527832,
708
- 0.028626943588256838,
709
- 0.028579839706420897,
710
- 0.028641279220581056,
711
- 0.02872012710571289,
712
- 0.028663808822631837,
713
- 0.02874367904663086,
714
- 0.028672000885009766,
715
- 0.028701696395874023,
716
- 0.02859929656982422,
717
- 0.0287324161529541,
718
- 0.028622848510742187,
719
- 0.0285665283203125,
720
- 0.028665855407714845,
721
- 0.02856550407409668,
722
- 0.02856550407409668,
723
- 0.02869862365722656,
724
- 0.028794879913330077,
725
- 0.029240320205688477,
726
- 0.028662784576416016,
727
- 0.02856857681274414,
728
- 0.028627967834472655,
729
- 0.028653568267822265,
730
- 0.028625919342041017,
731
- 0.028630016326904296,
732
- 0.028719104766845704,
733
- 0.028672000885009766,
734
- 0.028611583709716795,
735
- 0.028639232635498047,
736
- 0.028697599411010744,
737
- 0.028703744888305665,
738
- 0.028636159896850585,
739
- 0.028750848770141602,
740
- 0.02857062339782715,
741
- 0.028703744888305665,
742
- 0.02898636817932129,
743
- 0.028638208389282226,
744
- 0.0286167049407959,
745
- 0.028662784576416016,
746
- 0.028596223831176756,
747
- 0.028589056015014647,
748
- 0.028511232376098632,
749
- 0.028598272323608398,
750
- 0.028677120208740234,
751
- 0.0287774715423584,
752
- 0.028691455841064452,
753
- 0.02874777603149414,
754
- 0.02862816047668457,
755
- 0.028746623992919922,
756
- 0.02870675277709961,
757
- 0.02873958396911621,
758
- 0.02875494384765625,
759
- 0.028853248596191407,
760
- 0.02879692840576172,
761
- 0.028817407608032225,
762
- 0.028742656707763672,
763
- 0.028688383102416993,
764
- 0.028660736083984374,
765
- 0.028618751525878908,
766
- 0.028712959289550782,
767
- 0.028596223831176756,
768
- 0.028832767486572267,
769
- 0.02852659225463867,
770
- 0.028602367401123048,
771
- 0.028690431594848635,
772
- 0.02866694450378418,
773
- 0.028684223175048828,
774
- 0.02854707145690918,
775
- 0.028622848510742187,
776
- 0.028528640747070313,
777
- 0.028823551177978517,
778
- 0.028889087677001952,
779
- 0.02874163246154785,
780
- 0.028661760330200195,
781
- 0.0287324161529541,
782
- 0.028601343154907227,
783
- 0.028684288024902343,
784
- 0.02858620834350586,
785
- 0.028834592819213866,
786
- 0.02859212875366211,
787
- 0.028665855407714845,
788
- 0.028490751266479493,
789
- 0.028670976638793946,
790
- 0.028564479827880858,
791
- 0.028684288024902343,
792
- 0.028645376205444335,
793
- 0.028795904159545898,
794
- 0.0286167049407959,
795
- 0.028931072235107422,
796
- 0.028642303466796876,
797
- 0.02874060821533203,
798
- 0.028516351699829103,
799
- 0.02858188819885254,
800
- 0.02858393669128418,
801
- 0.028686336517333984,
802
- 0.028685312271118164,
803
- 0.028697599411010744,
804
- 0.028601343154907227,
805
- 0.028672000885009766,
806
- 0.028453887939453124,
807
- 0.028610559463500978,
808
- 0.02858598327636719,
809
- 0.02872217559814453,
810
- 0.028505088806152344,
811
- 0.02862387275695801,
812
- 0.02916761589050293,
813
- 0.02872012710571289,
814
- 0.028468223571777345,
815
- 0.02871603202819824,
816
- 0.02852454376220703,
817
- 0.02873651123046875,
818
- 0.028590080261230468,
819
- 0.028719104766845704,
820
- 0.02856857681274414,
821
- 0.028613632202148437,
822
- 0.02852659225463867,
823
- 0.028680192947387696,
824
- 0.02860256004333496,
825
- 0.0287076473236084,
826
- 0.02853068733215332,
827
- 0.028619775772094725,
828
- 0.028624895095825196,
829
- 0.028624895095825196,
830
- 0.028602367401123048
831
  ]
832
  },
833
  "throughput": {
834
  "unit": "tokens/s",
835
- "value": 34.8442163064611
836
  },
837
  "energy": null,
838
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 3078.4512,
6
+ "max_vram": 5981.077504,
7
+ "max_reserved": 5496.635392,
8
+ "max_allocated": 5273.977856
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.30716638276071256,
13
+ "stdev": 0.0009185968346906661,
14
  "values": [
15
+ 0.3119903869628906,
16
+ 0.3088045959472656,
17
+ 0.3071365661621094,
18
+ 0.30677197265625,
19
+ 0.30710476684570315,
20
+ 0.30677401733398435,
21
+ 0.30709042358398436,
22
+ 0.30680267333984373,
23
+ 0.30704742431640625,
24
+ 0.306798583984375,
25
+ 0.30709051513671876,
26
+ 0.30681396484375,
27
+ 0.30705255126953124,
28
+ 0.3068487548828125,
29
+ 0.3070996398925781,
30
+ 0.30679653930664064,
31
+ 0.30710372924804685,
32
+ 0.30680294799804686,
33
+ 0.3070330810546875,
34
+ 0.3068620910644531,
35
+ 0.3070586853027344,
36
+ 0.3068264465332031,
37
+ 0.30706277465820314,
38
+ 0.30687640380859377,
39
+ 0.3070453796386719,
40
+ 0.30687948608398435,
41
+ 0.3071150207519531,
42
+ 0.3068538818359375,
43
+ 0.30714572143554686,
44
+ 0.306808837890625,
45
+ 0.3070709838867188,
46
+ 0.30686822509765627,
47
+ 0.3070535583496094
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
48
  ]
49
  },
50
  "throughput": {
51
  "unit": "tokens/s",
52
+ "value": 833.4245359116268
53
  },
54
  "energy": null,
55
  "efficiency": null
 
57
  "decode": {
58
  "memory": {
59
  "unit": "MB",
60
+ "max_ram": 3078.4512,
61
+ "max_vram": 6234.832896,
62
+ "max_reserved": 5750.390784,
63
+ "max_allocated": 5425.04704
64
  },
65
  "latency": {
66
  "unit": "s",
67
+ "mean": 76.54886825561519,
68
+ "stdev": 0,
69
  "values": [
70
+ 76.54886825561519
 
71
  ]
72
  },
73
  "throughput": {
74
  "unit": "tokens/s",
75
+ "value": 3.331205356929554
76
  },
77
  "energy": null,
78
  "efficiency": null
 
81
  "memory": null,
82
  "latency": {
83
  "unit": "s",
84
+ "mean": 0.3001916402180988,
85
+ "stdev": 0.00047061196976397096,
86
  "values": [
87
+ 0.29955584716796874,
88
+ 0.3000914001464844,
89
+ 0.3001548767089844,
90
+ 0.29994189453125,
91
+ 0.3001149291992187,
92
+ 0.30003814697265624,
93
+ 0.30010983276367187,
94
+ 0.300147705078125,
95
+ 0.3001466979980469,
96
+ 0.3000217590332031,
97
+ 0.3000340576171875,
98
+ 0.3000115051269531,
99
+ 0.300105712890625,
100
+ 0.3000074157714844,
101
+ 0.3001026611328125,
102
+ 0.30018865966796876,
103
+ 0.2999521179199219,
104
+ 0.2999582824707031,
105
+ 0.3000924072265625,
106
+ 0.30001254272460937,
107
+ 0.3002030029296875,
108
+ 0.2999336853027344,
109
+ 0.29999819946289064,
110
+ 0.2998835144042969,
111
+ 0.3000094604492187,
112
+ 0.3000657958984375,
113
+ 0.2999941101074219,
114
+ 0.30008935546875,
115
+ 0.3000012817382812,
116
+ 0.29993472290039064,
117
+ 0.30010366821289064,
118
+ 0.29994085693359374,
119
+ 0.30014361572265624,
120
+ 0.2999797668457031,
121
+ 0.30006500244140627,
122
+ 0.29997955322265624,
123
+ 0.3001272277832031,
124
+ 0.29998797607421873,
125
+ 0.30003302001953125,
126
+ 0.3002931213378906,
127
+ 0.30011700439453126,
128
+ 0.3000688781738281,
129
+ 0.30010366821289064,
130
+ 0.300126220703125,
131
+ 0.3000361022949219,
132
+ 0.30014566040039065,
133
+ 0.3000084533691406,
134
+ 0.3001968688964844,
135
+ 0.3000565795898438,
136
+ 0.3001815185546875,
137
+ 0.30014566040039065,
138
+ 0.3001845703125,
139
+ 0.30017230224609376,
140
+ 0.3000637512207031,
141
+ 0.3001221008300781,
142
+ 0.300037109375,
143
+ 0.30008319091796876,
144
+ 0.3000627136230469,
145
+ 0.30003201293945314,
146
+ 0.3001763916015625,
147
+ 0.3001343994140625,
148
+ 0.3002296447753906,
149
+ 0.30043136596679687,
150
+ 0.30008218383789065,
151
+ 0.30005966186523436,
152
+ 0.30004019165039064,
153
+ 0.3001070861816406,
154
+ 0.3002006530761719,
155
+ 0.3000074157714844,
156
+ 0.3001917419433594,
157
+ 0.3000555419921875,
158
+ 0.30009344482421874,
159
+ 0.3000975341796875,
160
+ 0.30015179443359374,
161
+ 0.3001395263671875,
162
+ 0.30008831787109375,
163
+ 0.300084228515625,
164
+ 0.300000244140625,
165
+ 0.30001254272460937,
166
+ 0.30010983276367187,
167
+ 0.3000012817382812,
168
+ 0.30006988525390627,
169
+ 0.3000135803222656,
170
+ 0.30007601928710936,
171
+ 0.2999808044433594,
172
+ 0.30020095825195314,
173
+ 0.30154547119140623,
174
+ 0.300253173828125,
175
+ 0.3001047058105469,
176
+ 0.30017535400390627,
177
+ 0.30011117553710936,
178
+ 0.3001391906738281,
179
+ 0.3001538696289062,
180
+ 0.30010983276367187,
181
+ 0.3002378234863281,
182
+ 0.30011187744140627,
183
+ 0.30008831787109375,
184
+ 0.3000862731933594,
185
+ 0.3000516967773437,
186
+ 0.3001136779785156,
187
+ 0.3000975341796875,
188
+ 0.3001600036621094,
189
+ 0.3000924072265625,
190
+ 0.299947021484375,
191
+ 0.2999183349609375,
192
+ 0.3000309753417969,
193
+ 0.30010983276367187,
194
+ 0.30004736328125,
195
+ 0.30563739013671876,
196
+ 0.30018865966796876,
197
+ 0.3001395263671875,
198
+ 0.3001917419433594,
199
+ 0.3000719299316406,
200
+ 0.3001845703125,
201
+ 0.3001294250488281,
202
+ 0.30013116455078126,
203
+ 0.30000537109375,
204
+ 0.3001128845214844,
205
+ 0.30006784057617186,
206
+ 0.3002572937011719,
207
+ 0.3000975341796875,
208
+ 0.3001702270507812,
209
+ 0.3001200561523438,
210
+ 0.3001395263671875,
211
+ 0.3000238037109375,
212
+ 0.30023373413085935,
213
+ 0.3000985717773437,
214
+ 0.30015896606445314,
215
+ 0.3005962219238281,
216
+ 0.3003504638671875,
217
+ 0.300052490234375,
218
+ 0.3002798156738281,
219
+ 0.30012313842773436,
220
+ 0.30017535400390627,
221
+ 0.30045901489257815,
222
+ 0.3001548767089844,
223
+ 0.30305484008789063,
224
+ 0.3030456237792969,
225
+ 0.3004682312011719,
226
+ 0.30018765258789065,
227
+ 0.30012518310546876,
228
+ 0.30031155395507814,
229
+ 0.30003814697265624,
230
+ 0.3001241455078125,
231
+ 0.2999439392089844,
232
+ 0.30018661499023436,
233
+ 0.300084228515625,
234
+ 0.3000668029785156,
235
+ 0.30013644409179685,
236
+ 0.3020902404785156,
237
+ 0.3002941589355469,
238
+ 0.30020913696289064,
239
+ 0.3001077880859375,
240
+ 0.3004375,
241
+ 0.3000709228515625,
242
+ 0.3002245178222656,
243
+ 0.3001630859375,
244
+ 0.30010162353515624,
245
+ 0.30039141845703127,
246
+ 0.30006170654296876,
247
+ 0.3000852355957031,
248
+ 0.3000924072265625,
249
+ 0.3000227966308594,
250
+ 0.2999931030273438,
251
+ 0.30006170654296876,
252
+ 0.3000555419921875,
253
+ 0.30010879516601563,
254
+ 0.300115966796875,
255
+ 0.30013748168945314,
256
+ 0.3001640930175781,
257
+ 0.30014361572265624,
258
+ 0.2999459838867187,
259
+ 0.3002265625,
260
+ 0.30009036254882815,
261
+ 0.30015179443359374,
262
+ 0.3001026611328125,
263
+ 0.30017535400390627,
264
+ 0.30015078735351564,
265
+ 0.3001559143066406,
266
+ 0.3001978759765625,
267
+ 0.3002818603515625,
268
+ 0.30021630859375,
269
+ 0.3002941589355469,
270
+ 0.3001835632324219,
271
+ 0.3001743469238281,
272
+ 0.3001825256347656,
273
+ 0.30012518310546876,
274
+ 0.30023065185546877,
275
+ 0.30016717529296877,
276
+ 0.30008319091796876,
277
+ 0.3000657958984375,
278
+ 0.29989376831054687,
279
+ 0.30003302001953125,
280
+ 0.300189697265625,
281
+ 0.3000157775878906,
282
+ 0.30008099365234375,
283
+ 0.30001254272460937,
284
+ 0.30023577880859376,
285
+ 0.30006784057617186,
286
+ 0.3001681823730469,
287
+ 0.3006085205078125,
288
+ 0.300199951171875,
289
+ 0.3002019958496094,
290
+ 0.30002688598632815,
291
+ 0.3001077880859375,
292
+ 0.3001190490722656,
293
+ 0.3000606689453125,
294
+ 0.3000606689453125,
295
+ 0.3000791015625,
296
+ 0.3000627136230469,
297
+ 0.30002688598632815,
298
+ 0.30010879516601563,
299
+ 0.29994906616210937,
300
+ 0.30015078735351564,
301
+ 0.29995928955078127,
302
+ 0.3001692199707031,
303
+ 0.3001538696289062,
304
+ 0.30012313842773436,
305
+ 0.30022991943359373,
306
+ 0.30020272827148436,
307
+ 0.30016717529296877,
308
+ 0.30015078735351564,
309
+ 0.3002470397949219,
310
+ 0.3000719299316406,
311
+ 0.3001702270507812,
312
+ 0.30023373413085935,
313
+ 0.3001405334472656,
314
+ 0.30029208374023436,
315
+ 0.3001845703125,
316
+ 0.30018560791015625,
317
+ 0.3003924560546875,
318
+ 0.30023678588867186,
319
+ 0.3009228820800781,
320
+ 0.30029208374023436,
321
+ 0.3003290710449219,
322
+ 0.30029815673828125,
323
+ 0.3002378234863281,
324
+ 0.30027059936523437,
325
+ 0.30020404052734373,
326
+ 0.30021221923828123,
327
+ 0.3001958312988281,
328
+ 0.30032589721679687,
329
+ 0.30022467041015627,
330
+ 0.3003216247558594,
331
+ 0.3003056945800781,
332
+ 0.30029180908203124,
333
+ 0.30029107666015625,
334
+ 0.30008218383789065,
335
+ 0.30000436401367186,
336
+ 0.3002746887207031,
337
+ 0.3003036804199219,
338
+ 0.3002559509277344,
339
+ 0.3001610107421875,
340
+ 0.30046414184570314,
341
+ 0.3003453369140625
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
342
  ]
343
  },
344
  "throughput": {
345
  "unit": "tokens/s",
346
+ "value": 3.3312053569295537
347
  },
348
  "energy": null,
349
  "efficiency": null