kreas commited on
Commit
7db6534
1 Parent(s): 38d11f6

Upload /Mistral-7B-v0.1-GPTQ-4bit/gptq4bit_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Mistral-7B-v0.1-GPTQ-4bit/gptq4bit_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,257 +2,257 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 7501.16864,
6
  "max_vram": 5544.869888,
7
  "max_reserved": 5058.330624,
8
  "max_allocated": 4906.976256
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.04247161491846634,
13
- "stdev": 9.919363500733545e-05,
14
  "values": [
15
- 0.04393843078613281,
16
- 0.04244582366943359,
17
- 0.042456062316894534,
18
- 0.042439678192138675,
19
- 0.042433536529541016,
20
- 0.04244377517700195,
21
- 0.04245401763916016,
22
- 0.042466304779052735,
23
- 0.042447872161865234,
24
- 0.04246441650390625,
25
- 0.042651649475097655,
26
- 0.04245913696289062,
27
- 0.042446849822998046,
28
- 0.04242038345336914,
29
- 0.04247859191894531,
30
- 0.04244889450073242,
31
- 0.04245094299316406,
32
- 0.04244070434570312,
33
- 0.04247552108764648,
34
- 0.042433536529541016,
35
- 0.04245503997802735,
36
- 0.042472446441650394,
37
- 0.04245094299316406,
38
- 0.04247552108764648,
39
- 0.04244582366943359,
40
- 0.04245401763916016,
41
- 0.04245913696289062,
42
- 0.04244172668457031,
43
- 0.04243558502197266,
44
- 0.0424356803894043,
45
- 0.04244582366943359,
46
- 0.042452991485595705,
47
  0.04245401763916016,
48
- 0.04245708847045898,
49
- 0.042444801330566405,
50
  0.042464256286621094,
51
- 0.04245811080932617,
52
- 0.04245913696289062,
53
- 0.042485759735107424,
54
- 0.042485759735107424,
55
- 0.04248883056640625,
56
- 0.042449920654296876,
57
- 0.042449920654296876,
58
- 0.04246220779418945,
59
- 0.04246835327148438,
60
- 0.042461185455322265,
61
- 0.042469375610351565,
62
  0.04244889450073242,
 
 
 
 
 
 
 
 
 
63
  0.04245913696289062,
 
64
  0.042461185455322265,
65
- 0.04248883056640625,
66
- 0.042466304779052735,
67
- 0.04243558502197266,
68
- 0.042482688903808595,
69
- 0.04247964859008789,
70
  0.042449920654296876,
71
- 0.0424736328125,
72
- 0.042444801330566405,
73
- 0.04247552108764648,
74
- 0.042472446441650394,
75
- 0.042472446441650394,
76
  0.04244275283813476,
77
- 0.0424376335144043,
78
- 0.04242124938964844,
79
- 0.04246527862548828,
80
  0.042472446441650394,
81
- 0.0424683837890625,
82
- 0.04248166275024414,
83
- 0.042444801330566405,
84
- 0.04240793609619141,
85
- 0.042464256286621094,
 
86
  0.042447872161865234,
87
- 0.042464256286621094,
88
- 0.042464256286621094,
89
- 0.042477569580078124,
90
- 0.04245913696289062,
 
 
 
 
91
  0.042449920654296876,
92
- 0.042439678192138675,
93
- 0.042501121520996096,
94
- 0.042447872161865234,
95
- 0.04247071838378906,
96
  0.04245708847045898,
97
- 0.04246239852905274,
98
- 0.042493953704833984,
99
  0.04245401763916016,
100
- 0.04248473739624024,
101
- 0.04247040176391602,
102
- 0.04248166275024414,
103
- 0.042461185455322265,
104
- 0.042446849822998046,
105
  0.04247552108764648,
106
- 0.042469375610351565,
107
- 0.04246527862548828,
 
 
 
 
 
 
 
 
108
  0.04246527862548828,
109
- 0.04245811080932617,
110
- 0.04248166275024414,
111
- 0.04246227264404297,
112
- 0.04244889450073242,
113
- 0.042461185455322265,
114
- 0.04244889450073242,
115
- 0.0424796142578125,
116
  0.04244889450073242,
 
117
  0.042472446441650394,
 
 
 
 
118
  0.04245401763916016,
119
  0.042464256286621094,
120
- 0.04246527862548828,
121
- 0.04245708847045898,
122
- 0.04244889450073242,
123
- 0.04248064041137695,
124
- 0.04245119857788086,
125
  0.04245196914672852,
126
- 0.04244275283813476,
127
- 0.042464256286621094,
128
- 0.042439678192138675,
129
  0.042466304779052735,
130
- 0.04245094299316406,
131
- 0.04248064041137695,
132
- 0.04244275283813476,
133
- 0.042482688903808595,
134
- 0.042452991485595705,
135
- 0.0424796142578125,
 
 
136
  0.042461185455322265,
137
- 0.042427455902099606,
138
- 0.04244582366943359,
139
  0.04248064041137695,
 
 
 
140
  0.04246015930175781,
141
- 0.04244889450073242,
142
- 0.042472446441650394,
143
- 0.04246732711791992,
 
 
144
  0.04244582366943359,
145
- 0.04248883056640625,
146
- 0.042482688903808595,
147
- 0.04248883056640625,
 
 
148
  0.04248064041137695,
149
- 0.042472446441650394,
150
- 0.042447872161865234,
151
- 0.042501121520996096,
152
- 0.04244889450073242,
153
- 0.042444801330566405,
154
- 0.04247449493408203,
155
- 0.042426368713378904,
156
- 0.04248678588867188,
157
- 0.042493247985839845,
158
- 0.04246220779418945,
159
- 0.0424376335144043,
160
- 0.04247347259521484,
161
- 0.0424898567199707,
162
- 0.04244095993041992,
163
  0.04245708847045898,
164
- 0.04246527862548828,
165
- 0.042463294982910155,
166
  0.042472446441650394,
167
- 0.04251238250732422,
168
- 0.04245094299316406,
169
- 0.04244889450073242,
170
- 0.04247449493408203,
171
- 0.042477790832519534,
172
- 0.04248064041137695,
173
- 0.042461185455322265,
 
174
  0.04248166275024414,
 
175
  0.04246527862548828,
176
- 0.042449920654296876,
177
- 0.04246220779418945,
178
- 0.042449920654296876,
179
- 0.042471424102783206,
180
- 0.04246428680419922,
181
- 0.0424898567199707,
182
- 0.0424376335144043,
183
- 0.04246835327148438,
184
- 0.042466304779052735,
185
- 0.042472446441650394,
186
- 0.042469375610351565,
187
- 0.042471424102783206,
188
- 0.04244582366943359,
189
- 0.04248473739624024,
190
- 0.04249711990356445,
191
- 0.04249190521240234,
192
- 0.04246656036376953,
193
- 0.0424796142578125,
194
  0.04245811080932617,
195
- 0.04245935821533203,
196
- 0.04248681640625,
197
- 0.04247766494750976,
 
 
 
 
198
  0.04247552108764648,
199
- 0.04249497604370117,
200
- 0.042439678192138675,
201
- 0.042459297180175784,
202
- 0.042469375610351565,
203
- 0.04248883056640625,
204
- 0.042444801330566405,
205
- 0.042501121520996096,
206
- 0.042447872161865234,
207
  0.0424796142578125,
208
- 0.042487808227539066,
209
  0.04247552108764648,
210
- 0.042448001861572264,
211
- 0.04247040176391602,
212
- 0.04244377517700195,
213
- 0.04248166275024414,
214
- 0.04247859191894531,
215
- 0.04246732711791992,
216
- 0.042472446441650394,
217
- 0.04246432113647461,
218
- 0.042708992004394535,
219
- 0.04246025466918945,
220
- 0.04246220779418945,
221
  0.04245708847045898,
222
- 0.042447872161865234,
223
- 0.04247654342651367,
224
- 0.04247654342651367,
225
- 0.042469375610351565,
226
- 0.04246531295776367,
227
- 0.042452991485595705,
228
  0.04245811080932617,
229
- 0.042477790832519534,
230
- 0.042471424102783206,
 
 
231
  0.04247040176391602,
232
- 0.04244073486328125,
233
- 0.0424901123046875,
 
 
 
 
 
 
 
234
  0.042464256286621094,
235
- 0.042472446441650394,
236
- 0.042460224151611325,
237
- 0.04246732711791992,
238
- 0.042471424102783206,
239
  0.042482688903808595,
 
 
 
 
 
240
  0.042446849822998046,
 
 
 
 
241
  0.04246323013305664,
242
- 0.04248089599609375,
243
- 0.042491935729980466,
244
- 0.04247654342651367,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
245
  0.04248064041137695,
246
- 0.042449920654296876,
 
 
 
247
  0.04247552108764648,
248
- 0.042461185455322265,
249
- 0.04248473739624024,
250
- 0.042466304779052735
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
251
  ]
252
  },
253
  "throughput": {
254
  "unit": "tokens/s",
255
- "value": 6027.555121024915
256
  },
257
  "energy": null,
258
  "efficiency": null
@@ -260,23 +260,23 @@
260
  "decode": {
261
  "memory": {
262
  "unit": "MB",
263
- "max_ram": 7503.265792,
264
  "max_vram": 5716.836352,
265
  "max_reserved": 5230.297088,
266
  "max_allocated": 5031.01696
267
  },
268
  "latency": {
269
  "unit": "s",
270
- "mean": 5.773392906188963,
271
- "stdev": 0.0043458652496339845,
272
  "values": [
273
- 5.769047040939329,
274
- 5.777738771438597
275
  ]
276
  },
277
  "throughput": {
278
  "unit": "tokens/s",
279
- "value": 44.1681354696378
280
  },
281
  "energy": null,
282
  "efficiency": null
@@ -285,524 +285,524 @@
285
  "memory": null,
286
  "latency": {
287
  "unit": "s",
288
- "mean": 0.022640756494858666,
289
- "stdev": 0.0005619443258706103,
290
  "values": [
291
- 0.025393152236938478,
292
- 0.023914560317993164,
293
- 0.02256377601623535,
294
- 0.022544384002685547,
295
- 0.022500352859497072,
296
- 0.022512800216674806,
297
- 0.022468448638916016,
298
- 0.022534143447875975,
299
- 0.02270524787902832,
300
- 0.022516639709472656,
301
- 0.02248806381225586,
302
- 0.022373376846313478,
303
- 0.0224399356842041,
304
- 0.022460416793823244,
305
- 0.022466560363769532,
306
- 0.022647808074951172,
307
- 0.022384639739990234,
308
- 0.022408191680908202,
309
- 0.022310047149658202,
310
- 0.022412128448486328,
311
- 0.022372352600097657,
312
- 0.02246143913269043,
313
- 0.02244710350036621,
314
- 0.02255564880371094,
315
- 0.02235215950012207,
316
- 0.02240278434753418,
317
- 0.02246348762512207,
318
- 0.022421503067016603,
319
- 0.022373376846313478,
320
- 0.022392831802368163,
321
- 0.02243071937561035,
322
- 0.02248908805847168,
323
- 0.022427648544311524,
324
- 0.022399200439453124,
325
- 0.022379295349121094,
326
- 0.022364288330078124,
327
- 0.02233843231201172,
328
- 0.02246963119506836,
329
- 0.02233679962158203,
330
- 0.0225248966217041,
331
- 0.022320192337036134,
332
- 0.022371007919311525,
333
- 0.022312959671020507,
334
- 0.02227609634399414,
335
- 0.022322175979614257,
336
- 0.022364160537719727,
337
- 0.022399999618530272,
338
- 0.022537216186523438,
339
- 0.0224716796875,
340
- 0.022427648544311524,
341
- 0.022426624298095704,
342
- 0.022383615493774413,
343
- 0.022445056915283205,
344
- 0.022436864852905275,
345
- 0.022378496170043945,
346
- 0.02246963119506836,
347
- 0.02241535949707031,
348
- 0.022377471923828125,
349
- 0.022387903213500978,
350
- 0.02239366340637207,
351
- 0.022403072357177735,
352
- 0.02230886459350586,
353
- 0.022336511611938475,
354
- 0.022577152252197266,
355
- 0.022334463119506837,
356
- 0.02237353515625,
357
- 0.022425535202026368,
358
- 0.02244803237915039,
359
- 0.02242355155944824,
360
- 0.0223191032409668,
361
- 0.022424575805664062,
362
- 0.02251263999938965,
363
- 0.022427648544311524,
364
- 0.022460416793823244,
365
- 0.02249932861328125,
366
- 0.022321151733398437,
367
- 0.022406143188476564,
368
- 0.02248297691345215,
369
- 0.022485984802246093,
370
- 0.022508544921875,
371
- 0.022465791702270508,
372
- 0.02247760009765625,
373
- 0.023648223876953124,
374
- 0.022518783569335937,
375
- 0.022335487365722655,
376
- 0.02327859115600586,
377
- 0.023742464065551756,
378
- 0.022545408248901368,
379
- 0.02242252731323242,
380
- 0.02237353515625,
381
- 0.02233123207092285,
382
- 0.022405120849609376,
383
- 0.022427648544311524,
384
- 0.022552576065063477,
385
- 0.02249932861328125,
386
- 0.022535167694091796,
387
- 0.022405248641967773,
388
- 0.022448223114013673,
389
- 0.022604639053344727,
390
- 0.022947776794433595,
391
- 0.022914047241210937,
392
- 0.022476959228515624,
393
- 0.02231996726989746,
394
- 0.022519807815551757,
395
- 0.022722560882568358,
396
- 0.02250979232788086,
397
- 0.022420255661010743,
398
- 0.02246348762512207,
399
- 0.02243174362182617,
400
- 0.022419519424438476,
401
- 0.022465471267700196,
402
- 0.022914047241210937,
403
- 0.022969343185424804,
404
- 0.022795263290405272,
405
- 0.022837247848510742,
406
- 0.022939647674560547,
407
- 0.022861824035644532,
408
- 0.022200319290161134,
409
- 0.022336544036865233,
410
- 0.022430688858032226,
411
- 0.022364160537719727,
412
- 0.022471935272216796,
413
- 0.022432512283325195,
414
- 0.022383615493774413,
415
- 0.022311935424804686,
416
- 0.022369279861450195,
417
- 0.022849536895751952,
418
- 0.022809600830078124,
419
- 0.03188534355163574,
420
- 0.029729759216308594,
421
- 0.02269696044921875,
422
- 0.02257935905456543,
423
- 0.022663135528564454,
424
- 0.02254732894897461,
425
- 0.022642688751220705,
426
- 0.022610944747924806,
427
- 0.022503488540649413,
428
- 0.022532032012939452,
429
- 0.02254745674133301,
430
- 0.022598655700683593,
431
- 0.022587423324584962,
432
- 0.02253615951538086,
433
- 0.02264575958251953,
434
- 0.02253209686279297,
435
- 0.022520832061767578,
436
- 0.022511615753173828,
437
- 0.02255564880371094,
438
- 0.022531232833862304,
439
- 0.022481760025024413,
440
- 0.02267033576965332,
441
- 0.022511615753173828,
442
- 0.022579200744628908,
443
- 0.02248192024230957,
444
- 0.02248089599609375,
445
- 0.0224849910736084,
446
- 0.022434816360473633,
447
- 0.022558719635009765,
448
- 0.022495231628417968,
449
- 0.022500352859497072,
450
- 0.022471935272216796,
451
- 0.02254003143310547,
452
- 0.02252288055419922,
453
- 0.02246246337890625,
454
- 0.022553600311279298,
455
- 0.022502592086791992,
456
- 0.022482751846313476,
457
- 0.022548479080200197,
458
- 0.022494207382202147,
459
- 0.02254745674133301,
460
- 0.022549535751342772,
461
- 0.02251772880554199,
462
- 0.022559743881225586,
463
- 0.023778400421142577,
464
- 0.022663072586059572,
465
- 0.022542335510253905,
466
- 0.022597631454467772,
467
- 0.02280243110656738,
468
- 0.02261299133300781,
469
- 0.022544384002685547,
470
- 0.022593536376953126,
471
- 0.0224768009185791,
472
- 0.022518783569335937,
473
- 0.02253926467895508,
474
- 0.022615039825439453,
475
- 0.022558975219726562,
476
- 0.022537984848022462,
477
- 0.022558719635009765,
478
- 0.02251692771911621,
479
- 0.022532928466796876,
480
- 0.022562047958374024,
481
- 0.022596351623535155,
482
- 0.022595584869384764,
483
- 0.022602752685546876,
484
- 0.02254745674133301,
485
- 0.022664192199707032,
486
- 0.022560768127441407,
487
- 0.022624256134033204,
488
- 0.022594560623168947,
489
- 0.022590463638305663,
490
- 0.022571008682250978,
491
- 0.02305433654785156,
492
- 0.02266726493835449,
493
- 0.022628448486328126,
494
- 0.02264463996887207,
495
- 0.022666240692138673,
496
- 0.022587392807006838,
497
- 0.022663232803344726,
498
- 0.022523839950561522,
499
- 0.0225218563079834,
500
- 0.022529247283935547,
501
- 0.022600479125976562,
502
- 0.022495231628417968,
503
- 0.022583295822143554,
504
- 0.022616064071655274,
505
- 0.022562816619873048,
506
- 0.022583295822143554,
507
- 0.02252720069885254,
508
- 0.022514463424682617,
509
- 0.022616064071655274,
510
- 0.022492160797119142,
511
- 0.02253824043273926,
512
- 0.022518783569335937,
513
- 0.022561792373657227,
514
- 0.022525951385498046,
515
- 0.022550752639770508,
516
- 0.022599456787109375,
517
- 0.02267136001586914,
518
- 0.022664192199707032,
519
- 0.022599679946899414,
520
- 0.022600704193115235,
521
- 0.02269696044921875,
522
  0.02266009521484375,
523
- 0.023018495559692383,
524
- 0.02270310401916504,
525
- 0.02266316795349121,
526
- 0.022582271575927734,
527
  0.022575103759765625,
528
- 0.02265088081359863,
529
- 0.02270515251159668,
530
- 0.022551551818847656,
531
- 0.022567935943603516,
532
- 0.022552576065063477,
533
- 0.022541311264038084,
534
- 0.022558719635009765,
535
- 0.022614015579223632,
536
- 0.022587392807006838,
537
- 0.022633472442626954,
538
- 0.0226375675201416,
539
- 0.02254643249511719,
540
- 0.022897663116455077,
541
- 0.022585344314575196,
542
- 0.02251263999938965,
543
  0.022556671142578123,
544
- 0.0224901123046875,
545
- 0.022408191680908202,
546
- 0.022818912506103517,
547
- 0.022800416946411134,
548
- 0.022662336349487305,
549
- 0.02265465545654297,
550
- 0.02262937545776367,
551
- 0.022647808074951172,
552
- 0.022597759246826173,
553
- 0.022836095809936525,
554
- 0.022799360275268556,
555
- 0.022557695388793944,
556
- 0.022605823516845702,
557
- 0.02264473533630371,
558
- 0.022656000137329102,
559
- 0.02267033576965332,
560
- 0.022593536376953126,
561
- 0.022784000396728517,
562
- 0.02265907287597656,
563
- 0.022683647155761717,
564
- 0.02260406494140625,
565
- 0.022675167083740233,
566
- 0.022595903396606446,
567
- 0.022673088073730467,
568
- 0.022616064071655274,
569
- 0.022777856826782225,
570
- 0.022565887451171874,
571
- 0.022816768646240236,
572
- 0.022656000137329102,
573
- 0.02265088081359863,
574
- 0.022558719635009765,
575
- 0.022718463897705078,
576
- 0.022618431091308594,
577
- 0.022737600326538085,
578
- 0.022616064071655274,
579
  0.022603776931762694,
580
- 0.022608896255493165,
 
 
 
 
 
581
  0.022603776931762694,
582
- 0.02256719970703125,
583
- 0.022680320739746095,
584
- 0.022625280380249024,
585
- 0.02273481559753418,
586
- 0.022632448196411133,
587
- 0.022577152252197266,
588
- 0.02263859176635742,
589
- 0.022658048629760744,
590
- 0.022754304885864256,
591
- 0.022567935943603516,
592
- 0.022626304626464845,
593
- 0.022601728439331056,
594
- 0.022654144287109376,
595
- 0.022558752059936522,
596
- 0.02252060890197754,
597
  0.022569984436035157,
598
- 0.022647808074951172,
599
- 0.022623231887817383,
600
- 0.02264089584350586,
601
- 0.022690559387207033,
602
- 0.022552576065063477,
603
  0.022615039825439453,
604
- 0.022619136810302733,
605
- 0.022635583877563478,
606
- 0.02264790344238281,
607
- 0.022656864166259765,
608
- 0.022693119049072265,
609
- 0.02276531219482422,
610
- 0.022623296737670898,
611
- 0.02265100860595703,
612
- 0.02261382484436035,
613
- 0.02267750358581543,
614
- 0.02267750358581543,
615
- 0.0227061767578125,
616
- 0.02270412826538086,
617
- 0.022784223556518556,
618
- 0.022608671188354492,
619
- 0.022694047927856446,
620
- 0.022616928100585937,
621
- 0.022642688751220705,
622
- 0.022642688751220705,
623
- 0.02255462455749512,
624
- 0.02266828727722168,
625
- 0.02275328063964844,
626
- 0.022666240692138673,
627
- 0.02262118339538574,
628
- 0.023946239471435548,
629
- 0.02260479927062988,
630
- 0.022614015579223632,
631
- 0.0226212158203125,
632
- 0.022736864089965822,
633
- 0.02283417510986328,
634
- 0.022722560882568358,
635
- 0.022732799530029296,
636
- 0.02264371109008789,
637
- 0.02265292739868164,
638
- 0.022609952926635743,
639
- 0.02267747116088867,
640
- 0.02269388771057129,
641
- 0.022838272094726563,
642
- 0.02284441566467285,
643
- 0.02268057632446289,
644
- 0.02270515251159668,
645
- 0.022574079513549804,
646
- 0.02267136001586914,
647
- 0.0226693115234375,
648
- 0.02267136001586914,
649
- 0.022787200927734376,
650
- 0.02270502471923828,
651
- 0.02266214370727539,
652
- 0.02271129608154297,
653
- 0.02269696044921875,
654
- 0.02269081687927246,
655
  0.02266111946105957,
656
- 0.02268671989440918,
657
- 0.022767616271972657,
658
- 0.022610944747924806,
659
- 0.02263654327392578,
660
- 0.022664192199707032,
661
- 0.022750207901000977,
662
- 0.022607872009277344,
663
- 0.022552576065063477,
664
- 0.022627328872680662,
665
- 0.022614015579223632,
666
- 0.022623231887817383,
667
- 0.022584320068359375,
668
- 0.02265497589111328,
669
  0.022510591506958007,
670
- 0.022591487884521484,
671
- 0.022641664505004884,
672
- 0.02259660720825195,
673
- 0.022556671142578123,
674
- 0.022624256134033204,
675
- 0.0225230712890625,
676
- 0.022604608535766603,
677
- 0.022649951934814453,
678
- 0.02264569664001465,
679
- 0.022674400329589842,
680
  0.02255462455749512,
681
- 0.02253926467895508,
682
- 0.02253107261657715,
683
- 0.022597759246826173,
684
- 0.02249715232849121,
685
- 0.0225218563079834,
686
- 0.022651968002319337,
687
- 0.022516672134399413,
 
 
 
 
 
 
 
 
 
 
 
 
688
  0.022579200744628908,
689
- 0.022562816619873048,
690
- 0.022615135192871092,
691
- 0.0225053768157959,
692
- 0.0225218563079834,
693
- 0.022611967086791994,
694
- 0.023559167861938478,
 
 
 
 
 
 
 
695
  0.022623231887817383,
696
- 0.022735136032104492,
697
- 0.022677215576171875,
698
- 0.02264886474609375,
699
- 0.022617055892944337,
700
- 0.022772735595703125,
701
- 0.022594560623168947,
702
- 0.022645055770874025,
703
- 0.022566591262817383,
704
- 0.022674432754516603,
705
  0.022579200744628908,
706
- 0.02266316795349121,
707
- 0.022558719635009765,
708
- 0.02259689521789551,
709
- 0.022527711868286133,
710
- 0.022640640258789063,
711
- 0.022593536376953126,
712
- 0.022578399658203126,
713
- 0.022630176544189452,
714
- 0.022656000137329102,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
715
  0.022527999877929687,
716
- 0.022635520935058592,
717
- 0.022615039825439453,
718
- 0.02309427261352539,
719
- 0.022607872009277344,
720
- 0.022707199096679686,
 
 
 
 
 
721
  0.02271027183532715,
722
- 0.022641664505004884,
723
- 0.02272972869873047,
724
- 0.022563840866088865,
725
- 0.022649856567382814,
 
 
726
  0.02267136001586914,
727
- 0.022595584869384764,
728
- 0.02264575958251953,
729
- 0.02269705581665039,
730
- 0.0228822078704834,
731
- 0.022579200744628908,
732
- 0.02264371109008789,
733
- 0.022567935943603516,
734
- 0.02266316795349121,
735
- 0.022576383590698242,
736
- 0.022651647567749022,
737
- 0.022649856567382814,
738
- 0.022725631713867187,
739
- 0.02261840057373047,
740
- 0.02258505630493164,
741
- 0.022735071182250977,
742
- 0.02269673538208008,
743
- 0.022722560882568358,
744
- 0.02269593620300293,
745
- 0.022635520935058592,
746
- 0.02308710479736328,
747
- 0.022704256057739257,
748
- 0.022632320404052733,
749
- 0.022691839218139647,
750
  0.022692863464355468,
751
- 0.02269388771057129,
752
- 0.022635520935058592,
753
- 0.022658048629760744,
754
- 0.022665216445922853,
755
- 0.022658048629760744,
756
- 0.022617120742797852,
757
- 0.022613216400146484,
758
- 0.0225729923248291,
759
- 0.02261689567565918,
760
- 0.02270412826538086,
761
- 0.02263350486755371,
762
- 0.02258940887451172,
763
- 0.022654144287109376,
764
- 0.0225861759185791,
765
- 0.022657024383544923,
766
- 0.0227194881439209,
767
- 0.022608896255493165,
768
- 0.02249830436706543,
769
  0.02253225517272949,
770
- 0.02266409683227539,
771
- 0.02256480026245117,
772
- 0.02261734390258789,
773
- 0.022640384674072266,
774
- 0.022627328872680662,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
775
  0.022614015579223632,
776
- 0.02271129608154297,
777
- 0.02269388771057129,
778
- 0.02308403205871582,
779
- 0.02263654327392578,
780
- 0.02265292739868164,
781
- 0.022671424865722656,
782
- 0.02266208076477051,
 
 
783
  0.022631423950195313,
 
 
 
 
 
 
 
 
784
  0.022608896255493165,
785
- 0.022644767761230467,
786
- 0.02257814407348633,
787
- 0.02254643249511719,
788
- 0.022716415405273437,
789
- 0.0227194881439209,
790
- 0.02269593620300293,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
791
  0.02265907287597656,
792
- 0.022682783126831054,
793
- 0.02254934310913086,
794
- 0.022541311264038084,
795
- 0.022573312759399413,
796
- 0.02260966491699219,
797
- 0.022487039566040038,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
798
  0.022598655700683593,
799
- 0.022850719451904297,
800
- 0.022495071411132814
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
801
  ]
802
  },
803
  "throughput": {
804
  "unit": "tokens/s",
805
- "value": 44.168135469637825
806
  },
807
  "energy": null,
808
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 7970.185216,
6
  "max_vram": 5544.869888,
7
  "max_reserved": 5058.330624,
8
  "max_allocated": 4906.976256
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.04247605333489883,
13
+ "stdev": 9.94106394560766e-05,
14
  "values": [
15
+ 0.043952926635742184,
16
+ 0.042403839111328126,
17
+ 0.04242227172851563,
18
+ 0.04244790267944336,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
19
  0.04245401763916016,
 
 
20
  0.042464256286621094,
21
+ 0.04247654342651367,
22
+ 0.042422496795654296,
23
+ 0.04246015930175781,
24
+ 0.04246527862548828,
25
+ 0.04246527862548828,
26
+ 0.04244377517700195,
27
+ 0.04246323013305664,
 
 
 
 
28
  0.04244889450073242,
29
+ 0.04245811080932617,
30
+ 0.042487808227539066,
31
+ 0.042464256286621094,
32
+ 0.04243865585327149,
33
+ 0.042482688903808595,
34
+ 0.042471424102783206,
35
+ 0.042446849822998046,
36
+ 0.042447872161865234,
37
+ 0.04247552108764648,
38
  0.04245913696289062,
39
+ 0.04246015930175781,
40
  0.042461185455322265,
41
+ 0.04242227172851563,
 
 
 
 
42
  0.042449920654296876,
43
+ 0.04245721435546875,
44
+ 0.042450977325439454,
45
+ 0.042464256286621094,
46
+ 0.04247654342651367,
47
+ 0.042485759735107424,
48
  0.04244275283813476,
49
+ 0.04244297790527344,
 
 
50
  0.042472446441650394,
51
+ 0.04248371124267578,
52
+ 0.04247859191894531,
53
+ 0.04243251037597656,
54
+ 0.042436607360839845,
55
+ 0.04243865585327149,
56
+ 0.04249190521240234,
57
  0.042447872161865234,
58
+ 0.04245811080932617,
59
+ 0.04246527862548828,
60
+ 0.04246732711791992,
61
+ 0.04247449493408203,
62
+ 0.04247859191894531,
63
+ 0.042456062316894534,
64
+ 0.04246835327148438,
65
+ 0.04248371124267578,
66
  0.042449920654296876,
 
 
 
 
67
  0.04245708847045898,
68
+ 0.042456062316894534,
69
+ 0.04247859191894531,
70
  0.04245401763916016,
 
 
 
 
 
71
  0.04247552108764648,
72
+ 0.042449920654296876,
73
+ 0.04246025466918945,
74
+ 0.04245913696289062,
75
+ 0.04248371124267578,
76
+ 0.04245427322387695,
77
+ 0.04245196914672852,
78
+ 0.04245622253417969,
79
+ 0.04247040176391602,
80
+ 0.04243865585327149,
81
+ 0.042472576141357424,
82
  0.04246527862548828,
83
+ 0.04247577667236328,
 
 
 
 
 
 
84
  0.04244889450073242,
85
+ 0.04247040176391602,
86
  0.042472446441650394,
87
+ 0.042505214691162106,
88
+ 0.04245811080932617,
89
+ 0.04247654342651367,
90
+ 0.04247449493408203,
91
  0.04245401763916016,
92
  0.042464256286621094,
93
+ 0.042466304779052735,
94
+ 0.04245417785644531,
95
+ 0.042471424102783206,
 
 
96
  0.04245196914672852,
97
+ 0.04246835327148438,
 
 
98
  0.042466304779052735,
99
+ 0.04246835327148438,
100
+ 0.042431488037109374,
101
+ 0.04247859191894531,
102
+ 0.042472446441650394,
103
+ 0.042464256286621094,
104
+ 0.04245401763916016,
105
+ 0.04242432022094727,
106
+ 0.04246323013305664,
107
  0.042461185455322265,
108
+ 0.042510337829589843,
 
109
  0.04248064041137695,
110
+ 0.042456062316894534,
111
+ 0.04250640106201172,
112
+ 0.042449920654296876,
113
  0.04246015930175781,
114
+ 0.04245094299316406,
115
+ 0.04245817565917969,
116
+ 0.04244275283813476,
117
+ 0.042487808227539066,
118
+ 0.04245503997802735,
119
  0.04244582366943359,
120
+ 0.04244582366943359,
121
+ 0.042485759735107424,
122
+ 0.04242739105224609,
123
+ 0.042485759735107424,
124
+ 0.042490974426269534,
125
  0.04248064041137695,
126
+ 0.042471424102783206,
127
+ 0.0424796142578125,
128
+ 0.0424796142578125,
129
+ 0.04245503997802735,
130
+ 0.04246025466918945,
 
 
 
 
 
 
 
 
 
131
  0.04245708847045898,
132
+ 0.04247552108764648,
133
+ 0.04246015930175781,
134
  0.042472446441650394,
135
+ 0.042469375610351565,
136
+ 0.04246220779418945,
137
+ 0.04244275283813476,
138
+ 0.04245811080932617,
139
+ 0.04269055938720703,
140
+ 0.04245811080932617,
141
+ 0.04247040176391602,
142
+ 0.04246220779418945,
143
  0.04248166275024414,
144
+ 0.042452991485595705,
145
  0.04246527862548828,
146
+ 0.04245708847045898,
147
+ 0.04245503997802735,
148
+ 0.04250316619873047,
149
+ 0.04248886489868164,
150
+ 0.042446849822998046,
151
+ 0.04245401763916016,
 
 
 
 
 
 
 
 
 
 
 
 
152
  0.04245811080932617,
153
+ 0.04248064041137695,
154
+ 0.04250009536743164,
155
+ 0.04247040176391602,
156
+ 0.04249836730957031,
157
+ 0.04247552108764648,
158
+ 0.042445022583007815,
159
+ 0.04247449493408203,
160
  0.04247552108764648,
 
 
 
 
 
 
 
 
161
  0.0424796142578125,
162
+ 0.04244070434570312,
163
  0.04247552108764648,
164
+ 0.04245932769775391,
165
+ 0.04247468948364258,
166
+ 0.04247552108764648,
167
+ 0.042466529846191405,
 
 
 
 
 
 
 
168
  0.04245708847045898,
169
+ 0.04248166275024414,
 
 
 
 
 
170
  0.04245811080932617,
171
+ 0.042485759735107424,
172
+ 0.042452991485595705,
173
+ 0.04247552108764648,
174
+ 0.04248166275024414,
175
  0.04247040176391602,
176
+ 0.04246220779418945,
177
+ 0.0424725456237793,
178
+ 0.042447872161865234,
179
+ 0.04246835327148438,
180
+ 0.04244889450073242,
181
+ 0.04248473739624024,
182
+ 0.042466304779052735,
183
+ 0.04247449493408203,
184
+ 0.04245328140258789,
185
  0.042464256286621094,
186
+ 0.042447872161865234,
187
+ 0.04250944137573242,
 
 
188
  0.042482688903808595,
189
+ 0.04247347259521484,
190
+ 0.04248166275024414,
191
+ 0.04248883056640625,
192
+ 0.04244911956787109,
193
+ 0.04248499298095703,
194
  0.042446849822998046,
195
+ 0.04247552108764648,
196
+ 0.04244390487670899,
197
+ 0.04248883056640625,
198
+ 0.04245401763916016,
199
  0.04246323013305664,
200
+ 0.042482688903808595,
201
+ 0.042485759735107424,
202
+ 0.042456062316894534,
203
+ 0.04247347259521484,
204
+ 0.042466529846191405,
205
+ 0.04244070434570312,
206
+ 0.04249497604370117,
207
+ 0.04247859191894531,
208
+ 0.04246835327148438,
209
+ 0.04246323013305664,
210
+ 0.04244079971313477,
211
+ 0.04248678588867188,
212
+ 0.04245094299316406,
213
+ 0.04245708847045898,
214
+ 0.04246323013305664,
215
+ 0.04249702453613281,
216
+ 0.042482688903808595,
217
+ 0.04249190521240234,
218
+ 0.04247040176391602,
219
+ 0.04250009536743164,
220
  0.04248064041137695,
221
+ 0.042510337829589843,
222
+ 0.0425164794921875,
223
+ 0.042493953704833984,
224
+ 0.04248281478881836,
225
  0.04247552108764648,
226
+ 0.04247859191894531,
227
+ 0.04248678588867188,
228
+ 0.042499073028564455,
229
+ 0.042499073028564455,
230
+ 0.04249702453613281,
231
+ 0.04252364730834961,
232
+ 0.04251238250732422,
233
+ 0.04249292755126953,
234
+ 0.04247859191894531,
235
+ 0.04249292755126953,
236
+ 0.04248678588867188,
237
+ 0.04248678588867188,
238
+ 0.04249087905883789,
239
+ 0.042502143859863284,
240
+ 0.04246835327148438,
241
+ 0.04252876663208008,
242
+ 0.042510337829589843,
243
+ 0.042501121520996096,
244
+ 0.042474624633789065,
245
+ 0.04252278518676758,
246
+ 0.042464256286621094,
247
+ 0.04248371124267578,
248
+ 0.04247654342651367,
249
+ 0.04250223922729492,
250
+ 0.04247859191894531
251
  ]
252
  },
253
  "throughput": {
254
  "unit": "tokens/s",
255
+ "value": 6026.925288505261
256
  },
257
  "energy": null,
258
  "efficiency": null
 
260
  "decode": {
261
  "memory": {
262
  "unit": "MB",
263
+ "max_ram": 7972.282368,
264
  "max_vram": 5716.836352,
265
  "max_reserved": 5230.297088,
266
  "max_allocated": 5031.01696
267
  },
268
  "latency": {
269
  "unit": "s",
270
+ "mean": 6.015928203582767,
271
+ "stdev": 0.14041690444945987,
272
  "values": [
273
+ 5.875511299133307,
274
+ 6.156345108032227
275
  ]
276
  },
277
  "throughput": {
278
  "unit": "tokens/s",
279
+ "value": 42.38747394760056
280
  },
281
  "energy": null,
282
  "efficiency": null
 
285
  "memory": null,
286
  "latency": {
287
  "unit": "s",
288
+ "mean": 0.02359187530816772,
289
+ "stdev": 0.0015317100758449683,
290
  "values": [
291
+ 0.02607417678833008,
292
+ 0.024514495849609377,
293
+ 0.023066751480102538,
294
+ 0.022996896743774413,
295
+ 0.02278704071044922,
296
+ 0.022993919372558593,
297
+ 0.02290176010131836,
298
+ 0.022823936462402345,
299
+ 0.022820863723754883,
300
+ 0.02267955207824707,
301
+ 0.022596704483032228,
302
+ 0.022555551528930663,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
303
  0.02266009521484375,
304
+ 0.022583295822143554,
305
+ 0.022571008682250978,
306
+ 0.022649856567382814,
307
+ 0.02249113655090332,
308
  0.022575103759765625,
309
+ 0.022500352859497072,
310
+ 0.022572032928466795,
311
+ 0.02251571273803711,
312
+ 0.02264678382873535,
313
+ 0.022586368560791017,
314
+ 0.022691839218139647,
315
+ 0.022609920501708985,
316
+ 0.02261203193664551,
317
+ 0.022518720626831055,
318
+ 0.022526975631713866,
 
 
 
 
 
319
  0.022556671142578123,
320
+ 0.022589439392089843,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
321
  0.022603776931762694,
322
+ 0.02268569564819336,
323
+ 0.02271129608154297,
324
+ 0.022563840866088865,
325
+ 0.022581247329711913,
326
+ 0.022579200744628908,
327
+ 0.022622207641601562,
328
  0.022603776931762694,
329
+ 0.022581247329711913,
330
+ 0.022720672607421874,
331
+ 0.022487903594970705,
332
+ 0.02244607925415039,
333
+ 0.02250752067565918,
334
+ 0.02250444793701172,
335
+ 0.02247372817993164,
336
+ 0.022510591506958007,
337
+ 0.02253004837036133,
338
+ 0.022751232147216797,
 
 
 
 
 
339
  0.022569984436035157,
340
+ 0.022575103759765625,
 
 
 
 
341
  0.022615039825439453,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
342
  0.02266111946105957,
343
+ 0.02263039970397949,
344
+ 0.022599679946899414,
 
 
 
 
 
 
 
 
 
 
 
345
  0.022510591506958007,
346
+ 0.022655168533325196,
347
+ 0.02261894416809082,
348
+ 0.0225167350769043,
349
+ 0.02243791961669922,
350
+ 0.022474720001220704,
351
+ 0.022563840866088865,
 
 
 
 
352
  0.02255462455749512,
353
+ 0.022492383956909178,
354
+ 0.0226844482421875,
355
+ 0.022578176498413087,
356
+ 0.022627328872680662,
357
+ 0.022527999877929687,
358
+ 0.022603776931762694,
359
+ 0.02261299133300781,
360
+ 0.022543359756469726,
361
+ 0.022632448196411133,
362
+ 0.02262835121154785,
363
+ 0.022529184341430666,
364
+ 0.02259542465209961,
365
+ 0.022599775314331053,
366
+ 0.022501279830932617,
367
+ 0.02265497589111328,
368
+ 0.022684959411621092,
369
+ 0.022639328002929688,
370
+ 0.022714368820190428,
371
+ 0.022549503326416014,
372
  0.022579200744628908,
373
+ 0.022732799530029296,
374
+ 0.022714368820190428,
375
+ 0.022551551818847656,
376
+ 0.023602176666259765,
377
+ 0.024026111602783205,
378
+ 0.0231014404296875,
379
+ 0.024319999694824217,
380
+ 0.02257529640197754,
381
+ 0.02260870361328125,
382
+ 0.022599807739257814,
383
+ 0.022631359100341798,
384
+ 0.02274502372741699,
385
+ 0.022585344314575196,
386
  0.022623231887817383,
 
 
 
 
 
 
 
 
 
387
  0.022579200744628908,
388
+ 0.02267238426208496,
389
+ 0.022580223083496095,
390
+ 0.022565887451171874,
391
+ 0.02268057632446289,
392
+ 0.02262015914916992,
393
+ 0.022566911697387695,
394
+ 0.02276675224304199,
395
+ 0.022762336730957032,
396
+ 0.022681600570678712,
397
+ 0.02251263999938965,
398
+ 0.022562816619873048,
399
+ 0.022529024124145508,
400
+ 0.0226396484375,
401
+ 0.022568031311035155,
402
+ 0.023253887176513673,
403
+ 0.02433126449584961,
404
+ 0.024397855758666993,
405
+ 0.02452374458312988,
406
+ 0.02555187225341797,
407
+ 0.027206655502319335,
408
+ 0.026950656890869142,
409
+ 0.02732441520690918,
410
+ 0.026236928939819337,
411
+ 0.026479616165161132,
412
+ 0.02656153678894043,
413
+ 0.0267509765625,
414
+ 0.026918912887573244,
415
+ 0.026663936614990235,
416
+ 0.026599424362182617,
417
+ 0.02651852798461914,
418
+ 0.02546998405456543,
419
+ 0.023663583755493163,
420
+ 0.02389811134338379,
421
+ 0.022853919982910156,
422
+ 0.02273865509033203,
423
+ 0.022708223342895507,
424
+ 0.022742015838623047,
425
+ 0.0230830078125,
426
+ 0.022776832580566408,
427
+ 0.023129087448120117,
428
+ 0.022749183654785156,
429
+ 0.02267852783203125,
430
+ 0.02273689651489258,
431
+ 0.02292531204223633,
432
+ 0.022737920761108397,
433
+ 0.022619136810302733,
434
+ 0.022581247329711913,
435
+ 0.02265292739868164,
436
+ 0.022730752944946288,
437
+ 0.022569984436035157,
438
+ 0.022590463638305663,
439
+ 0.022855680465698244,
440
+ 0.02270627212524414,
441
+ 0.0226343994140625,
442
+ 0.02264575958251953,
443
+ 0.022587711334228516,
444
+ 0.02254323196411133,
445
+ 0.02259129524230957,
446
+ 0.022540319442749025,
447
+ 0.024703968048095704,
448
+ 0.02484940719604492,
449
+ 0.02478489685058594,
450
+ 0.02495692825317383,
451
+ 0.024859647750854492,
452
+ 0.02479417610168457,
453
+ 0.024747968673706055,
454
+ 0.024995840072631836,
455
+ 0.024964319229125977,
456
+ 0.024827680587768554,
457
+ 0.024827903747558593,
458
+ 0.024785919189453123,
459
+ 0.0249354248046875,
460
+ 0.024936447143554686,
461
+ 0.024892671585083008,
462
+ 0.025030399322509767,
463
+ 0.0231014404296875,
464
+ 0.022625280380249024,
465
+ 0.022543392181396484,
466
+ 0.022599647521972657,
467
+ 0.022564863204956053,
468
+ 0.022566911697387695,
469
+ 0.02249830436706543,
470
+ 0.022517759323120116,
471
+ 0.02246246337890625,
472
+ 0.022429695129394533,
473
+ 0.022544384002685547,
474
  0.022527999877929687,
475
+ 0.02255564880371094,
476
+ 0.022675455093383787,
477
+ 0.022609920501708985,
478
+ 0.02253107261657715,
479
+ 0.022626304626464845,
480
+ 0.022570207595825197,
481
+ 0.022565664291381834,
482
+ 0.02253209686279297,
483
+ 0.022544384002685547,
484
+ 0.022714368820190428,
485
  0.02271027183532715,
486
+ 0.022617311477661134,
487
+ 0.022630176544189452,
488
+ 0.02263859176635742,
489
+ 0.022529024124145508,
490
+ 0.02257734489440918,
491
+ 0.022954816818237304,
492
  0.02267136001586914,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
493
  0.022692863464355468,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
494
  0.02253225517272949,
495
+ 0.02261097526550293,
496
+ 0.022647615432739257,
497
+ 0.022585344314575196,
498
+ 0.022579200744628908,
499
+ 0.022567935943603516,
500
+ 0.022545408248901368,
501
+ 0.022617088317871094,
502
+ 0.022626304626464845,
503
+ 0.022519807815551757,
504
+ 0.022603776931762694,
505
+ 0.022578399658203126,
506
+ 0.022635295867919923,
507
+ 0.022786048889160155,
508
+ 0.022606847763061523,
509
+ 0.02253926467895508,
510
+ 0.02268262481689453,
511
+ 0.022601728439331056,
512
+ 0.02266828727722168,
513
+ 0.022599679946899414,
514
+ 0.02266124725341797,
515
+ 0.02254150390625,
516
+ 0.02260652732849121,
517
+ 0.02264371109008789,
518
+ 0.022562816619873048,
519
+ 0.022568960189819336,
520
+ 0.022588415145874022,
521
+ 0.022535423278808593,
522
+ 0.02265983963012695,
523
+ 0.023021568298339845,
524
  0.022614015579223632,
525
+ 0.022510591506958007,
526
+ 0.022587392807006838,
527
+ 0.022586591720581056,
528
+ 0.022761247634887696,
529
+ 0.022618112564086915,
530
+ 0.02253209686279297,
531
+ 0.022583391189575194,
532
+ 0.022639520645141603,
533
+ 0.022585344314575196,
534
  0.022631423950195313,
535
+ 0.022598655700683593,
536
+ 0.022592512130737305,
537
+ 0.02266828727722168,
538
+ 0.02262348747253418,
539
+ 0.022586111068725587,
540
+ 0.023001087188720702,
541
+ 0.02282598304748535,
542
+ 0.022681600570678712,
543
  0.022608896255493165,
544
+ 0.022487071990966796,
545
+ 0.022428640365600584,
546
+ 0.023014175415039063,
547
+ 0.02274406433105469,
548
+ 0.022616064071655274,
549
+ 0.022649856567382814,
550
+ 0.02257027244567871,
551
+ 0.022718175888061524,
552
+ 0.02267852783203125,
553
+ 0.022930431365966796,
554
+ 0.02265936088562012,
555
+ 0.02266908836364746,
556
+ 0.02259654426574707,
557
+ 0.02266214370727539,
558
+ 0.022603776931762694,
559
+ 0.02273587226867676,
560
+ 0.022623231887817383,
561
+ 0.025796607971191408,
562
+ 0.030631935119628906,
563
+ 0.024938495635986328,
564
+ 0.02493235206604004,
565
+ 0.02502374458312988,
566
+ 0.024795904159545898,
567
+ 0.02503987121582031,
568
+ 0.024978431701660156,
569
+ 0.025059423446655273,
570
+ 0.02493145561218262,
571
+ 0.025039648056030272,
572
+ 0.02490572738647461,
573
+ 0.025035776138305665,
574
+ 0.024943616867065428,
575
+ 0.024978464126586913,
576
+ 0.02496227264404297,
577
+ 0.02502835273742676,
578
+ 0.024839168548583986,
579
+ 0.025060352325439454,
580
+ 0.025001983642578125,
581
+ 0.02506342315673828,
582
+ 0.02494492721557617,
583
+ 0.024963808059692384,
584
+ 0.02489049530029297,
585
+ 0.024983423233032227,
586
+ 0.024899904251098632,
587
+ 0.02491667175292969,
588
+ 0.024976383209228514,
589
+ 0.02490572738647461,
590
+ 0.024927295684814454,
591
+ 0.024879039764404295,
592
+ 0.022607872009277344,
593
+ 0.022788095474243163,
594
+ 0.02271027183532715,
595
+ 0.022773759841918945,
596
+ 0.02267750358581543,
597
+ 0.022611967086791994,
598
+ 0.022631423950195313,
599
+ 0.02253948783874512,
600
+ 0.02264147186279297,
601
+ 0.022656991958618165,
602
+ 0.022634496688842775,
603
+ 0.022617088317871094,
604
+ 0.022579200744628908,
605
+ 0.022780927658081054,
606
+ 0.022657024383544923,
607
+ 0.022762496948242186,
608
+ 0.02265190315246582,
609
+ 0.02279033660888672,
610
+ 0.022719295501708984,
611
+ 0.022773759841918945,
612
+ 0.022722848892211912,
613
+ 0.022670047760009766,
614
+ 0.0227061767578125,
615
+ 0.022780927658081054,
616
+ 0.022743040084838868,
617
+ 0.022807680130004882,
618
+ 0.022800256729125976,
619
+ 0.022658239364624022,
620
+ 0.022646591186523436,
621
+ 0.02270310401916504,
622
+ 0.022693151473999022,
623
+ 0.022700767517089843,
624
+ 0.022687744140625,
625
+ 0.022866943359375,
626
+ 0.022590463638305663,
627
+ 0.02267865562438965,
628
+ 0.024210304260253907,
629
+ 0.02260905647277832,
630
+ 0.02258518409729004,
631
+ 0.022681600570678712,
632
  0.02265907287597656,
633
+ 0.022793407440185546,
634
+ 0.022764352798461913,
635
+ 0.022734943389892577,
636
+ 0.022665119171142577,
637
+ 0.022677696228027344,
638
+ 0.02264556884765625,
639
+ 0.022744224548339843,
640
+ 0.022797151565551756,
641
+ 0.02290073585510254,
642
+ 0.02272051239013672,
643
+ 0.02268671989440918,
644
+ 0.022726655960083008,
645
+ 0.02265395164489746,
646
+ 0.022743040084838868,
647
+ 0.02268569564819336,
648
+ 0.022654144287109376,
649
+ 0.022898496627807616,
650
+ 0.02269081687927246,
651
+ 0.022763519287109374,
652
+ 0.022774879455566405,
653
+ 0.022718528747558593,
654
+ 0.02275209617614746,
655
+ 0.022683647155761717,
656
+ 0.022751232147216797,
657
+ 0.022758399963378906,
658
+ 0.02265497589111328,
659
+ 0.022697984695434572,
660
+ 0.02268671989440918,
661
+ 0.022743040084838868,
662
+ 0.02267136001586914,
663
+ 0.02262118339538574,
664
+ 0.02259996795654297,
665
+ 0.02263632011413574,
666
+ 0.02259244728088379,
667
+ 0.022611967086791994,
668
+ 0.02262015914916992,
669
+ 0.022592512130737305,
670
+ 0.022633472442626954,
671
+ 0.022525951385498046,
672
+ 0.022580223083496095,
673
+ 0.022582271575927734,
674
+ 0.02262835121154785,
675
+ 0.02265190315246582,
676
+ 0.022626367568969727,
677
+ 0.022537151336669923,
678
+ 0.02252288055419922,
679
+ 0.022639616012573242,
680
+ 0.02264678382873535,
681
+ 0.022578176498413087,
682
+ 0.022607872009277344,
683
+ 0.022494207382202147,
684
+ 0.022565887451171874,
685
+ 0.022633663177490236,
686
+ 0.02262124824523926,
687
+ 0.022613759994506835,
688
+ 0.02268057632446289,
689
+ 0.022585344314575196,
690
+ 0.022502399444580077,
691
+ 0.02259660720825195,
692
+ 0.022499359130859375,
693
+ 0.022659263610839843,
694
+ 0.022566688537597655,
695
+ 0.022658048629760744,
696
+ 0.022594560623168947,
697
+ 0.022623231887817383,
698
+ 0.022559743881225586,
699
+ 0.02251366424560547,
700
+ 0.022575103759765625,
701
+ 0.02252288055419922,
702
+ 0.022586368560791017,
703
+ 0.02252390480041504,
704
+ 0.02263145637512207,
705
+ 0.022587360382080077,
706
+ 0.02268876838684082,
707
+ 0.022590463638305663,
708
  0.022598655700683593,
709
+ 0.02253107261657715,
710
+ 0.022548479080200197,
711
+ 0.02432512092590332,
712
+ 0.022769664764404295,
713
+ 0.022665216445922853,
714
+ 0.022739967346191405,
715
+ 0.022586368560791017,
716
+ 0.02262937545776367,
717
+ 0.022614015579223632,
718
+ 0.023356416702270507,
719
+ 0.025016319274902343,
720
+ 0.02498371124267578,
721
+ 0.02491097640991211,
722
+ 0.025602783203125,
723
+ 0.02657587242126465,
724
+ 0.026410144805908205,
725
+ 0.02645897674560547,
726
+ 0.026505376815795897,
727
+ 0.02640982437133789,
728
+ 0.02639788818359375,
729
+ 0.026466207504272463,
730
+ 0.026440607070922852,
731
+ 0.026440704345703125,
732
+ 0.026418176651000977,
733
+ 0.02646937561035156,
734
+ 0.026415168762207033,
735
+ 0.026463167190551758,
736
+ 0.026359807968139647,
737
+ 0.026267648696899414,
738
+ 0.026449920654296875,
739
+ 0.026390527725219725,
740
+ 0.026422271728515623,
741
+ 0.026463232040405273,
742
+ 0.02648678398132324,
743
+ 0.026462335586547852,
744
+ 0.026481536865234374,
745
+ 0.02653183937072754,
746
+ 0.026371231079101564,
747
+ 0.026352575302124023,
748
+ 0.02630352020263672,
749
+ 0.026426240921020507,
750
+ 0.02655539131164551,
751
+ 0.026589216232299803,
752
+ 0.02651747131347656,
753
+ 0.026489919662475585,
754
+ 0.026378175735473634,
755
+ 0.02633420753479004,
756
+ 0.026426368713378907,
757
+ 0.026474496841430665,
758
+ 0.026393600463867187,
759
+ 0.026418176651000977,
760
+ 0.026400768280029296,
761
+ 0.026372095108032227,
762
+ 0.02631996726989746,
763
+ 0.026346464157104493,
764
+ 0.026364864349365233,
765
+ 0.026444799423217775,
766
+ 0.026394624710083008,
767
+ 0.026432735443115234,
768
+ 0.026223392486572267,
769
+ 0.026407936096191405,
770
+ 0.02643881607055664,
771
+ 0.026346336364746092,
772
+ 0.026447872161865234,
773
+ 0.02631167984008789,
774
+ 0.026351615905761717,
775
+ 0.026432512283325195,
776
+ 0.026392831802368164,
777
+ 0.02630847930908203,
778
+ 0.026290048599243165,
779
+ 0.02634553527832031,
780
+ 0.026405855178833006,
781
+ 0.026345439910888672,
782
+ 0.026302463531494142,
783
+ 0.026395647048950196,
784
+ 0.026366975784301756,
785
+ 0.026232831954956053,
786
+ 0.02629734420776367,
787
+ 0.02628121566772461,
788
+ 0.026434303283691406,
789
+ 0.026398719787597655,
790
+ 0.026335231781005858,
791
+ 0.026487808227539062,
792
+ 0.026403839111328126,
793
+ 0.026331424713134766,
794
+ 0.026326751708984374,
795
+ 0.02630451202392578,
796
+ 0.026383359909057616,
797
+ 0.026281984329223632,
798
+ 0.02632601547241211,
799
+ 0.02447052764892578,
800
+ 0.02266009521484375
801
  ]
802
  },
803
  "throughput": {
804
  "unit": "tokens/s",
805
+ "value": 42.387473947600554
806
  },
807
  "energy": null,
808
  "efficiency": null