kreas commited on
Commit
9e74db8
1 Parent(s): 5dd7fab

Upload /Mistral-7B-v0.1/int8_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Mistral-7B-v0.1/int8_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,176 +2,157 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 5059.1744,
6
- "max_vram": 8793.358336,
7
  "max_reserved": 8300.527616,
8
  "max_allocated": 8141.046272
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.06466090361072167,
13
- "stdev": 0.0016305079405885012,
14
  "values": [
15
- 0.06965312194824219,
16
- 0.06675571441650391,
17
- 0.06487347412109375,
18
- 0.06736383819580079,
19
- 0.07005388641357421,
20
- 0.06383235168457031,
21
- 0.06355465698242188,
22
- 0.06371152114868164,
23
- 0.06373990249633789,
24
- 0.0642007064819336,
25
- 0.0671457290649414,
26
- 0.06730355072021485,
27
- 0.06730035400390624,
28
- 0.06728396606445312,
29
- 0.06705049896240234,
30
- 0.06734130859375,
31
- 0.0675420150756836,
32
- 0.06737510681152344,
33
- 0.06729830169677735,
34
- 0.06765363311767578,
35
- 0.06746112060546874,
36
- 0.06708735656738281,
37
- 0.06744780731201172,
38
- 0.06740787506103516,
39
- 0.06754508972167969,
40
- 0.06736998748779296,
41
- 0.06727168273925781,
42
- 0.06767411041259766,
43
- 0.06726758575439454,
44
- 0.06727168273925781,
45
- 0.06737407684326172,
46
- 0.06739250946044922,
47
- 0.06700032043457031,
48
- 0.06735667419433594,
49
- 0.06761369323730469,
50
- 0.06730035400390624,
51
- 0.0672204818725586,
52
- 0.06714470672607421,
53
- 0.06555254364013671,
54
- 0.06348697662353515,
55
- 0.06365593719482422,
56
- 0.0636119041442871,
57
- 0.06362214279174805,
58
- 0.06369996643066406,
59
- 0.06360575866699218,
60
- 0.0637470703125,
61
- 0.06373478317260742,
62
- 0.06366003036499024,
63
- 0.0634266242980957,
64
- 0.06353919982910156,
65
- 0.06414745330810546,
66
- 0.0636151351928711,
67
- 0.06359859085083008,
68
- 0.06363955307006836,
69
- 0.06381670379638672,
70
- 0.06361395263671875,
71
- 0.06367129516601562,
72
- 0.06384844970703125,
73
- 0.06421504211425781,
74
- 0.06363238525390626,
75
- 0.06370611190795898,
76
- 0.06359964752197265,
77
- 0.0634859504699707,
78
- 0.06358015823364258,
79
- 0.0634972152709961,
80
- 0.06379929733276367,
81
- 0.06356377410888672,
82
- 0.06371635055541992,
83
- 0.06382387161254882,
84
- 0.06337654495239257,
85
- 0.06360371017456054,
86
- 0.06725939178466797,
87
- 0.0673548812866211,
88
- 0.06735257720947266,
89
- 0.06738739013671875,
90
- 0.06733004760742188,
91
- 0.06661325073242187,
92
- 0.06367436981201172,
93
- 0.06348390579223633,
94
- 0.06341836929321289,
95
- 0.06361497497558594,
96
- 0.0641607666015625,
97
- 0.06358835220336914,
98
- 0.06364467239379883,
99
- 0.06373580932617187,
100
- 0.06359449768066407,
101
- 0.06366719818115234,
102
- 0.06363545608520507,
103
- 0.06378700637817383,
104
- 0.06406143951416016,
105
- 0.06384844970703125,
106
- 0.06366719818115234,
107
- 0.0637204475402832,
108
- 0.06360393524169922,
109
- 0.06378598403930665,
110
- 0.06359040069580078,
111
- 0.06374297714233398,
112
- 0.06368051147460937,
113
- 0.06380339050292969,
114
- 0.06394572830200196,
115
- 0.06382387161254882,
116
- 0.06367641448974609,
117
- 0.0636313591003418,
118
- 0.0637050895690918,
119
- 0.06389452743530273,
120
- 0.0639408302307129,
121
- 0.06385049438476563,
122
- 0.06395801544189453,
123
- 0.06410444641113282,
124
- 0.06397030258178711,
125
- 0.0637388801574707,
126
- 0.06365798568725586,
127
- 0.06376448059082031,
128
- 0.06414028930664062,
129
- 0.06378496170043946,
130
- 0.06350336074829102,
131
- 0.06381158447265625,
132
- 0.0638105583190918,
133
- 0.06385459136962891,
134
- 0.06361600112915039,
135
- 0.06395596694946289,
136
- 0.06389759826660156,
137
- 0.06379622268676757,
138
- 0.06359244918823242,
139
- 0.06372761535644532,
140
- 0.0634890251159668,
141
- 0.06354860687255859,
142
- 0.06333542251586914,
143
- 0.06365081787109375,
144
- 0.06358528137207031,
145
- 0.06360780715942382,
146
- 0.06373273468017578,
147
- 0.06382899093627929,
148
- 0.0636948471069336,
149
- 0.06365798568725586,
150
- 0.06358015823364258,
151
- 0.06377676773071289,
152
- 0.06367641448974609,
153
- 0.0638023681640625,
154
- 0.06376038360595702,
155
- 0.0636753921508789,
156
- 0.06361395263671875,
157
- 0.06382694244384765,
158
- 0.06399078369140625,
159
- 0.06382592010498046,
160
- 0.06388121414184571,
161
- 0.06353203201293946,
162
- 0.06344924926757813,
163
- 0.06375628662109376,
164
- 0.06368255996704102,
165
- 0.06373376083374023,
166
- 0.06375936126708984,
167
- 0.06400717163085938,
168
- 0.06515916442871093,
169
- 0.06372249603271485
170
  ]
171
  },
172
  "throughput": {
173
  "unit": "tokens/s",
174
- "value": 3959.115720701924
175
  },
176
  "energy": null,
177
  "efficiency": null
@@ -179,22 +160,22 @@
179
  "decode": {
180
  "memory": {
181
  "unit": "MB",
182
- "max_ram": 5059.1744,
183
  "max_vram": 8959.033344,
184
  "max_reserved": 8466.202624,
185
  "max_allocated": 8264.640512
186
  },
187
  "latency": {
188
  "unit": "s",
189
- "mean": 16.45116795730591,
190
  "stdev": 0,
191
  "values": [
192
- 16.45116795730591
193
  ]
194
  },
195
  "throughput": {
196
  "unit": "tokens/s",
197
- "value": 15.500419220190098
198
  },
199
  "energy": null,
200
  "efficiency": null
@@ -203,269 +184,269 @@
203
  "memory": null,
204
  "latency": {
205
  "unit": "s",
206
- "mean": 0.06451438414629768,
207
- "stdev": 0.0013011430096032664,
208
  "values": [
209
- 0.06637433624267577,
210
- 0.06607469177246093,
211
- 0.06374086380004883,
212
- 0.06402662658691406,
213
- 0.06383308792114258,
214
- 0.06381158447265625,
215
- 0.06387942504882813,
216
- 0.06399462509155274,
217
- 0.06395084762573242,
218
- 0.06391603088378907,
219
- 0.06586265563964844,
220
- 0.06553292846679687,
221
- 0.06445590209960937,
222
- 0.06451484680175781,
223
- 0.064321533203125,
224
- 0.06440755462646484,
225
- 0.06461030578613282,
226
- 0.06441574096679688,
227
- 0.06460313415527344,
228
- 0.06457855987548829,
229
- 0.06498611450195313,
230
- 0.06441907501220703,
231
- 0.06429363250732421,
232
- 0.064404541015625,
233
- 0.06419449615478516,
234
- 0.06420502471923828,
235
- 0.06392707061767579,
236
- 0.06474137878417968,
237
- 0.06456524658203125,
238
- 0.06431241607666016,
239
- 0.06423849487304688,
240
- 0.06409523010253906,
241
- 0.06448947143554687,
242
- 0.06419967651367188,
243
- 0.06423142242431641,
244
- 0.06444451141357421,
245
- 0.06425078582763671,
246
- 0.0642877426147461,
247
- 0.06413926696777343,
248
- 0.06418534088134766,
249
- 0.06426930999755859,
250
- 0.06437299346923828,
251
- 0.06432640075683593,
252
- 0.06430617523193359,
253
- 0.06434508514404297,
254
- 0.06400102233886719,
255
- 0.06387097549438477,
256
- 0.06396326446533203,
257
- 0.06385446548461914,
258
- 0.06397865676879883,
259
- 0.06438690948486328,
260
- 0.0643737564086914,
261
- 0.06393856048583985,
262
- 0.06401023864746094,
263
- 0.0640184326171875,
264
- 0.06385971069335937,
265
- 0.06414041900634766,
266
- 0.06435539245605469,
267
- 0.064072509765625,
268
- 0.06451420593261718,
269
- 0.06416368103027344,
270
- 0.06411161804199218,
271
- 0.06407987213134765,
272
- 0.06417919921875,
273
- 0.06413516998291016,
274
- 0.06409011077880859,
275
- 0.06409625244140625,
276
- 0.06437273406982422,
277
- 0.06400102233886719,
278
- 0.06447718048095703,
279
- 0.06415670776367187,
280
- 0.06418940734863281,
281
- 0.06400204467773438,
282
- 0.06446182250976562,
283
- 0.06416690826416016,
284
- 0.06390067291259766,
285
- 0.06411468505859375,
286
- 0.06439936065673828,
287
- 0.06413516998291016,
288
- 0.06430617523193359,
289
- 0.06454070281982421,
290
- 0.06423139190673828,
291
- 0.06453862762451172,
292
- 0.06467906951904297,
293
- 0.06399472045898437,
294
- 0.06524620819091796,
295
- 0.06514688110351563,
296
- 0.06403072357177735,
297
- 0.06441779327392579,
298
- 0.06437580871582031,
299
- 0.06492876434326172,
300
- 0.064321533203125,
301
- 0.0643246078491211,
302
- 0.0643430404663086,
303
- 0.0644004135131836,
304
- 0.06401840209960938,
305
- 0.0641968002319336,
306
- 0.06390764617919922,
307
- 0.06416588592529297,
308
- 0.06444572448730469,
309
- 0.06416969299316407,
310
- 0.06446182250976562,
311
- 0.06410758209228516,
312
- 0.06386783981323242,
313
- 0.06406861114501954,
314
- 0.06414745330810546,
315
- 0.06440758514404298,
316
- 0.06447100830078124,
317
- 0.06410034942626953,
318
- 0.06403993225097657,
319
- 0.06422016143798828,
320
- 0.06401152038574219,
321
- 0.06436121368408203,
322
- 0.06404710388183593,
323
- 0.06458681488037109,
324
- 0.06417529296875,
325
- 0.0643663330078125,
326
- 0.06429203033447266,
327
- 0.0641493148803711,
328
- 0.06405632019042969,
329
- 0.06448255920410156,
330
- 0.06419532775878906,
331
- 0.0645027847290039,
332
- 0.06435430145263672,
333
- 0.06422528076171875,
334
- 0.06436351776123046,
335
- 0.06434099578857422,
336
- 0.06433280181884765,
337
- 0.06388019180297852,
338
- 0.0642529296875,
339
- 0.06423046112060547,
340
- 0.06398998260498047,
341
- 0.06379600143432618,
342
- 0.064036865234375,
343
- 0.06416377258300782,
344
- 0.06430924987792969,
345
- 0.06421218872070313,
346
- 0.06419955444335937,
347
- 0.0638944320678711,
348
- 0.06401155090332031,
349
- 0.06404988861083985,
350
- 0.06388633728027343,
351
- 0.06384147262573242,
352
- 0.06395475387573242,
353
- 0.06414848327636719,
354
- 0.0643420181274414,
355
- 0.06414950561523437,
356
- 0.06388652801513672,
357
- 0.06392812728881836,
358
- 0.06404402923583985,
359
- 0.06388633728027343,
360
- 0.06440038299560547,
361
- 0.06422732543945313,
362
- 0.06451741027832031,
363
- 0.0642741470336914,
364
- 0.06421011352539062,
365
- 0.06405926513671875,
366
- 0.06414739227294922,
367
- 0.06421504211425781,
368
- 0.06443724822998047,
369
- 0.06433280181884765,
370
- 0.06423961639404296,
371
- 0.06400921630859376,
372
- 0.06407788848876952,
373
- 0.06409619140625,
374
- 0.06430335998535157,
375
- 0.06409910583496094,
376
- 0.06427030181884766,
377
- 0.0642458267211914,
378
- 0.06446073913574218,
379
- 0.0645212173461914,
380
- 0.06449152374267578,
381
- 0.06438400268554688,
382
- 0.06424687957763672,
383
- 0.06415042877197266,
384
- 0.06434099578857422,
385
- 0.06435225677490235,
386
- 0.06467481231689454,
387
- 0.06413139343261719,
388
- 0.06438777923583984,
389
- 0.06419865417480469,
390
- 0.06406143951416016,
391
- 0.06409420776367188,
392
- 0.06416281890869141,
393
- 0.06465023803710937,
394
- 0.06402559661865234,
395
- 0.06427648162841797,
396
- 0.06444338989257813,
397
- 0.0641413116455078,
398
- 0.06416486358642579,
399
- 0.06438400268554688,
400
- 0.06437709045410156,
401
- 0.06432025909423827,
402
- 0.06419251251220703,
403
- 0.06387728118896484,
404
- 0.06393635177612304,
405
- 0.06655078125,
406
- 0.07377532958984374,
407
- 0.07374752044677735,
408
- 0.07276719665527344,
409
- 0.07246054077148438,
410
- 0.0695098876953125,
411
- 0.06951526641845703,
412
- 0.07026175689697266,
413
- 0.06647296142578125,
414
- 0.06422118377685547,
415
- 0.06427238464355468,
416
- 0.0647936019897461,
417
- 0.06420377349853515,
418
- 0.06424575805664062,
419
- 0.06429491424560548,
420
- 0.06396748733520508,
421
- 0.06419123077392579,
422
- 0.06426329803466797,
423
- 0.06446908569335938,
424
- 0.0650770263671875,
425
- 0.0644853744506836,
426
- 0.06454579162597657,
427
- 0.06440652465820312,
428
- 0.06449766540527344,
429
- 0.06452531433105468,
430
- 0.06477005004882813,
431
- 0.06437580871582031,
432
- 0.06449356842041015,
433
- 0.06465331268310547,
434
- 0.06449459075927734,
435
- 0.06421206665039063,
436
- 0.06441667175292969,
437
- 0.06419455718994141,
438
- 0.06432876586914063,
439
- 0.06419865417480469,
440
- 0.06432864379882812,
441
- 0.06433074951171874,
442
- 0.06439628601074218,
443
- 0.06440345764160156,
444
- 0.06422425842285157,
445
- 0.06454169464111328,
446
- 0.06438502502441407,
447
- 0.06449561309814453,
448
- 0.06480703735351563,
449
- 0.06440025329589844,
450
- 0.06447821044921875,
451
- 0.06433097839355469,
452
- 0.06435408020019531,
453
- 0.06452140808105469,
454
- 0.06465618896484375,
455
- 0.06495145416259765,
456
- 0.06455177307128906,
457
- 0.06435151672363282,
458
- 0.06432943725585938,
459
- 0.0642682876586914,
460
- 0.06404303741455078,
461
- 0.0640665283203125,
462
- 0.06415974426269531,
463
- 0.06425196838378906
464
  ]
465
  },
466
  "throughput": {
467
  "unit": "tokens/s",
468
- "value": 15.5004192201901
469
  },
470
  "energy": null,
471
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 4967.66976,
6
+ "max_vram": 8759.803904,
7
  "max_reserved": 8300.527616,
8
  "max_allocated": 8141.046272
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.07373036238726449,
13
+ "stdev": 0.0005084092012394267,
14
  "values": [
15
+ 0.07851334381103516,
16
+ 0.07628594970703124,
17
+ 0.07435673522949218,
18
+ 0.0738150405883789,
19
+ 0.07406489562988282,
20
+ 0.07405158233642578,
21
+ 0.07433225250244141,
22
+ 0.07400243377685548,
23
+ 0.07385600280761719,
24
+ 0.073417724609375,
25
+ 0.07356006622314454,
26
+ 0.07345152282714844,
27
+ 0.07354777526855469,
28
+ 0.07339929962158204,
29
+ 0.07357049560546874,
30
+ 0.0735129623413086,
31
+ 0.07389183807373047,
32
+ 0.07373133087158203,
33
+ 0.07352729797363282,
34
+ 0.07361331176757813,
35
+ 0.07342489624023438,
36
+ 0.07342387390136719,
37
+ 0.07349964904785156,
38
+ 0.07358268737792968,
39
+ 0.07351808166503906,
40
+ 0.07349375915527344,
41
+ 0.07388365173339843,
42
+ 0.07352524566650391,
43
+ 0.07348223876953125,
44
+ 0.07356006622314454,
45
+ 0.07351193237304687,
46
+ 0.07373538970947266,
47
+ 0.07336038208007813,
48
+ 0.0734750747680664,
49
+ 0.07358262634277343,
50
+ 0.07355084991455078,
51
+ 0.07348633575439453,
52
+ 0.07345049285888672,
53
+ 0.07329708862304687,
54
+ 0.07347618865966797,
55
+ 0.07340457916259766,
56
+ 0.0734197769165039,
57
+ 0.07344230651855468,
58
+ 0.07394303894042968,
59
+ 0.07384166717529297,
60
+ 0.07354061126708984,
61
+ 0.07342591857910157,
62
+ 0.07357746887207031,
63
+ 0.07351500701904297,
64
+ 0.07348326110839844,
65
+ 0.07379894256591797,
66
+ 0.07336653137207032,
67
+ 0.07356006622314454,
68
+ 0.07366349029541015,
69
+ 0.07368294525146485,
70
+ 0.07355289459228516,
71
+ 0.07349964904785156,
72
+ 0.07345875549316407,
73
+ 0.07348735809326172,
74
+ 0.07329392242431641,
75
+ 0.07376399993896485,
76
+ 0.07378431701660157,
77
+ 0.07384371185302735,
78
+ 0.07369318389892578,
79
+ 0.07349964904785156,
80
+ 0.07373209381103515,
81
+ 0.07375154876708985,
82
+ 0.07392972564697266,
83
+ 0.07372799682617187,
84
+ 0.07357030487060547,
85
+ 0.07384371185302735,
86
+ 0.07380684661865235,
87
+ 0.07366553497314453,
88
+ 0.07353241729736328,
89
+ 0.07381606292724609,
90
+ 0.07368115234375,
91
+ 0.07349043273925782,
92
+ 0.07362560272216796,
93
+ 0.07365631866455079,
94
+ 0.07391027069091796,
95
+ 0.07418675231933594,
96
+ 0.07401676940917969,
97
+ 0.07396966552734376,
98
+ 0.07355903625488282,
99
+ 0.07360931396484376,
100
+ 0.07349759674072266,
101
+ 0.07364505767822266,
102
+ 0.0734997787475586,
103
+ 0.07368498992919922,
104
+ 0.07362067413330078,
105
+ 0.07359795379638671,
106
+ 0.07361023712158203,
107
+ 0.07366758728027344,
108
+ 0.07374028778076172,
109
+ 0.07385702514648437,
110
+ 0.07374848175048829,
111
+ 0.07371571350097657,
112
+ 0.07369420623779296,
113
+ 0.0736727066040039,
114
+ 0.07351705932617188,
115
+ 0.07376297760009766,
116
+ 0.07388057708740234,
117
+ 0.07383961486816407,
118
+ 0.07369728088378906,
119
+ 0.07385702514648437,
120
+ 0.0736153564453125,
121
+ 0.0737822723388672,
122
+ 0.07372390747070312,
123
+ 0.07365837097167968,
124
+ 0.07393382263183594,
125
+ 0.07365740966796876,
126
+ 0.07393075561523438,
127
+ 0.07388883209228515,
128
+ 0.07382630157470703,
129
+ 0.07397785949707031,
130
+ 0.073744384765625,
131
+ 0.07389190673828125,
132
+ 0.07357337951660156,
133
+ 0.07359283447265624,
134
+ 0.07377203369140625,
135
+ 0.07355596923828125,
136
+ 0.07364422607421875,
137
+ 0.07376486206054687,
138
+ 0.07389695739746094,
139
+ 0.07361433410644531,
140
+ 0.07375872039794922,
141
+ 0.07353753662109375,
142
+ 0.07344454193115234,
143
+ 0.07401779174804687,
144
+ 0.07383859252929688,
145
+ 0.07375564575195312,
146
+ 0.07392768096923828,
147
+ 0.07379353332519531,
148
+ 0.07335526275634766,
149
+ 0.07368704223632813,
150
+ 0.07391334533691406
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
151
  ]
152
  },
153
  "throughput": {
154
  "unit": "tokens/s",
155
+ "value": 3472.1109690926883
156
  },
157
  "energy": null,
158
  "efficiency": null
 
160
  "decode": {
161
  "memory": {
162
  "unit": "MB",
163
+ "max_ram": 4967.66976,
164
  "max_vram": 8959.033344,
165
  "max_reserved": 8466.202624,
166
  "max_allocated": 8264.640512
167
  },
168
  "latency": {
169
  "unit": "s",
170
+ "mean": 19.093758979797368,
171
  "stdev": 0,
172
  "values": [
173
+ 19.093758979797368
174
  ]
175
  },
176
  "throughput": {
177
  "unit": "tokens/s",
178
+ "value": 13.355149201883671
179
  },
180
  "energy": null,
181
  "efficiency": null
 
184
  "memory": null,
185
  "latency": {
186
  "unit": "s",
187
+ "mean": 0.0748774861952838,
188
+ "stdev": 0.0007232584662979556,
189
  "values": [
190
+ 0.07924947357177735,
191
+ 0.08035424041748047,
192
+ 0.07569715118408203,
193
+ 0.07522815704345703,
194
+ 0.07505203247070312,
195
+ 0.0749854736328125,
196
+ 0.07487590026855469,
197
+ 0.07513906860351563,
198
+ 0.07520972442626953,
199
+ 0.07490252685546875,
200
+ 0.07495168304443359,
201
+ 0.07500287628173828,
202
+ 0.07480028533935547,
203
+ 0.07498941040039063,
204
+ 0.07505817413330078,
205
+ 0.07506329345703125,
206
+ 0.07486259460449218,
207
+ 0.07486054229736328,
208
+ 0.07467622375488281,
209
+ 0.07477452850341797,
210
+ 0.07472640228271485,
211
+ 0.07496601867675781,
212
+ 0.074967041015625,
213
+ 0.07489024353027343,
214
+ 0.07490662384033203,
215
+ 0.07504793548583985,
216
+ 0.07481037139892578,
217
+ 0.07501004791259766,
218
+ 0.07499696350097657,
219
+ 0.0750722885131836,
220
+ 0.07474073791503906,
221
+ 0.07491686248779297,
222
+ 0.07529779052734376,
223
+ 0.0749834213256836,
224
+ 0.07458099365234375,
225
+ 0.07477043151855468,
226
+ 0.07464345550537109,
227
+ 0.07466393280029297,
228
+ 0.07487283325195312,
229
+ 0.075040771484375,
230
+ 0.07470591735839843,
231
+ 0.07482163238525391,
232
+ 0.07472454071044922,
233
+ 0.07486137390136718,
234
+ 0.07484320068359375,
235
+ 0.07494137573242188,
236
+ 0.07478476715087891,
237
+ 0.07482675170898437,
238
+ 0.07493939208984375,
239
+ 0.07477350616455078,
240
+ 0.07482367706298829,
241
+ 0.0748922882080078,
242
+ 0.07468748474121094,
243
+ 0.07479910278320312,
244
+ 0.07503052520751953,
245
+ 0.07475711822509766,
246
+ 0.07477043151855468,
247
+ 0.07495497894287109,
248
+ 0.08319158172607422,
249
+ 0.07498957061767578,
250
+ 0.07513906860351563,
251
+ 0.07487999725341797,
252
+ 0.0747694091796875,
253
+ 0.07510733032226563,
254
+ 0.0747489242553711,
255
+ 0.07477145385742187,
256
+ 0.07467008209228515,
257
+ 0.07476326751708984,
258
+ 0.07481958770751954,
259
+ 0.0750018539428711,
260
+ 0.07479296112060548,
261
+ 0.0748748779296875,
262
+ 0.07454822540283203,
263
+ 0.07462911987304688,
264
+ 0.07469158172607422,
265
+ 0.07479090881347657,
266
+ 0.07481139373779297,
267
+ 0.0749639663696289,
268
+ 0.07475199890136719,
269
+ 0.07465164947509766,
270
+ 0.07483084869384765,
271
+ 0.07507148742675782,
272
+ 0.07512576293945313,
273
+ 0.07483084869384765,
274
+ 0.0747315216064453,
275
+ 0.07617842864990235,
276
+ 0.07616102600097656,
277
+ 0.07457075500488282,
278
+ 0.07467622375488281,
279
+ 0.07489024353027343,
280
+ 0.07463014221191407,
281
+ 0.07446835327148438,
282
+ 0.07474585723876953,
283
+ 0.07473458862304687,
284
+ 0.07489638519287109,
285
+ 0.07476838684082031,
286
+ 0.0748062744140625,
287
+ 0.07460578918457031,
288
+ 0.07480809783935546,
289
+ 0.07493836975097656,
290
+ 0.07466905975341796,
291
+ 0.07468032073974609,
292
+ 0.0746956787109375,
293
+ 0.0746219482421875,
294
+ 0.07473971557617187,
295
+ 0.07460966491699218,
296
+ 0.07455846405029297,
297
+ 0.07459430694580078,
298
+ 0.0745185317993164,
299
+ 0.07439667510986328,
300
+ 0.07450214385986328,
301
+ 0.07446733093261719,
302
+ 0.07458201599121093,
303
+ 0.07452774047851562,
304
+ 0.07471616363525391,
305
+ 0.07487181091308594,
306
+ 0.07455948638916016,
307
+ 0.0753623046875,
308
+ 0.07524044799804687,
309
+ 0.07471513366699219,
310
+ 0.07519538879394531,
311
+ 0.0747479019165039,
312
+ 0.07456578826904296,
313
+ 0.07458390045166016,
314
+ 0.07458815765380859,
315
+ 0.07459123229980469,
316
+ 0.07470079803466798,
317
+ 0.07517388916015624,
318
+ 0.07482982635498046,
319
+ 0.07467110443115234,
320
+ 0.07508799743652343,
321
+ 0.07473548889160156,
322
+ 0.07455948638916016,
323
+ 0.07465471649169922,
324
+ 0.07468236541748047,
325
+ 0.07469465637207032,
326
+ 0.07455129241943359,
327
+ 0.07469977569580079,
328
+ 0.0748584976196289,
329
+ 0.07467826843261718,
330
+ 0.07461273956298828,
331
+ 0.07442739105224609,
332
+ 0.07420108795166015,
333
+ 0.07440076446533203,
334
+ 0.07454720306396484,
335
+ 0.07454924774169921,
336
+ 0.07452671813964844,
337
+ 0.07448371124267578,
338
+ 0.07453593444824219,
339
+ 0.07448678588867187,
340
+ 0.07453593444824219,
341
+ 0.07455129241943359,
342
+ 0.074461181640625,
343
+ 0.07451545715332031,
344
+ 0.07468236541748047,
345
+ 0.0744458236694336,
346
+ 0.07445811462402344,
347
+ 0.07476121520996094,
348
+ 0.0748062744140625,
349
+ 0.07458611297607422,
350
+ 0.07443663787841796,
351
+ 0.074799072265625,
352
+ 0.07482777404785156,
353
+ 0.0747540512084961,
354
+ 0.07457177734375,
355
+ 0.07470285034179687,
356
+ 0.07486361694335937,
357
+ 0.07489746856689453,
358
+ 0.07465875244140625,
359
+ 0.07463731384277343,
360
+ 0.07477247619628906,
361
+ 0.07511654663085937,
362
+ 0.07501209259033204,
363
+ 0.0749834213256836,
364
+ 0.07491993713378907,
365
+ 0.07507046508789063,
366
+ 0.07481343841552734,
367
+ 0.07470796966552734,
368
+ 0.07496089935302734,
369
+ 0.07471616363525391,
370
+ 0.07474073791503906,
371
+ 0.07478374481201172,
372
+ 0.07469977569580079,
373
+ 0.07479500579833985,
374
+ 0.07490457916259766,
375
+ 0.07489126586914062,
376
+ 0.07499468994140625,
377
+ 0.07485337829589844,
378
+ 0.07471001434326172,
379
+ 0.07463423919677735,
380
+ 0.07477862548828125,
381
+ 0.07487999725341797,
382
+ 0.07475814056396485,
383
+ 0.07457894134521484,
384
+ 0.07458099365234375,
385
+ 0.07464653015136719,
386
+ 0.07455948638916016,
387
+ 0.07476531219482421,
388
+ 0.07471206665039062,
389
+ 0.07460454559326171,
390
+ 0.07448985290527343,
391
+ 0.07475917053222657,
392
+ 0.07475814056396485,
393
+ 0.07472128295898438,
394
+ 0.07464755249023437,
395
+ 0.07485542297363282,
396
+ 0.07466598510742188,
397
+ 0.07477043151855468,
398
+ 0.0747540512084961,
399
+ 0.07485030364990235,
400
+ 0.07477862548828125,
401
+ 0.07454310607910156,
402
+ 0.07470285034179687,
403
+ 0.07476531219482421,
404
+ 0.07479090881347657,
405
+ 0.07472025299072266,
406
+ 0.0748779525756836,
407
+ 0.07480422210693359,
408
+ 0.0748748779296875,
409
+ 0.07490252685546875,
410
+ 0.07486975860595703,
411
+ 0.0752547836303711,
412
+ 0.07483289337158203,
413
+ 0.07466905975341796,
414
+ 0.07494656372070313,
415
+ 0.07488204956054688,
416
+ 0.07469261169433594,
417
+ 0.07472434997558594,
418
+ 0.07459942626953125,
419
+ 0.0748226547241211,
420
+ 0.07466291046142579,
421
+ 0.0748400650024414,
422
+ 0.074608642578125,
423
+ 0.07476326751708984,
424
+ 0.07499980926513672,
425
+ 0.07496601867675781,
426
+ 0.07505305480957031,
427
+ 0.07511756896972656,
428
+ 0.07498751831054687,
429
+ 0.07522713470458985,
430
+ 0.07483401489257813,
431
+ 0.07519324493408203,
432
+ 0.07490457916259766,
433
+ 0.07472946929931641,
434
+ 0.07506028747558594,
435
+ 0.07509292602539062,
436
+ 0.07524044799804687,
437
+ 0.07479603576660156,
438
+ 0.07473458862304687,
439
+ 0.07496089935302734,
440
+ 0.07499878692626953,
441
+ 0.07490457916259766,
442
+ 0.07486669158935547,
443
+ 0.07463526153564454,
444
+ 0.07469977569580079
445
  ]
446
  },
447
  "throughput": {
448
  "unit": "tokens/s",
449
+ "value": 13.355149201883671
450
  },
451
  "energy": null,
452
  "efficiency": null