kreas commited on
Commit
1f25541
1 Parent(s): 47502d0

Upload /Llama-2-13b-hf/nf4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Llama-2-13b-hf/nf4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json ADDED
@@ -0,0 +1,438 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "prefill": {
3
+ "memory": {
4
+ "unit": "MB",
5
+ "max_ram": 1019.068416,
6
+ "max_vram": 8359.247872,
7
+ "max_reserved": 7874.80576,
8
+ "max_allocated": 7776.413184
9
+ },
10
+ "latency": {
11
+ "unit": "s",
12
+ "mean": 0.08362868264516198,
13
+ "stdev": 0.0005853808320203658,
14
+ "values": [
15
+ 0.08983631896972656,
16
+ 0.08470630645751953,
17
+ 0.08380518341064454,
18
+ 0.08375091552734375,
19
+ 0.08335871887207032,
20
+ 0.08358297729492188,
21
+ 0.08349183654785156,
22
+ 0.08354611206054688,
23
+ 0.0835225601196289,
24
+ 0.08355020904541016,
25
+ 0.08349491119384765,
26
+ 0.08333312225341796,
27
+ 0.08380108642578125,
28
+ 0.08340889739990234,
29
+ 0.0835225601196289,
30
+ 0.08359117126464843,
31
+ 0.08348876953125,
32
+ 0.08336589050292968,
33
+ 0.08354508972167969,
34
+ 0.08330137634277343,
35
+ 0.08355840301513671,
36
+ 0.08343961334228515,
37
+ 0.08356352233886719,
38
+ 0.08346419525146484,
39
+ 0.08360652923583985,
40
+ 0.08351846313476563,
41
+ 0.08354713439941407,
42
+ 0.08336691284179687,
43
+ 0.08351538848876953,
44
+ 0.08338534545898438,
45
+ 0.08351334381103516,
46
+ 0.08355328369140624,
47
+ 0.08356771087646485,
48
+ 0.08354918670654297,
49
+ 0.08356761932373047,
50
+ 0.0835420150756836,
51
+ 0.08347238159179687,
52
+ 0.08361779022216796,
53
+ 0.0835225601196289,
54
+ 0.08360243225097656,
55
+ 0.08349491119384765,
56
+ 0.0835962905883789,
57
+ 0.08337100982666015,
58
+ 0.08359219360351562,
59
+ 0.08346931457519531,
60
+ 0.08357990264892579,
61
+ 0.08357785797119141,
62
+ 0.08359731292724609,
63
+ 0.0834897918701172,
64
+ 0.08348569488525391,
65
+ 0.08356658935546875,
66
+ 0.08365465545654296,
67
+ 0.08348774719238282,
68
+ 0.08371814727783203,
69
+ 0.08349798583984375,
70
+ 0.0836485137939453,
71
+ 0.08347545623779297,
72
+ 0.08364543914794922,
73
+ 0.08351232147216797,
74
+ 0.08361478424072266,
75
+ 0.0835594253540039,
76
+ 0.08360447692871094,
77
+ 0.08349491119384765,
78
+ 0.0835389404296875,
79
+ 0.08356147003173828,
80
+ 0.08361984252929687,
81
+ 0.08354713439941407,
82
+ 0.08363008117675781,
83
+ 0.08351846313476563,
84
+ 0.08367411041259766,
85
+ 0.08348473358154297,
86
+ 0.0836659164428711,
87
+ 0.0835440673828125,
88
+ 0.0836864013671875,
89
+ 0.08336399841308594,
90
+ 0.08362393951416015,
91
+ 0.08365670776367187,
92
+ 0.08365670776367187,
93
+ 0.08352767944335937,
94
+ 0.08361676788330077,
95
+ 0.08363314819335937,
96
+ 0.08359423828125,
97
+ 0.08361164855957032,
98
+ 0.08357068634033203,
99
+ 0.08360755157470703,
100
+ 0.08362086486816406,
101
+ 0.08364031982421875,
102
+ 0.083631103515625,
103
+ 0.0836648941040039,
104
+ 0.08355532836914062,
105
+ 0.08365567779541015,
106
+ 0.08343654632568359,
107
+ 0.08357785797119141,
108
+ 0.08364339447021485,
109
+ 0.08360249328613281,
110
+ 0.08353485107421875,
111
+ 0.08357990264892579,
112
+ 0.08367616271972657,
113
+ 0.08360345458984375,
114
+ 0.08363212585449219,
115
+ 0.08361062622070313,
116
+ 0.08357785797119141,
117
+ 0.08362290954589843,
118
+ 0.08356864166259766,
119
+ 0.08365670776367187,
120
+ 0.08355532836914062,
121
+ 0.08361881256103515,
122
+ 0.08357273864746094,
123
+ 0.08354918670654297,
124
+ 0.08361472320556641,
125
+ 0.0835758056640625,
126
+ 0.0836157455444336,
127
+ 0.083736572265625,
128
+ 0.08359935760498047,
129
+ 0.08367001342773438,
130
+ 0.08368434906005859,
131
+ 0.08361676788330077,
132
+ 0.08370073699951172,
133
+ 0.08360857391357422,
134
+ 0.08348467254638672
135
+ ]
136
+ },
137
+ "throughput": {
138
+ "unit": "tokens/s",
139
+ "value": 3061.1506949859854
140
+ },
141
+ "energy": null,
142
+ "efficiency": null
143
+ },
144
+ "decode": {
145
+ "memory": {
146
+ "unit": "MB",
147
+ "max_ram": 1019.068416,
148
+ "max_vram": 9105.833984,
149
+ "max_reserved": 8621.391872,
150
+ "max_allocated": 8484.93824
151
+ },
152
+ "latency": {
153
+ "unit": "s",
154
+ "mean": 10.647108638763433,
155
+ "stdev": 0,
156
+ "values": [
157
+ 10.647108638763433
158
+ ]
159
+ },
160
+ "throughput": {
161
+ "unit": "tokens/s",
162
+ "value": 23.950164185571417
163
+ },
164
+ "energy": null,
165
+ "efficiency": null
166
+ },
167
+ "per_token": {
168
+ "memory": null,
169
+ "latency": {
170
+ "unit": "s",
171
+ "mean": 0.04175336721083699,
172
+ "stdev": 0.00015897738186358224,
173
+ "values": [
174
+ 0.04219801712036133,
175
+ 0.04244070434570312,
176
+ 0.04166758346557617,
177
+ 0.04163174438476563,
178
+ 0.04178432083129883,
179
+ 0.04164947128295898,
180
+ 0.041617088317871094,
181
+ 0.04190729522705078,
182
+ 0.041731998443603514,
183
+ 0.0417097282409668,
184
+ 0.04163772964477539,
185
+ 0.041665534973144534,
186
+ 0.04169113540649414,
187
+ 0.04170444869995117,
188
+ 0.041525344848632816,
189
+ 0.041611392974853514,
190
+ 0.041853729248046874,
191
+ 0.041670654296875,
192
+ 0.04159078216552734,
193
+ 0.0422031364440918,
194
+ 0.04166348648071289,
195
+ 0.04166144180297852,
196
+ 0.04178636932373047,
197
+ 0.04178227233886719,
198
+ 0.04161740875244141,
199
+ 0.041637889862060545,
200
+ 0.041540607452392575,
201
+ 0.041680896759033206,
202
+ 0.04149350357055664,
203
+ 0.041853950500488284,
204
+ 0.04163891220092773,
205
+ 0.042157054901123044,
206
+ 0.041724929809570314,
207
+ 0.04184678268432617,
208
+ 0.04176998519897461,
209
+ 0.04156313705444336,
210
+ 0.041793537139892575,
211
+ 0.04184064102172851,
212
+ 0.041731071472167966,
213
+ 0.04159795379638672,
214
+ 0.041635841369628904,
215
+ 0.041799678802490234,
216
+ 0.04178841781616211,
217
+ 0.04166860961914062,
218
+ 0.04155392074584961,
219
+ 0.04159795379638672,
220
+ 0.04189081573486328,
221
+ 0.04163593673706055,
222
+ 0.04162140655517578,
223
+ 0.041591808319091796,
224
+ 0.04174848175048828,
225
+ 0.04168505477905273,
226
+ 0.04173100662231445,
227
+ 0.04184883117675781,
228
+ 0.04174335861206055,
229
+ 0.04178636932373047,
230
+ 0.04176998519897461,
231
+ 0.04193280029296875,
232
+ 0.04166451263427735,
233
+ 0.04170649719238281,
234
+ 0.041626625061035157,
235
+ 0.04183552169799805,
236
+ 0.0415549430847168,
237
+ 0.04173619079589844,
238
+ 0.04194303894042969,
239
+ 0.04162876892089844,
240
+ 0.041638816833496094,
241
+ 0.04215091323852539,
242
+ 0.041744384765625,
243
+ 0.0415428466796875,
244
+ 0.04168377685546875,
245
+ 0.04152937698364258,
246
+ 0.04166140747070313,
247
+ 0.0417259521484375,
248
+ 0.04163993453979492,
249
+ 0.04149248123168945,
250
+ 0.041828353881835936,
251
+ 0.04155801773071289,
252
+ 0.04156825637817383,
253
+ 0.04218163299560547,
254
+ 0.04151910400390625,
255
+ 0.04177519989013672,
256
+ 0.041640865325927735,
257
+ 0.04164198303222656,
258
+ 0.04178841781616211,
259
+ 0.04186127853393555,
260
+ 0.041912158966064456,
261
+ 0.04161228942871094,
262
+ 0.04188774490356445,
263
+ 0.041880577087402344,
264
+ 0.04161228942871094,
265
+ 0.04169126510620117,
266
+ 0.041487232208251956,
267
+ 0.04148857498168945,
268
+ 0.04159161758422852,
269
+ 0.04171980667114258,
270
+ 0.04153855895996094,
271
+ 0.04185190582275391,
272
+ 0.04175769424438477,
273
+ 0.04186223983764648,
274
+ 0.04184156799316406,
275
+ 0.04189801788330078,
276
+ 0.04187030410766602,
277
+ 0.041836544036865236,
278
+ 0.041780223846435545,
279
+ 0.041708545684814455,
280
+ 0.04182425689697265,
281
+ 0.04182947158813476,
282
+ 0.04204636764526367,
283
+ 0.041854209899902343,
284
+ 0.041729793548583985,
285
+ 0.04175974273681641,
286
+ 0.041829376220703124,
287
+ 0.041714687347412106,
288
+ 0.04189286422729492,
289
+ 0.04172390365600586,
290
+ 0.04212428665161133,
291
+ 0.041708545684814455,
292
+ 0.041812992095947264,
293
+ 0.041919486999511715,
294
+ 0.04166860961914062,
295
+ 0.04163174438476563,
296
+ 0.04183859252929688,
297
+ 0.04176793670654297,
298
+ 0.041902080535888675,
299
+ 0.04172902297973633,
300
+ 0.04196352005004883,
301
+ 0.04229324722290039,
302
+ 0.041799678802490234,
303
+ 0.04192153549194336,
304
+ 0.0418682861328125,
305
+ 0.0418600959777832,
306
+ 0.04173516845703125,
307
+ 0.041987071990966796,
308
+ 0.04173926544189453,
309
+ 0.04172288131713867,
310
+ 0.04189286422729492,
311
+ 0.041780223846435545,
312
+ 0.041670654296875,
313
+ 0.04171673583984375,
314
+ 0.041902080535888675,
315
+ 0.04194713592529297,
316
+ 0.04179455947875976,
317
+ 0.04173926544189453,
318
+ 0.04173516845703125,
319
+ 0.04178636932373047,
320
+ 0.04187238311767578,
321
+ 0.041665534973144534,
322
+ 0.04189286422729492,
323
+ 0.04149760055541992,
324
+ 0.04184473419189453,
325
+ 0.04191436767578125,
326
+ 0.04183244705200195,
327
+ 0.042280223846435545,
328
+ 0.042299102783203125,
329
+ 0.04186214447021484,
330
+ 0.04178841781616211,
331
+ 0.04185497665405274,
332
+ 0.04175769424438477,
333
+ 0.04167782211303711,
334
+ 0.04173516845703125,
335
+ 0.041816062927246093,
336
+ 0.04177203369140625,
337
+ 0.0417894401550293,
338
+ 0.042105857849121096,
339
+ 0.04157654571533203,
340
+ 0.04186614227294922,
341
+ 0.041842689514160154,
342
+ 0.041605121612548826,
343
+ 0.04171878433227539,
344
+ 0.041629695892333986,
345
+ 0.041875457763671874,
346
+ 0.04161536026000977,
347
+ 0.04171366500854492,
348
+ 0.04176588821411133,
349
+ 0.04219596862792969,
350
+ 0.04166144180297852,
351
+ 0.04165836715698242,
352
+ 0.041659393310546876,
353
+ 0.04185625457763672,
354
+ 0.04177382278442383,
355
+ 0.04182732772827148,
356
+ 0.041847808837890625,
357
+ 0.041826305389404295,
358
+ 0.04172083282470703,
359
+ 0.04182527923583984,
360
+ 0.0418600959777832,
361
+ 0.04174950408935547,
362
+ 0.04171571350097656,
363
+ 0.041708545684814455,
364
+ 0.04163686370849609,
365
+ 0.04158464050292969,
366
+ 0.041665534973144534,
367
+ 0.04190719985961914,
368
+ 0.041680896759033206,
369
+ 0.041777153015136716,
370
+ 0.041534465789794923,
371
+ 0.04157136154174805,
372
+ 0.04159382247924805,
373
+ 0.04162355041503906,
374
+ 0.04171571350097656,
375
+ 0.041673728942871094,
376
+ 0.041724929809570314,
377
+ 0.041665534973144534,
378
+ 0.041594879150390625,
379
+ 0.04173209762573242,
380
+ 0.04168294525146484,
381
+ 0.04171980667114258,
382
+ 0.0416890869140625,
383
+ 0.04168601608276367,
384
+ 0.041556991577148435,
385
+ 0.041712928771972656,
386
+ 0.042162910461425784,
387
+ 0.04135424041748047,
388
+ 0.04165119934082031,
389
+ 0.04175872039794922,
390
+ 0.04175564956665039,
391
+ 0.041715999603271485,
392
+ 0.041715423583984376,
393
+ 0.041567230224609376,
394
+ 0.04177305603027344,
395
+ 0.04170348739624023,
396
+ 0.041805759429931644,
397
+ 0.041662464141845705,
398
+ 0.04213555145263672,
399
+ 0.04206489562988281,
400
+ 0.04169113540649414,
401
+ 0.04160531234741211,
402
+ 0.041748287200927735,
403
+ 0.04173516845703125,
404
+ 0.041632766723632815,
405
+ 0.04172902297973633,
406
+ 0.04197683334350586,
407
+ 0.041750526428222655,
408
+ 0.041635841369628904,
409
+ 0.04169318389892578,
410
+ 0.04157747268676758,
411
+ 0.041750526428222655,
412
+ 0.04165017700195312,
413
+ 0.04164198303222656,
414
+ 0.04153855895996094,
415
+ 0.0416184310913086,
416
+ 0.04174540710449219,
417
+ 0.041657344818115234,
418
+ 0.041752574920654296,
419
+ 0.04167782211303711,
420
+ 0.041971710205078124,
421
+ 0.04169625473022461,
422
+ 0.04170342254638672,
423
+ 0.04166041564941406,
424
+ 0.041545726776123046,
425
+ 0.04167270278930664,
426
+ 0.04174335861206055,
427
+ 0.04185190582275391,
428
+ 0.041777153015136716
429
+ ]
430
+ },
431
+ "throughput": {
432
+ "unit": "tokens/s",
433
+ "value": 23.950164185571413
434
+ },
435
+ "energy": null,
436
+ "efficiency": null
437
+ }
438
+ }