kreas commited on
Commit
b36e5c8
1 Parent(s): 14647a5

Upload /Mistral-7B-v0.1/int8_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Mistral-7B-v0.1/int8_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json ADDED
@@ -0,0 +1,472 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "prefill": {
3
+ "memory": {
4
+ "unit": "MB",
5
+ "max_ram": 4899.352576,
6
+ "max_vram": 8757.706752,
7
+ "max_reserved": 8300.527616,
8
+ "max_allocated": 8141.046272
9
+ },
10
+ "latency": {
11
+ "unit": "s",
12
+ "mean": 0.06498407784994545,
13
+ "stdev": 0.0012725798540905208,
14
+ "values": [
15
+ 0.07094246673583984,
16
+ 0.06825062561035156,
17
+ 0.06625587463378907,
18
+ 0.06964224243164062,
19
+ 0.07119462585449218,
20
+ 0.06544895935058594,
21
+ 0.06484480285644531,
22
+ 0.06624460601806641,
23
+ 0.06468402862548828,
24
+ 0.06472191619873047,
25
+ 0.06462258911132812,
26
+ 0.06466969299316407,
27
+ 0.0648253402709961,
28
+ 0.06485708618164063,
29
+ 0.06478131103515625,
30
+ 0.06481919860839844,
31
+ 0.06479872131347657,
32
+ 0.06470861053466796,
33
+ 0.06476083374023438,
34
+ 0.0647014389038086,
35
+ 0.064468994140625,
36
+ 0.06457344055175782,
37
+ 0.06462054443359375,
38
+ 0.06466867065429688,
39
+ 0.06438912200927735,
40
+ 0.06441165161132813,
41
+ 0.0644485092163086,
42
+ 0.06455296325683593,
43
+ 0.0646297607421875,
44
+ 0.06463488006591797,
45
+ 0.06486323547363282,
46
+ 0.06442803192138671,
47
+ 0.06460313415527344,
48
+ 0.06466047668457031,
49
+ 0.06472089385986328,
50
+ 0.06455296325683593,
51
+ 0.064574462890625,
52
+ 0.06447309112548828,
53
+ 0.06504345703125,
54
+ 0.06460620880126954,
55
+ 0.06446694183349609,
56
+ 0.06450994873046875,
57
+ 0.06444751739501953,
58
+ 0.0647383041381836,
59
+ 0.06471475219726562,
60
+ 0.06452838134765625,
61
+ 0.06454681396484375,
62
+ 0.064648193359375,
63
+ 0.06457855987548829,
64
+ 0.06477516937255859,
65
+ 0.06461337280273438,
66
+ 0.06448435211181641,
67
+ 0.06449152374267578,
68
+ 0.06454579162597657,
69
+ 0.0645038070678711,
70
+ 0.06446694183349609,
71
+ 0.06449152374267578,
72
+ 0.0644136962890625,
73
+ 0.06437478637695312,
74
+ 0.06454271697998047,
75
+ 0.06440652465820312,
76
+ 0.06463897705078125,
77
+ 0.06486732482910157,
78
+ 0.06457651519775391,
79
+ 0.06454271697998047,
80
+ 0.06441292572021484,
81
+ 0.06450387573242188,
82
+ 0.06448947143554687,
83
+ 0.06458573150634765,
84
+ 0.06476902770996094,
85
+ 0.06449356842041015,
86
+ 0.06458777618408203,
87
+ 0.06443417358398437,
88
+ 0.06463590240478516,
89
+ 0.06469222259521484,
90
+ 0.06456217956542969,
91
+ 0.06440447998046875,
92
+ 0.06440140533447265,
93
+ 0.06439628601074218,
94
+ 0.06453350067138672,
95
+ 0.06457855987548829,
96
+ 0.06439628601074218,
97
+ 0.0643594207763672,
98
+ 0.06456012725830078,
99
+ 0.06453043365478515,
100
+ 0.06456934356689453,
101
+ 0.0646297607421875,
102
+ 0.06454905700683594,
103
+ 0.06456012725830078,
104
+ 0.06454886627197266,
105
+ 0.06442291259765626,
106
+ 0.06443724822998047,
107
+ 0.06456626892089844,
108
+ 0.0648980484008789,
109
+ 0.0646645736694336,
110
+ 0.064611328125,
111
+ 0.06437888336181641,
112
+ 0.06456832122802734,
113
+ 0.06453478240966797,
114
+ 0.06498099517822266,
115
+ 0.0649574432373047,
116
+ 0.0645038070678711,
117
+ 0.06426930999755859,
118
+ 0.06442803192138671,
119
+ 0.06462873840332031,
120
+ 0.06453247833251953,
121
+ 0.06440857696533203,
122
+ 0.0643737564086914,
123
+ 0.06434611511230469,
124
+ 0.06456114959716797,
125
+ 0.06445260620117188,
126
+ 0.0646983642578125,
127
+ 0.06459699249267578,
128
+ 0.06488063812255859,
129
+ 0.06463897705078125,
130
+ 0.06488985443115235,
131
+ 0.0647352294921875,
132
+ 0.0648089599609375,
133
+ 0.06459187316894531,
134
+ 0.06459699249267578,
135
+ 0.06456320190429687,
136
+ 0.06465331268310547,
137
+ 0.06464307403564454,
138
+ 0.06456114959716797,
139
+ 0.06512537384033203,
140
+ 0.06454402923583985,
141
+ 0.06483455657958985,
142
+ 0.0670730209350586,
143
+ 0.06992588806152343,
144
+ 0.06921830749511719,
145
+ 0.06901350402832031,
146
+ 0.06951628875732421,
147
+ 0.06914559936523437,
148
+ 0.06901964569091797,
149
+ 0.06459187316894531,
150
+ 0.06472908782958985,
151
+ 0.0646266860961914,
152
+ 0.06460108947753906,
153
+ 0.06512230682373046,
154
+ 0.06468915557861328,
155
+ 0.06465740966796875,
156
+ 0.06479666900634766,
157
+ 0.06475059509277344,
158
+ 0.06482841491699219,
159
+ 0.06464335632324218,
160
+ 0.0648622055053711,
161
+ 0.06478336334228516,
162
+ 0.06468915557861328,
163
+ 0.06449766540527344,
164
+ 0.06479257965087891,
165
+ 0.06481305694580078,
166
+ 0.06494412994384766,
167
+ 0.06491340637207031,
168
+ 0.06461644744873046
169
+ ]
170
+ },
171
+ "throughput": {
172
+ "unit": "tokens/s",
173
+ "value": 3939.4265252348255
174
+ },
175
+ "energy": null,
176
+ "efficiency": null
177
+ },
178
+ "decode": {
179
+ "memory": {
180
+ "unit": "MB",
181
+ "max_ram": 4899.352576,
182
+ "max_vram": 8959.033344,
183
+ "max_reserved": 8466.202624,
184
+ "max_allocated": 8264.640512
185
+ },
186
+ "latency": {
187
+ "unit": "s",
188
+ "mean": 16.6724708480835,
189
+ "stdev": 0,
190
+ "values": [
191
+ 16.6724708480835
192
+ ]
193
+ },
194
+ "throughput": {
195
+ "unit": "tokens/s",
196
+ "value": 15.294673616377159
197
+ },
198
+ "energy": null,
199
+ "efficiency": null
200
+ },
201
+ "per_token": {
202
+ "memory": null,
203
+ "latency": {
204
+ "unit": "s",
205
+ "mean": 0.06538223861993529,
206
+ "stdev": 0.0002781621419081298,
207
+ "values": [
208
+ 0.06762483215332031,
209
+ 0.06704640197753907,
210
+ 0.06520832061767579,
211
+ 0.0651714859008789,
212
+ 0.06487548828125,
213
+ 0.06525151824951173,
214
+ 0.06513337707519531,
215
+ 0.06553600311279296,
216
+ 0.06511615753173829,
217
+ 0.06526668548583985,
218
+ 0.06533529663085938,
219
+ 0.06514073944091797,
220
+ 0.06533222198486328,
221
+ 0.06537324523925782,
222
+ 0.06544786834716797,
223
+ 0.06525647735595703,
224
+ 0.06542230224609374,
225
+ 0.06531702423095703,
226
+ 0.06525628662109376,
227
+ 0.06509670257568359,
228
+ 0.06520320129394531,
229
+ 0.06529142761230469,
230
+ 0.06517948913574219,
231
+ 0.06516326141357422,
232
+ 0.06506803131103515,
233
+ 0.06535167694091797,
234
+ 0.06541311645507812,
235
+ 0.06532710266113281,
236
+ 0.06523494720458985,
237
+ 0.06521036529541016,
238
+ 0.06549811553955077,
239
+ 0.0654366683959961,
240
+ 0.06522879791259766,
241
+ 0.06520524597167969,
242
+ 0.06532608032226563,
243
+ 0.06534758758544922,
244
+ 0.06536192321777344,
245
+ 0.06514892578125,
246
+ 0.06570700836181641,
247
+ 0.06523289489746094,
248
+ 0.06521343994140626,
249
+ 0.06533222198486328,
250
+ 0.06529638671875,
251
+ 0.06514073944091797,
252
+ 0.06515312194824219,
253
+ 0.0652225570678711,
254
+ 0.06515814208984375,
255
+ 0.0651878433227539,
256
+ 0.0652195816040039,
257
+ 0.06536089324951172,
258
+ 0.06540493011474609,
259
+ 0.0653322525024414,
260
+ 0.0654345932006836,
261
+ 0.06535577392578125,
262
+ 0.065080322265625,
263
+ 0.06531686401367187,
264
+ 0.0653117446899414,
265
+ 0.06521244812011719,
266
+ 0.06517040252685546,
267
+ 0.0655617904663086,
268
+ 0.06513645172119141,
269
+ 0.06590771484375,
270
+ 0.06514892578125,
271
+ 0.06524432373046875,
272
+ 0.06522557067871093,
273
+ 0.06532505798339844,
274
+ 0.06511615753173829,
275
+ 0.06538137817382812,
276
+ 0.06524825286865234,
277
+ 0.06594371032714844,
278
+ 0.06514876556396484,
279
+ 0.06517964935302735,
280
+ 0.0651673583984375,
281
+ 0.06523910522460938,
282
+ 0.06521337890625,
283
+ 0.06530150604248047,
284
+ 0.06514073944091797,
285
+ 0.06531993865966797,
286
+ 0.06534349060058593,
287
+ 0.06525440216064453,
288
+ 0.06528205108642578,
289
+ 0.06546636962890626,
290
+ 0.0655994873046875,
291
+ 0.06517657470703125,
292
+ 0.0652195816040039,
293
+ 0.06653453063964844,
294
+ 0.06650150299072266,
295
+ 0.06548684692382813,
296
+ 0.06526566314697266,
297
+ 0.06539263916015625,
298
+ 0.06532505798339844,
299
+ 0.06512230682373046,
300
+ 0.06594662475585937,
301
+ 0.06531686401367187,
302
+ 0.06568959808349609,
303
+ 0.0654543685913086,
304
+ 0.06544764709472656,
305
+ 0.06538137817382812,
306
+ 0.0654202880859375,
307
+ 0.06544588470458984,
308
+ 0.06574899291992188,
309
+ 0.06559539031982421,
310
+ 0.06564147186279297,
311
+ 0.0653803482055664,
312
+ 0.0653486099243164,
313
+ 0.06536396789550782,
314
+ 0.0654172134399414,
315
+ 0.06518374633789062,
316
+ 0.06549298858642578,
317
+ 0.06541110229492188,
318
+ 0.06528816223144532,
319
+ 0.06514585876464844,
320
+ 0.06548172760009766,
321
+ 0.06582784271240234,
322
+ 0.0651673583984375,
323
+ 0.0655626220703125,
324
+ 0.06563123321533203,
325
+ 0.06521753692626953,
326
+ 0.06543154907226563,
327
+ 0.06539798736572265,
328
+ 0.06518761444091797,
329
+ 0.06530252838134766,
330
+ 0.06542233276367188,
331
+ 0.06601830291748047,
332
+ 0.06546227264404297,
333
+ 0.0652933120727539,
334
+ 0.065544189453125,
335
+ 0.06536089324951172,
336
+ 0.06534963226318359,
337
+ 0.06544802856445313,
338
+ 0.0656536636352539,
339
+ 0.06505779266357421,
340
+ 0.06537830352783203,
341
+ 0.06531686401367187,
342
+ 0.06549504089355469,
343
+ 0.06539366149902344,
344
+ 0.06528717041015625,
345
+ 0.06548377227783203,
346
+ 0.06567833709716797,
347
+ 0.0653834228515625,
348
+ 0.06545101165771484,
349
+ 0.06531378936767578,
350
+ 0.06521446228027344,
351
+ 0.06529862213134766,
352
+ 0.06516432189941407,
353
+ 0.06522550201416015,
354
+ 0.0649318389892578,
355
+ 0.06545919799804688,
356
+ 0.06518374633789062,
357
+ 0.06527385711669922,
358
+ 0.06544076538085937,
359
+ 0.0652759017944336,
360
+ 0.06514380645751953,
361
+ 0.06511430358886719,
362
+ 0.06576518249511719,
363
+ 0.0652011489868164,
364
+ 0.06531072235107421,
365
+ 0.06541619110107422,
366
+ 0.06532300567626953,
367
+ 0.06530764770507813,
368
+ 0.06522163391113281,
369
+ 0.06577049255371094,
370
+ 0.06522982025146484,
371
+ 0.06542848205566407,
372
+ 0.06550220489501953,
373
+ 0.06544281768798828,
374
+ 0.06558515167236328,
375
+ 0.0654202880859375,
376
+ 0.06538137817382812,
377
+ 0.06533529663085938,
378
+ 0.0655257568359375,
379
+ 0.06571724700927735,
380
+ 0.06536704254150391,
381
+ 0.06547875213623047,
382
+ 0.06547650909423829,
383
+ 0.06550326538085938,
384
+ 0.06534345245361328,
385
+ 0.06527897644042968,
386
+ 0.06557081604003906,
387
+ 0.06523494720458985,
388
+ 0.0654755859375,
389
+ 0.06553497314453124,
390
+ 0.0654366683959961,
391
+ 0.06553804779052734,
392
+ 0.06546022033691407,
393
+ 0.06621705627441406,
394
+ 0.0654591064453125,
395
+ 0.06548070526123047,
396
+ 0.06533529663085938,
397
+ 0.06509056091308593,
398
+ 0.06556877136230468,
399
+ 0.06517759704589844,
400
+ 0.0657940444946289,
401
+ 0.06517759704589844,
402
+ 0.0652779541015625,
403
+ 0.06526054382324219,
404
+ 0.06545919799804688,
405
+ 0.06518886566162109,
406
+ 0.06528307342529296,
407
+ 0.06530662536621094,
408
+ 0.06529126739501953,
409
+ 0.06509670257568359,
410
+ 0.06508748626708985,
411
+ 0.06531788635253906,
412
+ 0.0652759017944336,
413
+ 0.06528428649902343,
414
+ 0.06515487670898437,
415
+ 0.06521446228027344,
416
+ 0.06553804779052734,
417
+ 0.06530764770507813,
418
+ 0.06534963226318359,
419
+ 0.06533529663085938,
420
+ 0.06534246063232421,
421
+ 0.06545439910888672,
422
+ 0.06537490844726562,
423
+ 0.0655494384765625,
424
+ 0.06549593353271485,
425
+ 0.0652779541015625,
426
+ 0.06527999877929687,
427
+ 0.06521548461914063,
428
+ 0.06546534729003907,
429
+ 0.06517686462402343,
430
+ 0.06531452941894532,
431
+ 0.06571532440185547,
432
+ 0.06525325012207031,
433
+ 0.0652042236328125,
434
+ 0.0652390365600586,
435
+ 0.06543782043457032,
436
+ 0.06538841247558594,
437
+ 0.06537216186523437,
438
+ 0.06537216186523437,
439
+ 0.06557183837890625,
440
+ 0.06528409576416015,
441
+ 0.06531584167480468,
442
+ 0.06535987091064453,
443
+ 0.0654366683959961,
444
+ 0.06534143829345704,
445
+ 0.06544691467285156,
446
+ 0.06544179534912109,
447
+ 0.06558924865722657,
448
+ 0.06534143829345704,
449
+ 0.06554637145996094,
450
+ 0.06571302032470704,
451
+ 0.06539574432373046,
452
+ 0.06537315368652344,
453
+ 0.06562201690673829,
454
+ 0.06593536376953125,
455
+ 0.06536089324951172,
456
+ 0.06548992156982422,
457
+ 0.06525567626953124,
458
+ 0.06522137451171875,
459
+ 0.06509260559082031,
460
+ 0.06487757110595703,
461
+ 0.06510415649414063,
462
+ 0.0656944351196289
463
+ ]
464
+ },
465
+ "throughput": {
466
+ "unit": "tokens/s",
467
+ "value": 15.294673616377159
468
+ },
469
+ "energy": null,
470
+ "efficiency": null
471
+ }
472
+ }