kreas commited on
Commit
057ba1e
1 Parent(s): 2a1c362

Upload /Mistral-7B-v0.1-GPTQ-3bit/gptq3bit_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Mistral-7B-v0.1-GPTQ-3bit/gptq3bit_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json ADDED
@@ -0,0 +1,600 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "prefill": {
3
+ "memory": {
4
+ "unit": "MB",
5
+ "max_ram": 6528.4096,
6
+ "max_vram": 5339.348992,
7
+ "max_reserved": 4854.90688,
8
+ "max_allocated": 4578.492928
9
+ },
10
+ "latency": {
11
+ "unit": "s",
12
+ "mean": 0.39816815772423375,
13
+ "stdev": 0.002303332450814792,
14
+ "values": [
15
+ 0.4079566650390625,
16
+ 0.4037754821777344,
17
+ 0.3976529846191406,
18
+ 0.39734170532226565,
19
+ 0.3976304626464844,
20
+ 0.3972608032226562,
21
+ 0.39766220092773436,
22
+ 0.39732736206054686,
23
+ 0.3976365966796875,
24
+ 0.3974502258300781,
25
+ 0.397623291015625,
26
+ 0.3975618591308594,
27
+ 0.39749017333984377,
28
+ 0.3972812805175781,
29
+ 0.3980052490234375,
30
+ 0.39739801025390625,
31
+ 0.3976386413574219,
32
+ 0.39732864379882815,
33
+ 0.3978076171875,
34
+ 0.3973171081542969,
35
+ 0.3976079406738281,
36
+ 0.39740826416015623,
37
+ 0.3976837158203125,
38
+ 0.39737548828125,
39
+ 0.3977031555175781,
40
+ 0.39744717407226565
41
+ ]
42
+ },
43
+ "throughput": {
44
+ "unit": "tokens/s",
45
+ "value": 642.9444319786676
46
+ },
47
+ "energy": null,
48
+ "efficiency": null
49
+ },
50
+ "decode": {
51
+ "memory": {
52
+ "unit": "MB",
53
+ "max_ram": 6528.4096,
54
+ "max_vram": 5509.218304,
55
+ "max_reserved": 5024.776192,
56
+ "max_allocated": 4645.47584
57
+ },
58
+ "latency": {
59
+ "unit": "s",
60
+ "mean": 7.997448039054872,
61
+ "stdev": 0.011532164573672343,
62
+ "values": [
63
+ 8.008980203628544,
64
+ 7.9859158744812
65
+ ]
66
+ },
67
+ "throughput": {
68
+ "unit": "tokens/s",
69
+ "value": 31.885171213958344
70
+ },
71
+ "energy": null,
72
+ "efficiency": null
73
+ },
74
+ "per_token": {
75
+ "memory": null,
76
+ "latency": {
77
+ "unit": "s",
78
+ "mean": 0.031362541329626945,
79
+ "stdev": 0.00022266343846452815,
80
+ "values": [
81
+ 0.03446857452392578,
82
+ 0.03357388687133789,
83
+ 0.0317388801574707,
84
+ 0.031476736068725586,
85
+ 0.031341856002807617,
86
+ 0.03127881622314453,
87
+ 0.03127398490905762,
88
+ 0.03122380828857422,
89
+ 0.03141324806213379,
90
+ 0.0313753604888916,
91
+ 0.03141734313964844,
92
+ 0.031510528564453126,
93
+ 0.031320064544677735,
94
+ 0.03136204719543457,
95
+ 0.0313384952545166,
96
+ 0.03127193641662598,
97
+ 0.03147878456115723,
98
+ 0.03139686393737793,
99
+ 0.031322111129760744,
100
+ 0.03127398490905762,
101
+ 0.03136409568786621,
102
+ 0.031386720657348634,
103
+ 0.03139267158508301,
104
+ 0.03139993667602539,
105
+ 0.031507455825805664,
106
+ 0.031403072357177736,
107
+ 0.03159136009216309,
108
+ 0.031221759796142577,
109
+ 0.03141324806213379,
110
+ 0.031438848495483396,
111
+ 0.031303680419921875,
112
+ 0.03132524871826172,
113
+ 0.0313896312713623,
114
+ 0.03132928085327148,
115
+ 0.03139379119873047,
116
+ 0.03129651260375976,
117
+ 0.03141939163208008,
118
+ 0.03134480094909668,
119
+ 0.031377248764038086,
120
+ 0.031251455307006834,
121
+ 0.03129875183105469,
122
+ 0.03133113670349121,
123
+ 0.03150643157958984,
124
+ 0.031287296295166016,
125
+ 0.03125964736938477,
126
+ 0.03139788818359375,
127
+ 0.031318016052246093,
128
+ 0.03136716842651367,
129
+ 0.031335424423217774,
130
+ 0.0313436164855957,
131
+ 0.03133872032165527,
132
+ 0.03145712089538574,
133
+ 0.03146745681762695,
134
+ 0.031425535202026365,
135
+ 0.03130060768127441,
136
+ 0.0315228157043457,
137
+ 0.03136031913757324,
138
+ 0.03146310424804687,
139
+ 0.03136102485656738,
140
+ 0.0315043830871582,
141
+ 0.03148287963867188,
142
+ 0.03150028800964356,
143
+ 0.03138150405883789,
144
+ 0.0314337272644043,
145
+ 0.03141836738586426,
146
+ 0.03127193641662598,
147
+ 0.03128220748901367,
148
+ 0.031411327362060544,
149
+ 0.03129840087890625,
150
+ 0.03170816040039062,
151
+ 0.03136716842651367,
152
+ 0.031513599395751955,
153
+ 0.03140505599975586,
154
+ 0.03146137619018555,
155
+ 0.032069633483886716,
156
+ 0.03126796722412109,
157
+ 0.03132403182983398,
158
+ 0.03146649551391602,
159
+ 0.03158937644958496,
160
+ 0.03140812873840332,
161
+ 0.031415519714355467,
162
+ 0.03149398422241211,
163
+ 0.03149407958984375,
164
+ 0.031460351943969726,
165
+ 0.031251455307006834,
166
+ 0.0321976318359375,
167
+ 0.03282944107055664,
168
+ 0.03155046463012695,
169
+ 0.03142451286315918,
170
+ 0.03140812873840332,
171
+ 0.0312956485748291,
172
+ 0.031407968521118164,
173
+ 0.03128422355651855,
174
+ 0.031389696121215824,
175
+ 0.031284479141235354,
176
+ 0.03131161689758301,
177
+ 0.03123404884338379,
178
+ 0.03134876823425293,
179
+ 0.03133340835571289,
180
+ 0.031415231704711916,
181
+ 0.031324159622192385,
182
+ 0.03162419128417969,
183
+ 0.031281152725219724,
184
+ 0.031275007247924806,
185
+ 0.031244287490844725,
186
+ 0.03135190391540527,
187
+ 0.031262624740600584,
188
+ 0.03137228775024414,
189
+ 0.0315545597076416,
190
+ 0.03155763244628906,
191
+ 0.03116851234436035,
192
+ 0.031388671875,
193
+ 0.03126681518554687,
194
+ 0.031396928787231444,
195
+ 0.031176639556884767,
196
+ 0.031287296295166016,
197
+ 0.031140863418579103,
198
+ 0.03134566307067871,
199
+ 0.03121561622619629,
200
+ 0.031336448669433595,
201
+ 0.03115007972717285,
202
+ 0.0313118724822998,
203
+ 0.03118489646911621,
204
+ 0.031243263244628908,
205
+ 0.03118694305419922,
206
+ 0.03134259223937988,
207
+ 0.03121049690246582,
208
+ 0.031245311737060546,
209
+ 0.031341567993164066,
210
+ 0.03139891242980957,
211
+ 0.03127603149414063,
212
+ 0.03134259223937988,
213
+ 0.03122483253479004,
214
+ 0.03135206413269043,
215
+ 0.031340383529663084,
216
+ 0.03131279945373535,
217
+ 0.03131596755981445,
218
+ 0.03138764762878418,
219
+ 0.03132620811462403,
220
+ 0.03133337593078613,
221
+ 0.03139686393737793,
222
+ 0.03133337593078613,
223
+ 0.031340543746948245,
224
+ 0.031357952117919925,
225
+ 0.03127603149414063,
226
+ 0.03143475151062012,
227
+ 0.03127910423278808,
228
+ 0.03133235168457031,
229
+ 0.03147878456115723,
230
+ 0.03141632080078125,
231
+ 0.03133235168457031,
232
+ 0.03143987274169922,
233
+ 0.03141324806213379,
234
+ 0.03139993667602539,
235
+ 0.03141222381591797,
236
+ 0.03143577575683594,
237
+ 0.03145536041259766,
238
+ 0.03138751983642578,
239
+ 0.03131699180603027,
240
+ 0.031410207748413084,
241
+ 0.03143984031677246,
242
+ 0.031509504318237305,
243
+ 0.031493120193481446,
244
+ 0.0314019832611084,
245
+ 0.03142758369445801,
246
+ 0.03140403175354004,
247
+ 0.031509504318237305,
248
+ 0.03140505599975586,
249
+ 0.03126067161560059,
250
+ 0.031459327697753905,
251
+ 0.03138047981262207,
252
+ 0.031475967407226565,
253
+ 0.03166080093383789,
254
+ 0.03151900863647461,
255
+ 0.031423200607299806,
256
+ 0.03152400016784668,
257
+ 0.03150422477722168,
258
+ 0.031306751251220705,
259
+ 0.031263744354248044,
260
+ 0.03133247947692871,
261
+ 0.0314069766998291,
262
+ 0.03144704055786133,
263
+ 0.03139583969116211,
264
+ 0.03138047981262207,
265
+ 0.03150131225585937,
266
+ 0.03136102485656738,
267
+ 0.03141427230834961,
268
+ 0.03136310386657715,
269
+ 0.03143984031677246,
270
+ 0.031285247802734374,
271
+ 0.031275007247924806,
272
+ 0.03136307144165039,
273
+ 0.03119001579284668,
274
+ 0.031410175323486327,
275
+ 0.03136409568786621,
276
+ 0.031406080245971676,
277
+ 0.03126169586181641,
278
+ 0.031321088790893556,
279
+ 0.031363199234008786,
280
+ 0.03139468765258789,
281
+ 0.031643648147583005,
282
+ 0.03158016014099121,
283
+ 0.031337472915649416,
284
+ 0.03135814476013184,
285
+ 0.03142848014831543,
286
+ 0.031386783599853516,
287
+ 0.03139161682128906,
288
+ 0.03135791969299316,
289
+ 0.0313240966796875,
290
+ 0.03141427230834961,
291
+ 0.031226879119873048,
292
+ 0.03134976005554199,
293
+ 0.03148492813110351,
294
+ 0.03134566307067871,
295
+ 0.03146137619018555,
296
+ 0.03140505599975586,
297
+ 0.03142758369445801,
298
+ 0.03146137619018555,
299
+ 0.03133440017700195,
300
+ 0.03137433624267578,
301
+ 0.031355903625488284,
302
+ 0.03141222381591797,
303
+ 0.03132233619689941,
304
+ 0.03125334358215332,
305
+ 0.03135276794433594,
306
+ 0.031307775497436525,
307
+ 0.031369216918945314,
308
+ 0.031408416748046876,
309
+ 0.031371999740600585,
310
+ 0.03139891242980957,
311
+ 0.03137638473510742,
312
+ 0.03127193641662598,
313
+ 0.031735807418823245,
314
+ 0.03167231941223145,
315
+ 0.03142348861694336,
316
+ 0.03138252830505371,
317
+ 0.031425535202026365,
318
+ 0.03142758369445801,
319
+ 0.03142348861694336,
320
+ 0.03138252830505371,
321
+ 0.03132825660705566,
322
+ 0.0314583683013916,
323
+ 0.03131385612487793,
324
+ 0.03139993667602539,
325
+ 0.031252479553222655,
326
+ 0.031508480072021484,
327
+ 0.03144601631164551,
328
+ 0.031152128219604492,
329
+ 0.031351808547973634,
330
+ 0.031274208068847655,
331
+ 0.03148784065246582,
332
+ 0.031200191497802735,
333
+ 0.03102003288269043,
334
+ 0.03141836738586426,
335
+ 0.0311592960357666,
336
+ 0.03169779205322266,
337
+ 0.031855615615844726,
338
+ 0.03142451286315918,
339
+ 0.03126278305053711,
340
+ 0.0314080638885498,
341
+ 0.03131391906738281,
342
+ 0.03133440017700195,
343
+ 0.031322111129760744,
344
+ 0.031308799743652346,
345
+ 0.031287296295166016,
346
+ 0.03132620811462403,
347
+ 0.03136102485656738,
348
+ 0.03130572891235352,
349
+ 0.03135398483276367,
350
+ 0.0312544002532959,
351
+ 0.031185920715332032,
352
+ 0.03134873580932617,
353
+ 0.03125971221923828,
354
+ 0.031224767684936525,
355
+ 0.03123302459716797,
356
+ 0.031328384399414065,
357
+ 0.03125747108459473,
358
+ 0.03134259223937988,
359
+ 0.03126169586181641,
360
+ 0.031220735549926756,
361
+ 0.03127910423278808,
362
+ 0.03136614418029785,
363
+ 0.031188287734985352,
364
+ 0.0312736644744873,
365
+ 0.031213855743408202,
366
+ 0.03124502372741699,
367
+ 0.03127004814147949,
368
+ 0.03135574340820312,
369
+ 0.0313384952545166,
370
+ 0.0313436164855957,
371
+ 0.031310880661010745,
372
+ 0.031335391998291016,
373
+ 0.03117465591430664,
374
+ 0.03127398490905762,
375
+ 0.031199264526367187,
376
+ 0.031217632293701173,
377
+ 0.031236095428466795,
378
+ 0.03128832054138184,
379
+ 0.03130982398986817,
380
+ 0.031252479553222655,
381
+ 0.03123302459716797,
382
+ 0.031098880767822266,
383
+ 0.03121664047241211,
384
+ 0.0311297607421875,
385
+ 0.03125436782836914,
386
+ 0.031245311737060546,
387
+ 0.031270912170410156,
388
+ 0.03126272010803223,
389
+ 0.03128217506408691,
390
+ 0.03120025634765625,
391
+ 0.03135603141784668,
392
+ 0.031210367202758788,
393
+ 0.03126681518554687,
394
+ 0.03134668731689453,
395
+ 0.03140412712097168,
396
+ 0.03124857521057129,
397
+ 0.031338207244873045,
398
+ 0.031169536590576172,
399
+ 0.03133337593078613,
400
+ 0.031269887924194335,
401
+ 0.031169536590576172,
402
+ 0.031245344161987303,
403
+ 0.031178720474243166,
404
+ 0.03119820785522461,
405
+ 0.031110143661499022,
406
+ 0.031246591567993164,
407
+ 0.03128499221801758,
408
+ 0.03135385513305664,
409
+ 0.031144960403442383,
410
+ 0.03129446411132813,
411
+ 0.031116287231445314,
412
+ 0.03114195251464844,
413
+ 0.0313691520690918,
414
+ 0.03127398490905762,
415
+ 0.03124940872192383,
416
+ 0.03130473518371582,
417
+ 0.031185152053833008,
418
+ 0.031396703720092775,
419
+ 0.031230016708374022,
420
+ 0.031101951599121092,
421
+ 0.031221567153930666,
422
+ 0.03125657653808594,
423
+ 0.03130060768127441,
424
+ 0.03126790428161621,
425
+ 0.03112851142883301,
426
+ 0.03129548835754394,
427
+ 0.031357952117919925,
428
+ 0.03137638473510742,
429
+ 0.031251455307006834,
430
+ 0.03126188850402832,
431
+ 0.031183679580688475,
432
+ 0.031308799743652346,
433
+ 0.03121971130371094,
434
+ 0.03126067161560059,
435
+ 0.031224063873291016,
436
+ 0.031221759796142577,
437
+ 0.03123583984375,
438
+ 0.031263744354248044,
439
+ 0.03132928085327148,
440
+ 0.03136511993408203,
441
+ 0.03130982398986817,
442
+ 0.03128323173522949,
443
+ 0.03138147163391113,
444
+ 0.03256329727172851,
445
+ 0.0315380802154541,
446
+ 0.03126684761047363,
447
+ 0.031351776123046876,
448
+ 0.031340543746948245,
449
+ 0.031442943572998046,
450
+ 0.03129958343505859,
451
+ 0.03134687995910645,
452
+ 0.03141305541992188,
453
+ 0.03139174461364746,
454
+ 0.03133337593078613,
455
+ 0.031356927871704104,
456
+ 0.0311592960357666,
457
+ 0.031313024520874026,
458
+ 0.03136297607421875,
459
+ 0.03155475234985351,
460
+ 0.03135977554321289,
461
+ 0.031410175323486327,
462
+ 0.031297536849975584,
463
+ 0.03140403175354004,
464
+ 0.03164672088623047,
465
+ 0.03158016014099121,
466
+ 0.031441919326782225,
467
+ 0.03142451286315918,
468
+ 0.03139276885986328,
469
+ 0.031437824249267575,
470
+ 0.0314839038848877,
471
+ 0.03139072036743164,
472
+ 0.03134771156311035,
473
+ 0.03135487937927246,
474
+ 0.031336448669433595,
475
+ 0.03139174461364746,
476
+ 0.03136307144165039,
477
+ 0.03140300750732422,
478
+ 0.03140096092224121,
479
+ 0.03138457679748535,
480
+ 0.031433984756469725,
481
+ 0.03143571281433105,
482
+ 0.031265600204467774,
483
+ 0.03135078430175781,
484
+ 0.031508480072021484,
485
+ 0.03157939147949219,
486
+ 0.031373056411743164,
487
+ 0.031290367126464845,
488
+ 0.03129958343505859,
489
+ 0.03126272010803223,
490
+ 0.03142963218688965,
491
+ 0.03121366310119629,
492
+ 0.031301536560058595,
493
+ 0.03140505599975586,
494
+ 0.031226911544799806,
495
+ 0.031200223922729493,
496
+ 0.031204351425170897,
497
+ 0.03125862312316895,
498
+ 0.03127705574035645,
499
+ 0.031307775497436525,
500
+ 0.03132825660705566,
501
+ 0.03139993667602539,
502
+ 0.03129958343505859,
503
+ 0.03133235168457031,
504
+ 0.031232032775878906,
505
+ 0.031296480178833005,
506
+ 0.03126383972167969,
507
+ 0.031196063995361328,
508
+ 0.03154867172241211,
509
+ 0.03141606330871582,
510
+ 0.03137433624267578,
511
+ 0.031205440521240236,
512
+ 0.031250591278076174,
513
+ 0.03121027183532715,
514
+ 0.03121664047241211,
515
+ 0.03125555229187012,
516
+ 0.031162368774414063,
517
+ 0.031236095428466795,
518
+ 0.03131391906738281,
519
+ 0.03135206413269043,
520
+ 0.031340288162231444,
521
+ 0.0313702392578125,
522
+ 0.03138991928100586,
523
+ 0.03132803153991699,
524
+ 0.031247360229492187,
525
+ 0.03133235168457031,
526
+ 0.031197183609008788,
527
+ 0.031325183868408206,
528
+ 0.03130572891235352,
529
+ 0.03127705574035645,
530
+ 0.031308799743652346,
531
+ 0.03127705574035645,
532
+ 0.031220735549926756,
533
+ 0.031302656173706055,
534
+ 0.031346815109252926,
535
+ 0.0313752326965332,
536
+ 0.03158323287963867,
537
+ 0.03134668731689453,
538
+ 0.03129548835754394,
539
+ 0.03143987274169922,
540
+ 0.0312740478515625,
541
+ 0.031430591583251954,
542
+ 0.031322111129760744,
543
+ 0.03137843132019043,
544
+ 0.031437824249267575,
545
+ 0.03128934478759766,
546
+ 0.03131494331359863,
547
+ 0.0313753604888916,
548
+ 0.03129964828491211,
549
+ 0.03131385612487793,
550
+ 0.03138457679748535,
551
+ 0.031287296295166016,
552
+ 0.031422464370727536,
553
+ 0.031325183868408206,
554
+ 0.03135385513305664,
555
+ 0.031198368072509766,
556
+ 0.031358816146850585,
557
+ 0.03139174461364746,
558
+ 0.031476736068725586,
559
+ 0.031337472915649416,
560
+ 0.03129343986511231,
561
+ 0.03132825660705566,
562
+ 0.03129548835754394,
563
+ 0.03139072036743164,
564
+ 0.03125657653808594,
565
+ 0.03133030319213867,
566
+ 0.031285247802734374,
567
+ 0.03133440017700195,
568
+ 0.03160985565185547,
569
+ 0.03133440017700195,
570
+ 0.03136614418029785,
571
+ 0.03136307144165039,
572
+ 0.03127516746520996,
573
+ 0.03143561553955078,
574
+ 0.03126169586181641,
575
+ 0.0313275203704834,
576
+ 0.03133001518249512,
577
+ 0.03125555229187012,
578
+ 0.03126905632019043,
579
+ 0.031284032821655275,
580
+ 0.0312729606628418,
581
+ 0.03139174461364746,
582
+ 0.031441055297851565,
583
+ 0.03129756736755371,
584
+ 0.031143743515014647,
585
+ 0.031213567733764647,
586
+ 0.031263744354248044,
587
+ 0.031143936157226562,
588
+ 0.03125760078430176,
589
+ 0.031321088790893556,
590
+ 0.031165536880493165
591
+ ]
592
+ },
593
+ "throughput": {
594
+ "unit": "tokens/s",
595
+ "value": 31.885171213958348
596
+ },
597
+ "energy": null,
598
+ "efficiency": null
599
+ }
600
+ }