kreas commited on
Commit
725cebb
1 Parent(s): e404188

Upload /gemma-7b/int8_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
gemma-7b/int8_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,194 +2,190 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 4516.745216,
6
  "max_vram": 10504.634368,
7
  "max_reserved": 10011.803648,
8
  "max_allocated": 9921.83552
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.05815051000517913,
13
- "stdev": 0.0009156655037561419,
14
  "values": [
15
- 0.06554188537597656,
16
- 0.05961523056030273,
17
- 0.05897420883178711,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
18
  0.05911040115356445,
19
- 0.06581657409667968,
20
- 0.06116659164428711,
21
- 0.05813759994506836,
22
- 0.05792153549194336,
23
- 0.05808025741577148,
24
- 0.05825126266479492,
25
- 0.05813865661621094,
26
- 0.05799731063842774,
27
- 0.058142719268798826,
28
- 0.05811916732788086,
29
- 0.057935871124267575,
30
- 0.0579420166015625,
31
- 0.05803007888793945,
32
- 0.058019840240478515,
33
- 0.05787855911254883,
34
- 0.05789593505859375,
35
- 0.057791488647460934,
36
- 0.05791027069091797,
37
- 0.0579317741394043,
38
- 0.05810790252685547,
39
- 0.05796352005004883,
40
- 0.057793537139892576,
41
- 0.05801881790161133,
42
- 0.057845760345458984,
43
- 0.05799116897583008,
44
- 0.057839614868164066,
45
- 0.05793791961669922,
46
- 0.05809766387939453,
47
- 0.0579502067565918,
48
- 0.057899009704589846,
49
- 0.05784883117675781,
50
- 0.05790719985961914,
51
- 0.05793382263183594,
52
- 0.05791231918334961,
53
- 0.05802201461791992,
54
- 0.057862144470214844,
55
- 0.05790822219848633,
56
- 0.058000385284423826,
57
- 0.057976993560791015,
58
- 0.05796352005004883,
59
- 0.05788671875,
60
- 0.05782527923583984,
61
- 0.05799321746826172,
62
- 0.05796147155761719,
63
- 0.0578785285949707,
64
- 0.05821440124511719,
65
- 0.057955360412597655,
66
- 0.058014720916748044,
67
- 0.05798400115966797,
68
- 0.05786326217651367,
69
- 0.058047489166259764,
70
- 0.057981952667236325,
71
- 0.057902080535888675,
72
- 0.05842432022094726,
73
- 0.05801062393188477,
74
- 0.05777417755126953,
75
- 0.057995262145996096,
76
- 0.05796454238891602,
77
- 0.05793075180053711,
78
- 0.05812940979003906,
79
- 0.058052608489990234,
80
- 0.05793996810913086,
81
- 0.05842739105224609,
82
- 0.05782527923583984,
83
- 0.05799423980712891,
84
- 0.05795430374145508,
85
- 0.058039295196533204,
86
- 0.057915393829345706,
87
- 0.05803007888793945,
88
- 0.05794918441772461,
89
- 0.05795840072631836,
90
- 0.05792665481567383,
91
- 0.05789593505859375,
92
- 0.05786111831665039,
93
- 0.0579051513671875,
94
- 0.05801369476318359,
95
- 0.057988094329833983,
96
- 0.05773516845703125,
97
- 0.05791641616821289,
98
- 0.05794508743286133,
99
- 0.058033153533935546,
100
- 0.05788467025756836,
101
- 0.05802700805664063,
102
- 0.05804851150512695,
103
- 0.05807308959960938,
104
- 0.05795328140258789,
105
- 0.05804851150512695,
106
- 0.05790719985961914,
107
- 0.05848883056640625,
108
- 0.05825331115722656,
109
- 0.05809766387939453,
110
- 0.058039295196533204,
111
- 0.058180606842041016,
112
- 0.05796147155761719,
113
- 0.058068992614746094,
114
- 0.05791641616821289,
115
- 0.058449920654296876,
116
- 0.05794508743286133,
117
- 0.05796966552734375,
118
- 0.05796147155761719,
119
- 0.05791129684448242,
120
- 0.057845760345458984,
121
- 0.058014720916748044,
122
- 0.058038272857666016,
123
- 0.058028064727783206,
124
- 0.058031105041503904,
125
- 0.058057727813720705,
126
- 0.057929729461669924,
127
- 0.05796352005004883,
128
- 0.05790316772460938,
129
- 0.058003456115722656,
130
- 0.057826305389404295,
131
- 0.05790105438232422,
132
- 0.05791129684448242,
133
- 0.058126335144042966,
134
- 0.05795840072631836,
135
- 0.05795430374145508,
136
- 0.05791129684448242,
137
- 0.05808127975463867,
138
- 0.05797478485107422,
139
- 0.058065921783447265,
140
- 0.05798204803466797,
141
- 0.058071041107177736,
142
- 0.058194942474365234,
143
- 0.05803212738037109,
144
- 0.057957374572753906,
145
- 0.05815193557739258,
146
- 0.05793382263183594,
147
- 0.057883647918701174,
148
- 0.05798912048339844,
149
- 0.06166425704956055,
150
- 0.05828812789916992,
151
- 0.05791455841064453,
152
- 0.057929729461669924,
153
- 0.05821747207641602,
154
- 0.05783244705200195,
155
- 0.05806489562988281,
156
- 0.058017791748046874,
157
- 0.0581396484375,
158
- 0.058031105041503904,
159
- 0.05799731063842774,
160
- 0.05790617752075195,
161
- 0.0581058578491211,
162
- 0.058074111938476565,
163
- 0.05796761703491211,
164
- 0.05783859252929688,
165
- 0.05787443161010742,
166
- 0.05796352005004883,
167
- 0.058074111938476565,
168
- 0.05798400115966797,
169
- 0.05815398406982422,
170
- 0.057793792724609376,
171
- 0.05800147247314453,
172
- 0.057919486999511716,
173
- 0.058019840240478515,
174
- 0.058022911071777344,
175
- 0.05803724670410156,
176
- 0.058120193481445315,
177
- 0.05827174377441406,
178
- 0.05803417587280273,
179
- 0.05795635223388672,
180
- 0.05810073471069336,
181
- 0.058019840240478515,
182
- 0.05797580718994141,
183
- 0.05812736129760742,
184
- 0.05790822219848633,
185
- 0.058484832763671876,
186
- 0.058049537658691405,
187
- 0.05807206344604492
188
  ]
189
  },
190
  "throughput": {
191
  "unit": "tokens/s",
192
- "value": 4402.368955615343
193
  },
194
  "energy": null,
195
  "efficiency": null
@@ -197,22 +193,22 @@
197
  "decode": {
198
  "memory": {
199
  "unit": "MB",
200
- "max_ram": 4516.745216,
201
  "max_vram": 10892.607488,
202
  "max_reserved": 10399.776768,
203
  "max_allocated": 10301.4272
204
  },
205
  "latency": {
206
  "unit": "s",
207
- "mean": 14.593744888305668,
208
  "stdev": 0,
209
  "values": [
210
- 14.593744888305668
211
  ]
212
  },
213
  "throughput": {
214
  "unit": "tokens/s",
215
- "value": 17.47323952499251
216
  },
217
  "energy": null,
218
  "efficiency": null
@@ -221,269 +217,269 @@
221
  "memory": null,
222
  "latency": {
223
  "unit": "s",
224
- "mean": 0.05723037211100262,
225
- "stdev": 0.00016024681144480654,
226
  "values": [
227
- 0.05737472152709961,
228
- 0.05726822280883789,
229
- 0.057237503051757815,
230
- 0.05715456008911133,
231
- 0.057063423156738284,
232
- 0.05724777603149414,
233
- 0.057419742584228516,
234
- 0.05731737518310547,
235
- 0.05731942367553711,
236
- 0.05711769485473633,
237
- 0.05702963256835938,
238
- 0.05723955154418945,
239
- 0.05710745620727539,
240
- 0.057261215209960935,
241
- 0.05724348831176758,
242
- 0.05728972625732422,
243
- 0.057221118927001956,
244
- 0.05722748947143555,
245
- 0.05717891311645508,
246
- 0.05722521591186523,
247
- 0.057224193572998044,
248
- 0.05724467086791992,
249
- 0.057296897888183596,
250
- 0.05753241729736328,
251
- 0.05732556915283203,
252
- 0.05735833740234375,
253
- 0.05718220901489258,
254
- 0.05716377639770508,
255
- 0.05720064163208008,
256
- 0.0572938232421875,
257
- 0.057267200469970705,
258
- 0.05755596923828125,
259
- 0.057181182861328124,
260
- 0.057237503051757815,
261
- 0.05711974334716797,
262
- 0.057198783874511716,
263
- 0.057149246215820314,
264
- 0.057191551208496096,
265
- 0.05734899139404297,
266
- 0.057437183380126954,
267
- 0.05720883178710937,
268
- 0.05704294586181641,
269
- 0.05715763092041016,
270
- 0.057090049743652345,
271
- 0.05722009658813477,
272
- 0.057176223754882814,
273
- 0.05722505569458008,
274
- 0.05720678329467774,
275
- 0.05728460693359375,
276
- 0.05716070556640625,
277
- 0.05718937683105469,
278
- 0.057312255859375,
279
- 0.05722521591186523,
280
- 0.05715363311767578,
281
- 0.057300895690917966,
282
- 0.05716793441772461,
283
- 0.057154495239257815,
284
- 0.05732966232299805,
285
- 0.05768396759033203,
286
- 0.05711769485473633,
287
- 0.057355262756347655,
288
- 0.0572149772644043,
289
- 0.057412609100341794,
290
- 0.057070785522460935,
291
- 0.057149246215820314,
292
- 0.0571629753112793,
293
- 0.057433887481689455,
294
- 0.05709849548339844,
295
- 0.05711539077758789,
296
- 0.057062400817871096,
297
- 0.0570511360168457,
298
- 0.05710438537597656,
299
- 0.05699993515014649,
300
- 0.057012256622314454,
301
- 0.056898529052734376,
302
- 0.05700812911987305,
303
- 0.05698252868652344,
304
- 0.057057281494140626,
305
- 0.056856575012207033,
306
- 0.05696921539306641,
307
- 0.057047039031982424,
308
- 0.057027584075927736,
309
- 0.05686374282836914,
310
- 0.0569989128112793,
311
- 0.05702656173706055,
312
- 0.05708902359008789,
313
- 0.057099262237548826,
314
- 0.057197566986083984,
315
- 0.0570695686340332,
316
- 0.05701023864746094,
317
- 0.056979393005371096,
318
- 0.05701631927490235,
319
- 0.05689139175415039,
320
- 0.05724262237548828,
321
- 0.05699686431884766,
322
- 0.057063423156738284,
323
- 0.05707059097290039,
324
- 0.056992767333984375,
325
- 0.05706137466430664,
326
- 0.057241630554199216,
327
- 0.057141216278076175,
328
- 0.057306110382080076,
329
- 0.05710233688354492,
330
- 0.05705215835571289,
331
- 0.0570777587890625,
332
- 0.057003009796142576,
333
- 0.05712793731689453,
334
- 0.05698355102539063,
335
- 0.05704294586181641,
336
- 0.057106433868408205,
337
- 0.0571146240234375,
338
- 0.05730112075805664,
339
- 0.05706124877929687,
340
- 0.05709107208251953,
341
- 0.057262081146240235,
342
- 0.057188350677490236,
343
- 0.05717196655273438,
344
- 0.057164798736572264,
345
- 0.05718425750732422,
346
- 0.05717196655273438,
347
- 0.05717094421386719,
348
- 0.05815628814697266,
349
- 0.05723827362060547,
350
- 0.0572119026184082,
351
- 0.057106433868408205,
352
- 0.05715865707397461,
353
- 0.05717708969116211,
354
- 0.05728768157958984,
355
  0.05785804748535156,
356
- 0.0572334098815918,
357
- 0.057215999603271485,
358
- 0.057100318908691404,
359
- 0.05727433776855469,
360
- 0.057265151977539064,
361
- 0.05711155319213867,
362
- 0.05745459365844727,
363
- 0.056994815826416016,
364
- 0.05756620788574219,
365
- 0.0572149772644043,
366
- 0.057250816345214846,
367
- 0.057210880279541014,
368
- 0.05726009750366211,
369
- 0.057202625274658206,
370
- 0.05732352066040039,
371
- 0.057312255859375,
372
- 0.057204734802246096,
373
- 0.05712793731689453,
374
- 0.057148414611816405,
375
- 0.0571146240234375,
376
- 0.05727231979370117,
377
- 0.057219070434570314,
378
- 0.05714233779907227,
379
- 0.05731731033325195,
380
- 0.05724364852905273,
381
- 0.05724671936035156,
382
- 0.05741670227050781,
383
- 0.057278465270996094,
384
- 0.05720678329467774,
385
- 0.0571514892578125,
386
- 0.05731020736694336,
387
- 0.05716377639770508,
388
- 0.05720064163208008,
389
- 0.0571115837097168,
390
- 0.05725692749023437,
391
- 0.057475070953369144,
392
- 0.05729587173461914,
393
- 0.057294849395751954,
394
- 0.057175041198730465,
395
- 0.05732966232299805,
396
- 0.05735833740234375,
397
- 0.057280513763427736,
398
- 0.05729494476318359,
399
- 0.05765008163452148,
400
- 0.05732352066040039,
401
- 0.05724979019165039,
402
- 0.05728160095214844,
403
- 0.05730604934692383,
404
- 0.05741567993164062,
405
- 0.057294849395751954,
406
- 0.05729587173461914,
407
- 0.05714022445678711,
408
- 0.05719468688964844,
409
- 0.05711750411987305,
410
- 0.0572334098815918,
411
- 0.05728972625732422,
412
- 0.05724169540405273,
413
- 0.05715548706054688,
414
- 0.05732761764526367,
415
- 0.05725593566894531,
416
- 0.05735935974121094,
417
- 0.0572303352355957,
418
- 0.05725094223022461,
419
- 0.05714419174194336,
420
- 0.05708390426635742,
421
- 0.05719039916992188,
422
- 0.05709625625610352,
423
- 0.057156543731689456,
424
- 0.05734502410888672,
425
- 0.05717708969116211,
426
- 0.05778124618530273,
427
- 0.05730918502807617,
428
- 0.05727641677856445,
429
- 0.05717708969116211,
430
- 0.05722009658813477,
431
- 0.05736345672607422,
432
- 0.05752934265136719,
433
- 0.05729792022705078,
434
- 0.05779372787475586,
435
- 0.057334590911865234,
436
- 0.05739519882202149,
437
- 0.05728255844116211,
438
- 0.05730099105834961,
439
- 0.05746585464477539,
440
- 0.05735647964477539,
441
- 0.05734380722045898,
442
- 0.057475070953369144,
443
- 0.05741158294677735,
444
- 0.05747097778320313,
445
- 0.05726003265380859,
446
- 0.05729894256591797,
447
- 0.05731430435180664,
448
- 0.057299968719482425,
449
- 0.05720985412597656,
450
- 0.0573287353515625,
451
- 0.05733980941772461,
452
- 0.057414657592773435,
453
- 0.05729177474975586,
454
- 0.057436351776123044,
455
- 0.057404224395751956,
456
- 0.05741670227050781,
457
- 0.05724364852905273,
458
- 0.057204734802246096,
459
- 0.05714432144165039,
460
- 0.057271327972412106,
461
- 0.057588703155517576,
462
- 0.057188350677490236,
463
- 0.05717299270629883,
464
- 0.05738086318969727,
465
- 0.0573573112487793,
466
- 0.057336830139160154,
467
- 0.05709823989868164,
468
- 0.05724467086791992,
469
- 0.05758771133422851,
470
- 0.05719039916992188,
471
- 0.05720166397094727,
472
- 0.05723852920532226,
473
- 0.057197566986083984,
474
- 0.0570695686340332,
475
- 0.05711974334716797,
476
- 0.057232383728027345,
477
- 0.05723955154418945,
478
- 0.05732863998413086,
479
- 0.0572119026184082,
480
- 0.05715660858154297,
481
- 0.057215999603271485
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
482
  ]
483
  },
484
  "throughput": {
485
  "unit": "tokens/s",
486
- "value": 17.47323952499251
487
  },
488
  "energy": null,
489
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 4575.711232,
6
  "max_vram": 10504.634368,
7
  "max_reserved": 10011.803648,
8
  "max_allocated": 9921.83552
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.05921143521641836,
13
+ "stdev": 0.000792575270597166,
14
  "values": [
15
+ 0.06676448059082031,
16
+ 0.06044364929199219,
17
+ 0.06004326248168945,
18
+ 0.06046310424804688,
19
+ 0.061454334259033204,
20
+ 0.06348697662353515,
21
+ 0.06285107040405273,
22
+ 0.05910425567626953,
23
+ 0.059529216766357425,
24
+ 0.058993663787841794,
25
+ 0.05899161529541016,
26
+ 0.058992641448974606,
27
+ 0.05882572937011719,
28
+ 0.05901311874389648,
29
+ 0.05894041442871094,
30
+ 0.05910323333740235,
31
+ 0.059481086730957033,
32
+ 0.059025409698486325,
33
+ 0.05894041442871094,
34
+ 0.05875302505493164,
35
+ 0.058946559906005856,
36
+ 0.058992641448974606,
37
+ 0.05883084869384766,
38
+ 0.058790912628173826,
39
+ 0.05885235214233398,
40
+ 0.0587325439453125,
41
+ 0.05886259078979492,
42
+ 0.05886054229736328,
43
+ 0.05898342514038086,
44
+ 0.059101184844970706,
45
+ 0.059009025573730466,
46
+ 0.05897727966308594,
47
+ 0.05902131271362305,
48
+ 0.05902336120605469,
49
+ 0.05903769683837891,
50
+ 0.05900697708129883,
51
+ 0.05892403030395508,
52
+ 0.05884723281860352,
53
+ 0.0589219856262207,
54
+ 0.058893310546875,
55
+ 0.05906227111816406,
56
+ 0.058967041015625,
57
+ 0.059650047302246094,
58
+ 0.05895065689086914,
59
+ 0.05893017578125,
60
+ 0.05893529510498047,
61
+ 0.05890867233276367,
62
+ 0.05906022262573242,
63
+ 0.05902950286865234,
64
+ 0.05907660675048828,
65
+ 0.0593438720703125,
66
+ 0.058823680877685545,
67
+ 0.05882265472412109,
68
+ 0.058834945678710934,
69
+ 0.05902950286865234,
70
+ 0.05893017578125,
71
+ 0.05893427276611328,
72
+ 0.05901004791259765,
73
+ 0.05907046508789063,
74
+ 0.059068416595458986,
75
+ 0.05898956680297852,
76
+ 0.05886057662963867,
77
+ 0.058897407531738284,
78
+ 0.058889217376708984,
79
+ 0.05896499252319336,
80
+ 0.05895577621459961,
81
+ 0.0591278076171875,
82
+ 0.05889023971557617,
83
+ 0.05895884704589844,
84
+ 0.058931198120117184,
85
+ 0.05883699035644531,
86
+ 0.05898758316040039,
87
+ 0.05896806335449219,
88
+ 0.0588144645690918,
89
+ 0.058859519958496094,
90
+ 0.05893529510498047,
91
+ 0.059394046783447264,
92
+ 0.05888409423828125,
93
+ 0.05885955047607422,
94
+ 0.05888000106811524,
95
+ 0.05881753540039063,
96
+ 0.058875904083251954,
97
+ 0.05895577621459961,
98
+ 0.05883084869384766,
99
+ 0.05939302444458008,
100
+ 0.05904793548583984,
101
+ 0.058946559906005856,
102
+ 0.05897225570678711,
103
+ 0.058875904083251954,
104
+ 0.05888307189941406,
105
+ 0.05883903884887695,
106
+ 0.05902643203735351,
107
+ 0.05912063980102539,
108
+ 0.059084800720214846,
109
  0.05911040115356445,
110
+ 0.059202560424804686,
111
+ 0.059167743682861325,
112
+ 0.059079681396484375,
113
+ 0.0592097282409668,
114
+ 0.059000831604003906,
115
+ 0.05905203247070313,
116
+ 0.05910528182983398,
117
+ 0.05903769683837891,
118
+ 0.058995712280273435,
119
+ 0.059224063873291016,
120
+ 0.05920665740966797,
121
+ 0.05917695999145508,
122
+ 0.05895167922973633,
123
+ 0.05926604843139648,
124
+ 0.05922918319702149,
125
+ 0.059701248168945314,
126
+ 0.059235328674316405,
127
+ 0.05928979110717773,
128
+ 0.05924863815307617,
129
+ 0.059238399505615234,
130
+ 0.05924256134033203,
131
+ 0.059227134704589846,
132
+ 0.05909503936767578,
133
+ 0.05974528121948242,
134
+ 0.059104351043701174,
135
+ 0.05924761581420898,
136
+ 0.05929676818847656,
137
+ 0.059256832122802736,
138
+ 0.0592803840637207,
139
+ 0.05923231887817383,
140
+ 0.0592803840637207,
141
+ 0.0592803840637207,
142
+ 0.059324417114257816,
143
+ 0.05926092910766602,
144
+ 0.05919539260864258,
145
+ 0.05927833557128906,
146
+ 0.05923737716674805,
147
+ 0.05921484756469726,
148
+ 0.05929369735717773,
149
+ 0.05917900848388672,
150
+ 0.05922304153442383,
151
+ 0.05935308837890625,
152
+ 0.05933977508544922,
153
+ 0.05925888061523438,
154
+ 0.05911040115356445,
155
+ 0.059015167236328124,
156
+ 0.05928857421875,
157
+ 0.05907763290405273,
158
+ 0.059302913665771485,
159
+ 0.0597628173828125,
160
+ 0.059238399505615234,
161
+ 0.05927231979370117,
162
+ 0.059262977600097654,
163
+ 0.05916262435913086,
164
+ 0.05918003082275391,
165
+ 0.059232257843017576,
166
+ 0.05911859130859375,
167
+ 0.059646976470947265,
168
+ 0.05907660675048828,
169
+ 0.059014144897460936,
170
+ 0.05913087844848633,
171
+ 0.059150337219238285,
172
+ 0.05915852737426758,
173
+ 0.059028480529785154,
174
+ 0.058916862487792966,
175
+ 0.0590552978515625,
176
+ 0.05906739044189453,
177
+ 0.059084800720214846,
178
+ 0.059041793823242185,
179
+ 0.059066368103027345,
180
+ 0.05911040115356445,
181
+ 0.05908889770507812,
182
+ 0.05897318267822266,
183
+ 0.059109375
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
184
  ]
185
  },
186
  "throughput": {
187
  "unit": "tokens/s",
188
+ "value": 4323.489188605504
189
  },
190
  "energy": null,
191
  "efficiency": null
 
193
  "decode": {
194
  "memory": {
195
  "unit": "MB",
196
+ "max_ram": 4575.711232,
197
  "max_vram": 10892.607488,
198
  "max_reserved": 10399.776768,
199
  "max_allocated": 10301.4272
200
  },
201
  "latency": {
202
  "unit": "s",
203
+ "mean": 14.784453826904297,
204
  "stdev": 0,
205
  "values": [
206
+ 14.784453826904297
207
  ]
208
  },
209
  "throughput": {
210
  "unit": "tokens/s",
211
+ "value": 17.247847163346595
212
  },
213
  "energy": null,
214
  "efficiency": null
 
217
  "memory": null,
218
  "latency": {
219
  "unit": "s",
220
+ "mean": 0.05797825030158548,
221
+ "stdev": 0.00013128443797395044,
222
  "values": [
223
+ 0.057981952667236325,
224
+ 0.05801062393188477,
225
+ 0.05778227233886719,
226
+ 0.05785295867919922,
227
+ 0.05795939254760742,
228
+ 0.057958560943603514,
229
+ 0.057956192016601564,
230
+ 0.05793894577026367,
231
+ 0.05814076614379883,
232
+ 0.05787535858154297,
233
+ 0.057778175354003904,
234
+ 0.05801369476318359,
235
+ 0.05787347030639649,
236
+ 0.057945022583007814,
237
+ 0.058106880187988284,
238
+ 0.05803113555908203,
239
+ 0.057815006256103516,
240
+ 0.05835673522949219,
241
+ 0.057842689514160155,
242
+ 0.05794815826416016,
243
+ 0.05773635101318359,
244
+ 0.057915489196777345,
245
+ 0.057910110473632814,
246
+ 0.05792655944824219,
247
+ 0.058001407623291014,
248
+ 0.058033153533935546,
249
+ 0.057907424926757815,
250
+ 0.05798691177368164,
251
+ 0.05789996719360352,
252
+ 0.05795840072631836,
253
+ 0.057821182250976565,
254
+ 0.05800755310058594,
255
+ 0.05804544067382812,
256
+ 0.0579788818359375,
257
+ 0.05778636932373047,
258
+ 0.05796659088134765,
259
+ 0.057887935638427736,
260
+ 0.058040126800537106,
261
+ 0.05792563247680664,
262
+ 0.05799939346313476,
263
+ 0.05793788909912109,
264
+ 0.05806284713745117,
265
+ 0.05796659088134765,
266
+ 0.058482688903808595,
267
+ 0.05788684844970703,
268
+ 0.05790201568603515,
269
+ 0.057988094329833983,
270
+ 0.05796550369262695,
271
+ 0.057862144470214844,
272
+ 0.05790924835205078,
273
+ 0.0578600959777832,
274
+ 0.058102783203125,
275
+ 0.057935871124267575,
276
+ 0.057900032043457034,
277
+ 0.05788787078857422,
278
+ 0.057965438842773435,
279
+ 0.05789388656616211,
280
+ 0.05803212738037109,
281
+ 0.057809921264648435,
282
+ 0.057970687866210936,
283
+ 0.05785200119018555,
284
+ 0.05802998352050781,
285
+ 0.05799731063842774,
286
+ 0.058039295196533204,
287
+ 0.05797785568237305,
288
+ 0.058006526947021485,
289
+ 0.05780070495605469,
290
+ 0.057970687866210936,
291
+ 0.05792051315307617,
292
+ 0.057902080535888675,
293
+ 0.057963680267333985,
294
+ 0.057864192962646485,
295
+ 0.0578138542175293,
296
+ 0.05790822219848633,
297
+ 0.05795532989501953,
298
+ 0.057902080535888675,
299
+ 0.057880577087402345,
300
+ 0.05793715286254883,
301
+ 0.05832495880126953,
302
+ 0.05790595245361328,
303
+ 0.058001407623291014,
304
+ 0.05785804748535156,
305
+ 0.05791644668579102,
306
+ 0.058038238525390626,
307
+ 0.057899009704589846,
308
+ 0.05790924835205078,
309
+ 0.058234878540039066,
310
+ 0.05787136077880859,
311
+ 0.05797580718994141,
312
+ 0.057957504272460936,
313
+ 0.058049407958984375,
314
+ 0.05816012954711914,
315
+ 0.05804870223999024,
316
+ 0.058053440093994144,
317
+ 0.0579400634765625,
318
+ 0.058133438110351564,
319
+ 0.058049503326416015,
320
+ 0.05799219131469727,
321
+ 0.057975902557373046,
322
+ 0.05806070327758789,
323
+ 0.05809971237182617,
324
+ 0.057882625579833986,
325
+ 0.05795849609375,
326
+ 0.05792451095581055,
327
+ 0.057896961212158204,
328
+ 0.05785497665405273,
329
+ 0.057821182250976565,
330
+ 0.05796579360961914,
331
+ 0.057914142608642576,
332
+ 0.05799935913085937,
333
+ 0.057952255249023435,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
334
  0.05785804748535156,
335
+ 0.05787340927124023,
336
+ 0.058022911071777344,
337
+ 0.05783244705200195,
338
+ 0.05785497665405273,
339
+ 0.05785804748535156,
340
+ 0.05777305603027344,
341
+ 0.0578416633605957,
342
+ 0.0579535026550293,
343
+ 0.0578383674621582,
344
+ 0.05821747207641602,
345
+ 0.05771878433227539,
346
+ 0.05779455947875976,
347
+ 0.05780073547363281,
348
+ 0.05784880065917969,
349
+ 0.05769113540649414,
350
+ 0.0577935676574707,
351
+ 0.057997280120849606,
352
+ 0.05788159942626953,
353
+ 0.05786111831665039,
354
+ 0.05796044921875,
355
+ 0.05796659088134765,
356
+ 0.05797683334350586,
357
+ 0.05802700805664063,
358
+ 0.05804873657226563,
359
+ 0.05790915298461914,
360
+ 0.058027904510498045,
361
+ 0.05800960159301758,
362
+ 0.0578600959777832,
363
+ 0.057853950500488284,
364
+ 0.05801881790161133,
365
+ 0.05797273635864258,
366
+ 0.05789286422729492,
367
+ 0.057896961212158204,
368
+ 0.058031105041503904,
369
+ 0.05790617752075195,
370
+ 0.05802700805664063,
371
+ 0.058475681304931644,
372
+ 0.05806166458129883,
373
+ 0.05790924835205078,
374
+ 0.057893951416015624,
375
+ 0.0579543342590332,
376
+ 0.05795830535888672,
377
+ 0.05807820892333984,
378
+ 0.0576993293762207,
379
+ 0.058327041625976565,
380
+ 0.057957374572753906,
381
+ 0.058060798645019535,
382
+ 0.05800348663330078,
383
+ 0.05794198226928711,
384
+ 0.05783859252929688,
385
+ 0.05785497665405273,
386
+ 0.05787750244140625,
387
+ 0.05795430374145508,
388
+ 0.057979969024658205,
389
+ 0.05779142379760742,
390
+ 0.0580055046081543,
391
+ 0.0578682861328125,
392
+ 0.05795942306518555,
393
+ 0.05786624145507813,
394
+ 0.057965568542480465,
395
+ 0.05790822219848633,
396
+ 0.05798835372924805,
397
+ 0.05797881698608399,
398
+ 0.05789168167114258,
399
+ 0.05796860885620117,
400
+ 0.058003456115722656,
401
+ 0.05795635223388672,
402
+ 0.057965568542480465,
403
+ 0.05784678268432617,
404
+ 0.0580055046081543,
405
+ 0.058215614318847655,
406
+ 0.057968448638916016,
407
+ 0.05778227233886719,
408
+ 0.057998336791992185,
409
+ 0.057783294677734375,
410
+ 0.058041343688964846,
411
+ 0.05801062393188477,
412
+ 0.05808230209350586,
413
+ 0.05796873474121094,
414
+ 0.05840681457519531,
415
+ 0.05803417587280273,
416
+ 0.05817753601074219,
417
+ 0.05808025741577148,
418
+ 0.058019840240478515,
419
+ 0.05805372619628906,
420
+ 0.05796239852905274,
421
+ 0.0580208625793457,
422
+ 0.057912353515625,
423
+ 0.05808022308349609,
424
+ 0.05798912048339844,
425
+ 0.05793791961669922,
426
+ 0.05787859344482422,
427
+ 0.05798393630981445,
428
+ 0.0580208625793457,
429
+ 0.05779763031005859,
430
+ 0.05786111831665039,
431
+ 0.05799321746826172,
432
+ 0.05794713592529297,
433
+ 0.05788774490356445,
434
+ 0.057747455596923826,
435
+ 0.057990238189697264,
436
+ 0.05803203201293945,
437
+ 0.058036224365234375,
438
+ 0.05795942306518555,
439
+ 0.05806284713745117,
440
+ 0.05828403091430664,
441
+ 0.058155200958251954,
442
+ 0.058161983489990236,
443
+ 0.05816524887084961,
444
+ 0.058065921783447265,
445
+ 0.05815500640869141,
446
+ 0.05827276611328125,
447
+ 0.05809664154052734,
448
+ 0.05852691268920898,
449
+ 0.05812211227416992,
450
+ 0.057974720001220705,
451
+ 0.058176513671875,
452
+ 0.05809686279296875,
453
+ 0.05809756851196289,
454
+ 0.058137470245361325,
455
+ 0.058068992614746094,
456
+ 0.058017951965332035,
457
+ 0.05806883239746094,
458
+ 0.058014720916748044,
459
+ 0.058103809356689455,
460
+ 0.0579420166015625,
461
+ 0.05811404800415039,
462
+ 0.058038272857666016,
463
+ 0.05810892868041992,
464
+ 0.05799945449829102,
465
+ 0.05804636764526367,
466
+ 0.057892097473144534,
467
+ 0.05815679931640625,
468
+ 0.05814374542236328,
469
+ 0.05808332824707031,
470
+ 0.05796454238891602,
471
+ 0.058089630126953125,
472
+ 0.05783433532714844,
473
+ 0.05796265411376953,
474
+ 0.05796028900146484,
475
+ 0.05845711898803711,
476
+ 0.05792252731323242,
477
+ 0.05818185424804687
478
  ]
479
  },
480
  "throughput": {
481
  "unit": "tokens/s",
482
+ "value": 17.247847163346595
483
  },
484
  "energy": null,
485
  "efficiency": null