kreas commited on
Commit
b1f79b6
1 Parent(s): 095f82c

Upload /gemma-2b/fp4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
gemma-2b/fp4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,397 +2,398 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 1076.178944,
6
- "max_vram": 2799.69792,
7
  "max_reserved": 2709.520384,
8
  "max_allocated": 2546.903552
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.02660646936741283,
13
- "stdev": 0.00075950518726705,
14
  "values": [
15
- 0.02964339256286621,
16
- 0.02732646369934082,
17
- 0.027035648345947266,
18
- 0.027053056716918947,
19
- 0.02699776077270508,
20
- 0.027356224060058595,
21
- 0.027024383544921874,
22
- 0.026917888641357423,
23
- 0.026992639541625976,
24
- 0.027035648345947266,
25
- 0.02693836784362793,
26
- 0.027001855850219726,
27
- 0.02891366386413574,
28
- 0.0293570556640625,
29
- 0.027649023056030272,
30
- 0.02635264015197754,
31
- 0.026332160949707032,
32
- 0.026366975784301756,
33
- 0.02630451202392578,
34
- 0.02630348777770996,
35
- 0.026335231781005858,
36
- 0.026402816772460938,
37
- 0.02634547233581543,
38
- 0.026808319091796876,
39
- 0.0263372802734375,
40
- 0.026322111129760743,
41
- 0.02631475257873535,
42
- 0.02631270408630371,
43
- 0.026376192092895507,
44
- 0.026385408401489258,
45
- 0.026442975997924806,
46
- 0.026445823669433592,
47
- 0.026450944900512696,
48
- 0.026420223236083985,
49
- 0.0263372802734375,
50
- 0.0263372802734375,
51
- 0.02637926483154297,
52
- 0.026359807968139647,
53
- 0.02634854316711426,
54
- 0.02636185646057129,
55
- 0.02634752082824707,
56
- 0.026395647048950196,
57
- 0.026364927291870118,
58
- 0.02651545524597168,
59
- 0.026527936935424806,
60
- 0.026528959274291993,
61
- 0.026409984588623047,
62
- 0.02632192039489746,
63
  0.026467327117919923,
 
 
 
 
 
 
 
 
64
  0.026468351364135743,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
65
  0.02652876853942871,
66
- 0.026445823669433592,
67
- 0.026409183502197266,
68
- 0.026422271728515623,
69
- 0.026487808227539062,
70
- 0.02634444808959961,
71
- 0.026351615905761717,
72
- 0.026380287170410157,
73
- 0.026411008834838868,
74
- 0.026492927551269533,
75
- 0.02631782341003418,
76
- 0.02632908821105957,
77
- 0.02636092758178711,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
78
  0.02649497604370117,
79
- 0.026357887268066406,
80
- 0.026369024276733398,
81
- 0.02636595153808594,
82
- 0.026399744033813476,
83
- 0.02633420753479004,
84
- 0.026459135055541993,
85
- 0.02638643264770508,
86
- 0.026426368713378907,
87
- 0.02635673522949219,
88
- 0.02633830451965332,
89
- 0.026351615905761717,
90
- 0.026376192092895507,
91
- 0.026335231781005858,
92
- 0.026391551971435546,
93
- 0.026382335662841795,
94
- 0.02635366439819336,
95
- 0.026374271392822266,
96
- 0.0267775993347168,
97
- 0.026364927291870118,
98
- 0.026395647048950196,
99
- 0.02633545684814453,
100
- 0.02634649658203125,
101
- 0.026399744033813476,
102
- 0.02636595153808594,
103
- 0.026384384155273437,
104
- 0.026405887603759767,
105
- 0.026426464080810546,
106
- 0.02632089614868164,
107
- 0.026351615905761717,
108
- 0.02632294464111328,
109
- 0.026241024017333983,
110
- 0.02634137535095215,
111
- 0.02635673522949219,
112
- 0.026448896408081055,
113
- 0.026383359909057616,
114
- 0.02675814437866211,
115
- 0.026269760131835938,
116
- 0.02633113670349121,
117
- 0.026265600204467773,
118
- 0.02632601547241211,
119
- 0.02627993583679199,
120
  0.026430463790893553,
121
- 0.026391551971435546,
122
- 0.026290176391601562,
123
- 0.026416128158569335,
124
- 0.026315776824951172,
125
- 0.02633932876586914,
126
- 0.02633113670349121,
127
- 0.026300575256347655,
128
- 0.02630860710144043,
129
- 0.0263505916595459,
130
- 0.02630860710144043,
131
- 0.026281984329223632,
132
- 0.02635366439819336,
133
- 0.02635264015197754,
134
- 0.02631782341003418,
135
- 0.026332160949707032,
136
- 0.02631987190246582,
137
- 0.02634649658203125,
138
- 0.026384384155273437,
139
- 0.026392576217651367,
140
- 0.02633420753479004,
141
- 0.02634239959716797,
142
- 0.026383359909057616,
143
- 0.026476543426513673,
144
- 0.026420255661010743,
145
- 0.02635264015197754,
146
- 0.026376192092895507,
147
- 0.02634854316711426,
148
- 0.026359872817993166,
149
- 0.026365983963012696,
150
- 0.026434560775756837,
151
- 0.026333408355712892,
152
- 0.02633011245727539,
153
- 0.02630451202392578,
154
- 0.02630348777770996,
155
- 0.02632601547241211,
156
- 0.02636185646057129,
157
- 0.0263372802734375,
158
- 0.026393600463867187,
159
- 0.029198335647583007,
160
- 0.029837312698364257,
161
- 0.02999603271484375,
162
- 0.02976972770690918,
163
- 0.02944000053405762,
164
- 0.02949734306335449,
165
- 0.029484031677246093,
166
- 0.029501440048217774,
167
- 0.02923520088195801,
168
- 0.029493247985839844,
169
- 0.029457408905029295,
170
- 0.029473791122436522,
171
- 0.027715583801269532,
172
- 0.027707391738891602,
173
- 0.027595775604248047,
174
- 0.028619775772094725,
175
- 0.02795724868774414,
176
- 0.029019136428833008,
177
- 0.02812928009033203,
178
- 0.02725584030151367,
179
  0.026432512283325195,
180
- 0.02633830451965332,
181
- 0.026459135055541993,
182
- 0.026368000030517577,
183
- 0.026391551971435546,
184
- 0.026435583114624024,
185
- 0.026411008834838868,
186
- 0.02632601547241211,
187
- 0.026390560150146486,
188
- 0.026373119354248048,
189
- 0.026804224014282226,
190
- 0.026435583114624024,
191
- 0.02633932876586914,
192
- 0.02634035110473633,
193
- 0.026380287170410157,
194
- 0.02635775947570801,
195
- 0.026471424102783202,
196
- 0.02634444808959961,
197
- 0.026437631607055666,
198
- 0.02627993583679199,
199
- 0.02635264015197754,
200
- 0.02632806396484375,
201
- 0.026424480438232423,
202
- 0.02633932876586914,
203
- 0.026360063552856444,
204
- 0.026332160949707032,
205
- 0.02635264015197754,
206
- 0.02632192039489746,
207
- 0.026298368453979492,
208
- 0.02629734420776367,
209
- 0.02633625602722168,
210
- 0.026286079406738282,
211
- 0.02634547233581543,
212
- 0.026385408401489258,
213
- 0.026416128158569335,
214
- 0.02634547233581543,
215
- 0.026383359909057616,
216
- 0.026369024276733398,
217
- 0.026452192306518553,
218
- 0.02631679916381836,
219
- 0.02633932876586914,
220
- 0.02631987190246582,
221
- 0.026248191833496092,
222
- 0.026265600204467773,
223
- 0.026388479232788087,
224
- 0.02633011245727539,
225
- 0.02633113670349121,
226
- 0.026259456634521484,
227
- 0.026239999771118162,
228
- 0.026310655593872072,
229
- 0.02633113670349121,
230
- 0.02634364891052246,
231
- 0.02634649658203125,
232
- 0.02630268859863281,
233
- 0.02626563262939453,
234
  0.026474496841430665,
235
- 0.026381311416625978,
236
- 0.02636390495300293,
237
- 0.02631372833251953,
238
- 0.026302463531494142,
239
- 0.02632192039489746,
240
- 0.02633420753479004,
241
- 0.02637414360046387,
242
- 0.02631679916381836,
243
- 0.026588319778442383,
244
- 0.026292224884033204,
245
- 0.026225664138793944,
246
- 0.02632294464111328,
247
- 0.026869855880737304,
248
- 0.026265600204467773,
249
- 0.02635264015197754,
250
- 0.026393600463867187,
251
- 0.026390527725219725,
252
- 0.026390527725219725,
253
- 0.026359807968139647,
254
- 0.026366975784301756,
255
- 0.026454015731811522,
256
- 0.026432512283325195,
257
- 0.02637004852294922,
258
- 0.02635468864440918,
259
- 0.02632908821105957,
260
- 0.02635468864440918,
261
- 0.026416223526000978,
262
- 0.02634137535095215,
263
- 0.02634752082824707,
264
- 0.02636390495300293,
265
- 0.026793983459472655,
266
- 0.02630143928527832,
267
- 0.026433536529541016,
268
- 0.026295295715332033,
269
- 0.02633420753479004,
270
- 0.02637926483154297,
271
- 0.02628505516052246,
272
- 0.026403839111328126,
273
- 0.02632908821105957,
274
- 0.026307584762573243,
275
- 0.02633625602722168,
276
- 0.026327039718627928,
277
- 0.026299392700195313,
278
- 0.026326080322265626,
279
- 0.026392576217651367,
280
- 0.02634239959716797,
281
- 0.026310655593872072,
282
- 0.02636595153808594,
283
- 0.02628505516052246,
284
- 0.02631475257873535,
285
- 0.02631078338623047,
286
- 0.02630143928527832,
287
- 0.026327039718627928,
288
- 0.026262527465820314,
289
- 0.026295295715332033,
290
- 0.026375167846679686,
291
  0.02651852798461914,
292
- 0.026292224884033204,
293
- 0.026417152404785156,
294
- 0.02636185646057129,
295
- 0.026355712890625,
296
- 0.026399744033813476,
297
- 0.026445823669433592,
298
- 0.026360832214355468,
299
- 0.026632192611694337,
300
- 0.02637824058532715,
301
- 0.026390527725219725,
302
- 0.026295295715332033,
303
- 0.026433536529541016,
304
- 0.026306560516357422,
305
- 0.02633113670349121,
306
- 0.02635673522949219,
307
- 0.026332160949707032,
308
- 0.026404863357543946,
 
 
 
 
 
 
 
309
  0.026431488037109374,
310
- 0.02636595153808594,
311
- 0.02634444808959961,
312
- 0.02630143928527832,
313
- 0.026366975784301756,
314
- 0.02633830451965332,
315
- 0.026416128158569335,
316
- 0.026389503479003908,
317
- 0.026368000030517577,
318
- 0.026397695541381837,
319
- 0.02651955223083496,
320
- 0.026353696823120117,
321
- 0.026414079666137694,
322
- 0.026222688674926758,
323
- 0.026404863357543946,
324
- 0.02656358337402344,
325
- 0.02618060874938965,
326
- 0.026258432388305664,
327
- 0.029115392684936525,
328
- 0.03143475151062012,
329
- 0.0295280647277832,
330
- 0.029495296478271486,
331
- 0.02746675109863281,
332
- 0.027038719177246092,
333
- 0.02631987190246582,
334
- 0.02630348777770996,
335
- 0.02631475257873535,
336
- 0.026366975784301756,
337
- 0.026454015731811522,
338
- 0.02627276802062988,
339
- 0.02631372833251953,
340
- 0.026298368453979492,
341
- 0.02671001625061035,
342
- 0.02631167984008789,
343
- 0.026421247482299806,
344
- 0.026243072509765625,
345
- 0.0263372802734375,
346
- 0.026422271728515623,
347
- 0.027069440841674806,
348
- 0.02754969596862793,
349
  0.026455039978027343,
350
- 0.026266624450683593,
351
- 0.02634956741333008,
352
- 0.02630143928527832,
353
- 0.02633318328857422,
354
- 0.02632908821105957,
355
- 0.026458112716674805,
356
- 0.026358783721923826,
357
- 0.02733363151550293,
358
- 0.026714111328125,
359
- 0.0263055362701416,
360
- 0.026360832214355468,
361
- 0.026415103912353514,
362
- 0.02631884765625,
363
- 0.026295295715332033,
364
- 0.026199039459228517,
365
- 0.026247167587280275,
366
- 0.026447872161865234,
367
- 0.026390527725219725,
368
- 0.02629324722290039,
369
- 0.0263372802734375,
370
- 0.026389759063720705,
371
- 0.026364927291870118,
372
- 0.02631884765625,
373
- 0.026343423843383788,
374
- 0.02634547233581543,
375
- 0.026418176651000977,
376
- 0.02630451202392578,
377
- 0.02635264015197754,
378
- 0.02630860710144043,
379
- 0.02632499122619629,
380
- 0.0263874568939209,
381
- 0.026468351364135743,
382
  0.026532863616943358,
383
- 0.026385408401489258,
384
- 0.02628096008300781,
385
- 0.026630144119262695,
 
 
386
  0.02655232048034668,
387
- 0.026622976303100586,
388
- 0.026959871292114256,
389
- 0.026360832214355468,
390
- 0.02630348777770996
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
391
  ]
392
  },
393
  "throughput": {
394
  "unit": "tokens/s",
395
- "value": 9621.720058563826
396
  },
397
  "energy": null,
398
  "efficiency": null
@@ -400,23 +401,23 @@
400
  "decode": {
401
  "memory": {
402
  "unit": "MB",
403
- "max_ram": 1076.178944,
404
  "max_vram": 3472.883712,
405
  "max_reserved": 2988.4416,
406
  "max_allocated": 2813.773312
407
  },
408
  "latency": {
409
  "unit": "s",
410
- "mean": 5.252298754692077,
411
- "stdev": 0.0027883577346803357,
412
  "values": [
413
- 5.255087112426757,
414
- 5.249510396957397
415
  ]
416
  },
417
  "throughput": {
418
  "unit": "tokens/s",
419
- "value": 48.55017048910229
420
  },
421
  "energy": null,
422
  "efficiency": null
@@ -425,524 +426,524 @@
425
  "memory": null,
426
  "latency": {
427
  "unit": "s",
428
- "mean": 0.020597250018400286,
429
- "stdev": 0.00014580121487761858,
430
  "values": [
431
- 0.020610048294067384,
432
- 0.020809728622436522,
433
- 0.020600831985473633,
434
- 0.020578432083129882,
435
- 0.020586368560791015,
436
- 0.020587520599365236,
437
- 0.02063871955871582,
438
- 0.020593664169311524,
439
- 0.02057318305969238,
440
- 0.020993024826049804,
441
- 0.02061414337158203,
442
- 0.02056505584716797,
443
- 0.02060076713562012,
444
- 0.020595903396606444,
445
- 0.020709184646606444,
446
- 0.02058137512207031,
447
- 0.020548608779907225,
448
- 0.020602880477905275,
449
- 0.020633600234985353,
450
- 0.020599807739257812,
451
- 0.020493312835693358,
452
- 0.020609024047851563,
453
- 0.020676607131958007,
454
- 0.02066534423828125,
455
- 0.02064076805114746,
456
- 0.020496576309204102,
457
- 0.02056684875488281,
458
- 0.020510719299316405,
459
- 0.020549631118774413,
460
- 0.020612096786499022,
461
- 0.020725759506225586,
462
- 0.020560895919799805,
463
- 0.020641792297363282,
464
- 0.020928640365600586,
465
- 0.02054438400268555,
466
- 0.020555904388427734,
467
- 0.020538240432739257,
468
- 0.020527360916137695,
469
- 0.02055449676513672,
470
- 0.020629600524902345,
471
- 0.020768672943115234,
472
- 0.020586496353149415,
473
- 0.020566015243530272,
474
- 0.020616191864013672,
475
- 0.020547584533691408,
476
- 0.020528127670288086,
477
- 0.020551679611206054,
478
- 0.020563039779663086,
479
- 0.020570016860961913,
480
- 0.02056422424316406,
481
- 0.020571071624755858,
482
- 0.02058835220336914,
483
- 0.020534271240234374,
484
- 0.02065510368347168,
485
- 0.020548608779907225,
486
- 0.020523008346557618,
487
- 0.020575231552124023,
488
- 0.020548704147338868,
489
- 0.02056403160095215,
490
- 0.0205515193939209,
491
- 0.020547584533691408,
492
- 0.02071244812011719,
493
  0.02068172836303711,
494
- 0.020707456588745118,
495
- 0.02063961601257324,
496
- 0.020798559188842772,
497
- 0.02059561538696289,
498
- 0.020611072540283205,
499
- 0.020576255798339844,
500
- 0.020558847427368163,
501
- 0.020633600234985353,
502
- 0.02062335968017578,
503
- 0.020822015762329102,
504
- 0.020607200622558594,
505
- 0.020628255844116213,
506
- 0.020582399368286132,
507
- 0.020543487548828124,
508
- 0.020575456619262696,
509
- 0.020628255844116213,
510
- 0.020709375381469726,
511
- 0.020610048294067384,
512
- 0.020632575988769532,
513
- 0.020543487548828124,
514
- 0.020624383926391602,
515
- 0.02051481628417969,
516
- 0.020535295486450195,
517
- 0.020539392471313478,
518
- 0.020519935607910156,
519
- 0.020602880477905275,
520
- 0.020726783752441406,
521
- 0.020520959854125977,
522
- 0.020560895919799805,
523
- 0.020520959854125977,
524
- 0.020596736907958983,
525
  0.02065510368347168,
526
- 0.020626432418823244,
527
- 0.02051584053039551,
528
- 0.020601856231689454,
529
- 0.020503551483154296,
530
- 0.020530176162719727,
531
- 0.020720640182495118,
532
- 0.020612096786499022,
533
- 0.020717567443847656,
534
- 0.020556800842285155,
535
- 0.02067967987060547,
536
- 0.020548608779907225,
537
- 0.020546560287475587,
538
- 0.02101862335205078,
539
- 0.02058137512207031,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
540
  0.02068284797668457,
541
- 0.020687776565551756,
542
- 0.020508672714233397,
543
- 0.020561920166015626,
544
- 0.020633600234985353,
545
- 0.020595712661743162,
546
- 0.020702207565307617,
 
 
 
 
 
 
 
 
 
 
 
547
  0.02062131118774414,
 
 
 
 
 
 
 
548
  0.02069606399536133,
549
- 0.020612096786499022,
550
- 0.0206059513092041,
551
- 0.020576255798339844,
552
- 0.020547584533691408,
553
- 0.020771839141845702,
554
- 0.020594688415527345,
555
- 0.020545536041259766,
556
- 0.020561920166015626,
557
- 0.020485120773315428,
558
- 0.020467840194702148,
559
- 0.02053209686279297,
560
- 0.020545568466186524,
561
- 0.020798431396484376,
562
- 0.020554752349853517,
563
- 0.02059878349304199,
564
- 0.02063974380493164,
565
- 0.020745216369628908,
566
- 0.02060492706298828,
567
- 0.020633600234985353,
568
- 0.020580352783203124,
569
- 0.020576255798339844,
570
  0.020641792297363282,
571
- 0.020706304550170897,
572
- 0.02049843215942383,
573
- 0.020564992904663085,
574
- 0.020463615417480468,
575
- 0.020551679611206054,
576
- 0.02059878349304199,
577
- 0.020519935607910156,
578
- 0.020592639923095703,
579
- 0.020592639923095703,
580
- 0.020649984359741212,
581
- 0.020526079177856444,
582
- 0.020523136138916015,
583
- 0.020552576065063475,
584
- 0.020559871673583984,
585
- 0.02081177520751953,
586
- 0.020508735656738282,
587
- 0.02060588836669922,
588
- 0.020511743545532226,
589
  0.020555776596069338,
590
- 0.020558847427368163,
591
- 0.020644863128662108,
592
- 0.020596736907958983,
593
- 0.020653055191040038,
 
 
594
  0.020594688415527345,
595
- 0.020513792037963868,
596
- 0.020505599975585938,
597
- 0.02064384078979492,
598
- 0.02057318305969238,
599
- 0.020707328796386718,
600
- 0.020520959854125977,
601
- 0.02063052749633789,
602
- 0.020546560287475587,
603
- 0.020545536041259766,
604
- 0.020527103424072265,
605
- 0.020533248901367186,
606
- 0.020553728103637696,
607
- 0.020556800842285155,
608
- 0.020750335693359375,
609
- 0.020570112228393556,
610
- 0.020780031204223632,
611
- 0.02067967987060547,
612
- 0.020529151916503906,
613
- 0.020619264602661135,
614
- 0.02065407943725586,
615
  0.020744192123413087,
616
- 0.020575231552124023,
617
- 0.020609024047851563,
618
- 0.020607999801635742,
619
  0.020632575988769532,
620
- 0.020625408172607423,
621
- 0.02065203285217285,
622
- 0.020479999542236327,
623
- 0.02070528030395508,
 
 
 
 
 
 
 
 
 
624
  0.020528127670288086,
625
- 0.020519935607910156,
626
- 0.02063052749633789,
627
- 0.02067865562438965,
628
- 0.020510719299316405,
629
- 0.020539392471313478,
630
- 0.02064691162109375,
631
- 0.02066329574584961,
632
- 0.020658176422119142,
633
- 0.02062950325012207,
634
- 0.02059881591796875,
635
- 0.02053321647644043,
636
- 0.02107904052734375,
637
- 0.020593664169311524,
638
- 0.02054876708984375,
639
- 0.020525920867919923,
640
  0.020560895919799805,
641
- 0.020569087982177735,
642
- 0.02065203285217285,
643
- 0.020580352783203124,
644
- 0.02067558479309082,
645
- 0.02059775924682617,
646
- 0.020564992904663085,
647
- 0.02062745666503906,
648
- 0.020602880477905275,
649
  0.020624383926391602,
650
  0.020682752609252928,
651
- 0.02062745666503906,
652
- 0.020677631378173827,
653
- 0.020554752349853517,
654
- 0.020518911361694335,
655
- 0.020571136474609376,
656
- 0.020590591430664062,
657
- 0.02066431999206543,
658
- 0.020694143295288087,
659
- 0.021042047500610353,
660
- 0.02069708824157715,
661
- 0.020559871673583984,
662
- 0.020530176162719727,
663
- 0.02065100860595703,
664
- 0.020578496932983397,
665
- 0.02057913589477539,
666
- 0.020668415069580077,
667
- 0.020810752868652343,
668
- 0.020530176162719727,
669
- 0.02064793586730957,
670
- 0.02049126434326172,
671
- 0.020511743545532226,
672
- 0.020754432678222655,
673
- 0.020591615676879883,
674
- 0.02062335968017578,
675
- 0.02064076805114746,
676
- 0.020607999801635742,
677
- 0.020722688674926756,
678
- 0.020534271240234374,
679
- 0.02065203285217285,
680
- 0.02051584053039551,
681
- 0.020649984359741212,
682
- 0.020462591171264647,
683
- 0.020496383666992187,
684
- 0.020625408172607423,
685
- 0.020544511795043945,
686
- 0.020725759506225586,
687
- 0.020549631118774413,
688
- 0.020557823181152343,
689
- 0.020512767791748047,
690
- 0.020547584533691408,
691
- 0.020564992904663085,
692
  0.020603904724121092,
693
- 0.02065920066833496,
694
- 0.020518911361694335,
695
- 0.020551679611206054,
696
- 0.020518911361694335,
697
- 0.02053222465515137,
698
- 0.020501504898071288,
699
- 0.020725759506225586,
700
- 0.020537343978881836,
701
- 0.020527103424072265,
702
- 0.020508672714233397,
703
- 0.020547584533691408,
704
- 0.020542463302612304,
705
- 0.020546560287475587,
706
  0.020553728103637696,
707
- 0.020529151916503906,
708
- 0.020722688674926756,
709
- 0.020525056838989256,
710
- 0.02065203285217285,
711
- 0.020495359420776366,
712
- 0.020528127670288086,
713
- 0.020543487548828124,
714
- 0.0206376953125,
715
- 0.02049126434326172,
716
- 0.020497407913208008,
717
- 0.020558847427368163,
718
- 0.020536319732666015,
719
- 0.020571136474609376,
720
- 0.020658176422119142,
721
- 0.020538368225097657,
722
- 0.020610048294067384,
723
- 0.020487167358398437,
724
- 0.020528127670288086,
725
- 0.020561952590942383,
726
- 0.020467679977416994,
727
- 0.02049558448791504,
728
- 0.02046441650390625,
729
- 0.02053222465515137,
730
- 0.020570112228393556,
731
  0.020588544845581053,
732
- 0.020503551483154296,
733
- 0.020777055740356445,
734
- 0.020501407623291015,
735
- 0.020549631118774413,
736
- 0.020462591171264647,
737
- 0.020519935607910156,
738
- 0.020543487548828124,
739
- 0.020455615997314453,
740
- 0.020564800262451173,
741
- 0.020533248901367186,
742
- 0.02067046356201172,
743
- 0.020609024047851563,
744
- 0.020594688415527345,
745
- 0.02056208038330078,
746
- 0.02047267150878906,
747
- 0.02047590446472168,
748
- 0.020526079177856444,
749
- 0.020489215850830078,
750
- 0.020525056838989256,
751
- 0.020479999542236327,
752
- 0.020610048294067384,
753
- 0.02056403160095215,
754
- 0.020463552474975586,
755
- 0.020464832305908204,
756
- 0.020955968856811523,
757
- 0.02051584053039551,
758
- 0.020707328796386718,
759
- 0.020554752349853517,
760
  0.020588544845581053,
761
- 0.020485120773315428,
762
- 0.020503551483154296,
763
- 0.02061414337158203,
764
- 0.020666368484497072,
765
- 0.020582399368286132,
766
- 0.020519935607910156,
767
- 0.020493312835693358,
768
- 0.020535295486450195,
769
- 0.020752384185791017,
770
- 0.020508672714233397,
771
- 0.020513792037963868,
772
- 0.02048102378845215,
773
- 0.02049135971069336,
774
- 0.02063350486755371,
775
- 0.020445184707641603,
776
- 0.02044927978515625,
777
- 0.02047590446472168,
778
- 0.02048102378845215,
779
- 0.020566015243530272,
780
- 0.020504575729370117,
781
- 0.020553823471069335,
782
- 0.020546464920043944,
783
- 0.020510847091674805,
784
- 0.020628351211547852,
785
- 0.020497407913208008,
786
- 0.02045952033996582,
787
- 0.020445344924926757,
788
- 0.020429664611816407,
789
- 0.02043903923034668,
790
- 0.020548608779907225,
791
- 0.020587520599365236,
792
- 0.020600831985473633,
793
- 0.020577280044555665,
794
- 0.02062950325012207,
795
- 0.020518911361694335,
796
- 0.020531200408935548,
797
- 0.02052403259277344,
798
- 0.020505599975585938,
799
- 0.020525056838989256,
800
- 0.02067558479309082,
801
- 0.020587520599365236,
802
- 0.02058137512207031,
803
- 0.02046771240234375,
804
- 0.020486143112182616,
805
- 0.020513792037963868,
806
- 0.020510719299316405,
807
- 0.020818944931030273,
808
- 0.020561920166015626,
809
- 0.02044313621520996,
810
- 0.020525056838989256,
811
- 0.02058137512207031,
812
- 0.020599807739257812,
813
- 0.020534271240234374,
814
- 0.02058956718444824,
815
- 0.020549631118774413,
816
- 0.020495359420776366,
817
- 0.020528127670288086,
818
- 0.02057318305969238,
819
- 0.020564992904663085,
820
- 0.020551679611206054,
821
- 0.020539392471313478,
822
- 0.020521984100341797,
823
- 0.02052403259277344,
824
- 0.02050764846801758,
825
- 0.020702207565307617,
826
- 0.020557823181152343,
827
- 0.020611263275146483,
828
- 0.02057401657104492,
829
- 0.020551679611206054,
830
- 0.020715520858764647,
831
- 0.02103500747680664,
832
- 0.020610048294067384,
833
- 0.020493312835693358,
834
  0.020642816543579103,
835
- 0.020547584533691408,
836
- 0.020590591430664062,
837
- 0.020619520187377928,
838
- 0.02056985664367676,
839
- 0.02062335968017578,
840
  0.0206059513092041,
841
- 0.02066431999206543,
842
- 0.020686847686767578,
843
- 0.020541631698608398,
844
- 0.020640575408935546,
845
- 0.020569087982177735,
846
- 0.020553728103637696,
847
- 0.020542463302612304,
848
- 0.020624383926391602,
849
- 0.02052403259277344,
850
- 0.020588544845581053,
851
- 0.020695039749145508,
852
- 0.020568063735961914,
853
- 0.020533248901367186,
854
- 0.02101862335205078,
855
- 0.020560895919799805,
856
- 0.020641792297363282,
857
- 0.020758527755737305,
858
- 0.0206561279296875,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
859
  0.020684799194335936,
860
- 0.020579328536987306,
861
- 0.020633600234985353,
 
 
 
 
 
 
 
 
 
 
862
  0.0206561279296875,
863
- 0.02065100860595703,
 
 
 
 
 
 
 
 
 
864
  0.02059775924682617,
865
- 0.020531200408935548,
866
- 0.020562944412231447,
867
- 0.020596736907958983,
868
- 0.02067967987060547,
869
- 0.02052403259277344,
870
- 0.02049126434326172,
871
- 0.020576255798339844,
872
- 0.020590591430664062,
873
- 0.020685823440551757,
874
- 0.0206059513092041,
875
- 0.020605119705200195,
876
- 0.020507455825805664,
877
- 0.020552864074707033,
878
- 0.02053001594543457,
879
- 0.02051705551147461,
880
- 0.020600639343261718,
881
- 0.020668415069580077,
882
- 0.020616191864013672,
883
  0.020730880737304686,
884
- 0.02061516761779785,
 
 
 
 
 
 
 
 
 
 
 
 
 
885
  0.020602880477905275,
886
- 0.020516864776611327,
887
- 0.02049945640563965,
888
- 0.020582399368286132,
889
- 0.020641855239868164,
890
- 0.02055776023864746,
 
 
 
 
891
  0.020714496612548827,
892
- 0.020551679611206054,
893
- 0.02051487922668457,
894
- 0.02060179138183594,
895
- 0.020519935607910156,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
896
  0.020632575988769532,
897
- 0.020509695053100584,
898
- 0.020528127670288086,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
899
  0.02058137512207031,
900
- 0.02061311912536621,
901
- 0.02048307228088379,
902
- 0.020534271240234374,
903
- 0.020529151916503906,
904
- 0.020653055191040038,
905
- 0.020504575729370117,
906
- 0.02049228858947754,
907
- 0.020504575729370117,
908
- 0.020502527236938475,
909
- 0.020538368225097657,
910
- 0.020576255798339844,
911
- 0.02056928062438965,
912
- 0.0206180477142334,
913
- 0.02063564872741699,
914
- 0.020530176162719727,
915
- 0.020587648391723633,
916
- 0.02053619194030762,
917
- 0.020644863128662108,
918
- 0.020787200927734374,
919
- 0.020575231552124023,
920
- 0.021355520248413085,
921
- 0.02304921531677246,
922
- 0.020558847427368163,
923
- 0.020604032516479492,
924
- 0.020711296081542967,
925
- 0.020537343978881836,
926
- 0.020520959854125977,
927
- 0.02051584053039551,
928
- 0.020890623092651366,
929
- 0.020579328536987306,
930
  0.02067046356201172,
931
- 0.020719615936279297,
932
- 0.020610048294067384,
933
- 0.020571136474609376,
934
- 0.02062131118774414,
935
- 0.020555776596069338,
936
- 0.02062950325012207,
937
- 0.020552703857421875,
938
- 0.02045952033996582,
939
- 0.020602880477905275,
940
- 0.020752384185791017
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
941
  ]
942
  },
943
  "throughput": {
944
  "unit": "tokens/s",
945
- "value": 48.55017048910233
946
  },
947
  "energy": null,
948
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 1076.424704,
6
+ "max_vram": 3193.962496,
7
  "max_reserved": 2709.520384,
8
  "max_allocated": 2546.903552
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.026573762337155936,
13
+ "stdev": 0.0003123613526453773,
14
  "values": [
15
+ 0.029640512466430666,
16
+ 0.02755072021484375,
17
+ 0.027322368621826174,
18
+ 0.02711347198486328,
19
+ 0.02696294403076172,
20
+ 0.027015199661254884,
21
+ 0.027218944549560548,
22
+ 0.02708684730529785,
23
+ 0.027000831604003905,
24
+ 0.02955264091491699,
25
+ 0.02976051139831543,
26
+ 0.027761856079101564,
27
+ 0.026484735488891603,
28
+ 0.02694655990600586,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
29
  0.026467327117919923,
30
+ 0.02655436706542969,
31
+ 0.026440704345703125,
32
+ 0.026476543426513673,
33
+ 0.026474496841430665,
34
+ 0.026483711242675782,
35
+ 0.026462207794189452,
36
+ 0.02652774429321289,
37
+ 0.026444799423217775,
38
  0.026468351364135743,
39
+ 0.02653593635559082,
40
+ 0.02652774429321289,
41
+ 0.02651955223083496,
42
+ 0.026484735488891603,
43
+ 0.026457088470458984,
44
+ 0.026513408660888672,
45
+ 0.02650214385986328,
46
+ 0.027123712539672853,
47
+ 0.026461183547973634,
48
+ 0.026458112716674805,
49
+ 0.026504192352294922,
50
+ 0.026548383712768554,
51
+ 0.026474496841430665,
52
+ 0.026471424102783202,
53
+ 0.026482688903808595,
54
+ 0.026479616165161132,
55
+ 0.026451967239379884,
56
+ 0.026454015731811522,
57
+ 0.026522655487060547,
58
+ 0.026468351364135743,
59
+ 0.026606592178344726,
60
+ 0.02666700744628906,
61
+ 0.026645503997802734,
62
+ 0.02669260787963867,
63
+ 0.026600448608398438,
64
+ 0.026656991958618165,
65
+ 0.026656768798828126,
66
+ 0.026578943252563478,
67
+ 0.026600448608398438,
68
+ 0.026605567932128905,
69
+ 0.026639360427856446,
70
+ 0.026606592178344726,
71
+ 0.026562559127807618,
72
+ 0.026639360427856446,
73
+ 0.02656358337402344,
74
+ 0.026591232299804687,
75
+ 0.026537984848022462,
76
+ 0.026620927810668944,
77
+ 0.02654617691040039,
78
+ 0.026557439804077147,
79
+ 0.026614784240722656,
80
+ 0.026574848175048828,
81
+ 0.026621952056884765,
82
+ 0.026627071380615236,
83
+ 0.02660780715942383,
84
+ 0.026619903564453123,
85
+ 0.026476543426513673,
86
+ 0.026532863616943358,
87
+ 0.026570751190185548,
88
+ 0.02653593635559082,
89
+ 0.02650931167602539,
90
+ 0.026600448608398438,
91
+ 0.02653388786315918,
92
+ 0.02647859191894531,
93
+ 0.026573823928833007,
94
+ 0.02654719924926758,
95
+ 0.026532863616943358,
96
+ 0.02651955223083496,
97
+ 0.02656768035888672,
98
+ 0.026564607620239256,
99
+ 0.02654412841796875,
100
+ 0.026639423370361327,
101
+ 0.026597375869750976,
102
+ 0.026603519439697267,
103
+ 0.02652262306213379,
104
+ 0.02694144058227539,
105
+ 0.026599424362182617,
106
+ 0.02656358337402344,
107
+ 0.026603519439697267,
108
+ 0.026456064224243164,
109
+ 0.02653900718688965,
110
+ 0.02656358337402344,
111
+ 0.02651545524597168,
112
+ 0.026601600646972656,
113
+ 0.026605567932128905,
114
+ 0.026573823928833007,
115
+ 0.02656972885131836,
116
+ 0.026641408920288087,
117
+ 0.026564607620239256,
118
+ 0.026600448608398438,
119
+ 0.02657792091369629,
120
+ 0.026620927810668944,
121
+ 0.026651647567749022,
122
+ 0.026917888641357423,
123
+ 0.026603519439697267,
124
+ 0.026610687255859376,
125
+ 0.026635263442993166,
126
+ 0.026604543685913085,
127
  0.02652876853942871,
128
+ 0.026629119873046874,
129
+ 0.026628095626831053,
130
+ 0.026587135314941408,
131
+ 0.02661702346801758,
132
+ 0.02667024040222168,
133
+ 0.026592256546020508,
134
+ 0.026620927810668944,
135
+ 0.026505216598510743,
136
+ 0.026605567932128905,
137
+ 0.026619903564453123,
138
+ 0.026566656112670898,
139
+ 0.02653388786315918,
140
+ 0.02654412841796875,
141
+ 0.026541055679321288,
142
+ 0.026558464050292968,
143
+ 0.026529792785644532,
144
+ 0.026627071380615236,
145
+ 0.026550271987915038,
146
+ 0.02652569580078125,
147
+ 0.026457088470458984,
148
+ 0.02655539131164551,
149
+ 0.026588159561157225,
150
+ 0.026534912109375,
151
+ 0.026504192352294922,
152
+ 0.026534912109375,
153
+ 0.02653081512451172,
154
+ 0.026578943252563478,
155
+ 0.026580991744995116,
156
+ 0.02659328079223633,
157
+ 0.026565631866455077,
158
+ 0.026496000289916992,
159
+ 0.026475519180297852,
160
+ 0.02652364730834961,
161
+ 0.026505216598510743,
162
+ 0.026518783569335937,
163
+ 0.02654719924926758,
164
+ 0.02652262306213379,
165
+ 0.026566656112670898,
166
+ 0.02653593635559082,
167
+ 0.026446847915649413,
168
+ 0.026505376815795897,
169
+ 0.026455039978027343,
170
+ 0.02646937561035156,
171
+ 0.026468351364135743,
172
+ 0.026438655853271483,
173
+ 0.026491903305053712,
174
+ 0.02651750373840332,
175
+ 0.026447872161865234,
176
+ 0.02653696060180664,
177
+ 0.02653081512451172,
178
+ 0.026381311416625978,
179
+ 0.026439680099487304,
180
+ 0.026944511413574217,
181
+ 0.026491903305053712,
182
+ 0.02652364730834961,
183
+ 0.026483711242675782,
184
+ 0.026456064224243164,
185
+ 0.026465280532836914,
186
+ 0.026423295974731444,
187
+ 0.026428447723388673,
188
+ 0.026389503479003908,
189
+ 0.026429439544677736,
190
+ 0.026489856719970704,
191
+ 0.026429567337036133,
192
+ 0.0265031681060791,
193
+ 0.02652569580078125,
194
+ 0.02657689666748047,
195
+ 0.02644710350036621,
196
+ 0.026455039978027343,
197
+ 0.026482847213745116,
198
+ 0.02680944061279297,
199
+ 0.026498048782348634,
200
+ 0.026433536529541016,
201
+ 0.02651136016845703,
202
+ 0.026441728591918946,
203
+ 0.026468351364135743,
204
+ 0.02651033592224121,
205
+ 0.026484735488891603,
206
+ 0.026475616455078125,
207
+ 0.026473472595214844,
208
+ 0.026473472595214844,
209
+ 0.02651136016845703,
210
+ 0.02646937561035156,
211
+ 0.026521600723266602,
212
+ 0.02655232048034668,
213
+ 0.026486879348754884,
214
+ 0.026463232040405273,
215
+ 0.026500095367431642,
216
+ 0.026407936096191405,
217
+ 0.026573823928833007,
218
+ 0.026462207794189452,
219
+ 0.02648476791381836,
220
+ 0.026421247482299806,
221
+ 0.02649519920349121,
222
+ 0.026442752838134766,
223
+ 0.026420223236083985,
224
+ 0.026471424102783202,
225
+ 0.0265031681060791,
226
+ 0.026458112716674805,
227
+ 0.0265533447265625,
228
+ 0.02652569580078125,
229
+ 0.0265164794921875,
230
+ 0.026450944900512696,
231
+ 0.026431488037109374,
232
+ 0.026462207794189452,
233
+ 0.02654515266418457,
234
+ 0.026471424102783202,
235
+ 0.026428415298461915,
236
+ 0.026507488250732424,
237
+ 0.026435583114624024,
238
+ 0.026446847915649413,
239
+ 0.02649395179748535,
240
+ 0.026436607360839845,
241
  0.02649497604370117,
242
+ 0.026467327117919923,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
243
  0.026430463790893553,
244
+ 0.02650931167602539,
245
+ 0.02652774429321289,
246
+ 0.026489856719970704,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
247
  0.026432512283325195,
248
+ 0.026569984436035157,
249
+ 0.02650214385986328,
250
+ 0.02653081512451172,
251
+ 0.026460159301757814,
252
+ 0.02655129623413086,
253
+ 0.02656768035888672,
254
+ 0.026565631866455077,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
255
  0.026474496841430665,
256
+ 0.02698240089416504,
257
+ 0.02655436706542969,
258
+ 0.02657689666748047,
259
+ 0.026524671554565428,
260
+ 0.026476543426513673,
261
+ 0.02653388786315918,
262
+ 0.02650931167602539,
263
+ 0.026419200897216798,
264
+ 0.02650931167602539,
265
+ 0.02656153678894043,
266
+ 0.026572799682617186,
267
+ 0.026461183547973634,
268
+ 0.0265533447265625,
269
+ 0.026472448348999023,
270
+ 0.026572799682617186,
271
+ 0.02652057647705078,
272
+ 0.026608640670776368,
273
+ 0.02655539131164551,
274
+ 0.02690662384033203,
275
+ 0.02648678398132324,
276
+ 0.02657587242126465,
277
+ 0.026582015991210937,
278
+ 0.026607616424560547,
279
+ 0.02646540832519531,
280
+ 0.02654515266418457,
281
+ 0.026487808227539062,
282
+ 0.026496000289916992,
283
+ 0.026505216598510743,
284
+ 0.026581119537353516,
285
+ 0.02653900718688965,
286
+ 0.02653900718688965,
287
+ 0.026883071899414062,
288
+ 0.0265850887298584,
289
+ 0.026457088470458984,
290
+ 0.02655948829650879,
291
+ 0.02654412841796875,
292
+ 0.02650931167602539,
293
+ 0.02654003143310547,
294
+ 0.026496000289916992,
295
+ 0.02651033592224121,
296
+ 0.02653388786315918,
297
+ 0.02647859191894531,
298
+ 0.026610687255859376,
299
+ 0.026505216598510743,
300
+ 0.02669158363342285,
301
+ 0.026452991485595705,
302
+ 0.02668339157104492,
303
+ 0.026498239517211915,
304
+ 0.026587135314941408,
305
+ 0.02649395179748535,
306
+ 0.026472448348999023,
307
+ 0.02650214385986328,
308
+ 0.026505216598510743,
 
 
 
309
  0.02651852798461914,
310
+ 0.026606655120849608,
311
+ 0.026466304779052735,
312
+ 0.026521600723266602,
313
+ 0.026496000289916992,
314
+ 0.02649087905883789,
315
+ 0.02648678398132324,
316
+ 0.0265799674987793,
317
+ 0.02649907112121582,
318
+ 0.02654003143310547,
319
+ 0.026492927551269533,
320
+ 0.026604543685913085,
321
+ 0.026537984848022462,
322
+ 0.026608640670776368,
323
+ 0.02650214385986328,
324
+ 0.02673356819152832,
325
+ 0.026529792785644532,
326
+ 0.026487808227539062,
327
+ 0.026441728591918946,
328
+ 0.026458112716674805,
329
+ 0.02648575973510742,
330
+ 0.02652672004699707,
331
+ 0.026474496841430665,
332
+ 0.026884096145629883,
333
+ 0.026411008834838868,
334
  0.026431488037109374,
335
+ 0.02647756767272949,
336
+ 0.02650931167602539,
337
+ 0.02646022415161133,
338
+ 0.02655436706542969,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
339
  0.026455039978027343,
340
+ 0.02647260856628418,
341
+ 0.02652774429321289,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
342
  0.026532863616943358,
343
+ 0.026431488037109374,
344
+ 0.02647756767272949,
345
+ 0.02651852798461914,
346
+ 0.026381311416625978,
347
+ 0.026462207794189452,
348
  0.02655232048034668,
349
+ 0.026482688903808595,
350
+ 0.026983423233032225,
351
+ 0.02647667121887207,
352
+ 0.026464256286621093,
353
+ 0.02653603172302246,
354
+ 0.026590208053588867,
355
+ 0.026460159301757814,
356
+ 0.026506240844726563,
357
+ 0.02651545524597168,
358
+ 0.02648678398132324,
359
+ 0.026472448348999023,
360
+ 0.02652364730834961,
361
+ 0.026444799423217775,
362
+ 0.026447872161865234,
363
+ 0.026473472595214844,
364
+ 0.026461183547973634,
365
+ 0.026468351364135743,
366
+ 0.02650726318359375,
367
+ 0.026440704345703125,
368
+ 0.026473472595214844,
369
+ 0.02644812774658203,
370
+ 0.026414079666137694,
371
+ 0.026427391052246094,
372
+ 0.026455039978027343,
373
+ 0.026471424102783202,
374
+ 0.02646937561035156,
375
+ 0.026482688903808595,
376
+ 0.026488832473754883,
377
+ 0.02647039985656738,
378
+ 0.026455039978027343,
379
+ 0.026455039978027343,
380
+ 0.02651238441467285,
381
+ 0.026487808227539062,
382
+ 0.0265533447265625,
383
+ 0.026521600723266602,
384
+ 0.026541055679321288,
385
+ 0.02654003143310547,
386
+ 0.026492927551269533,
387
+ 0.026466304779052735,
388
+ 0.02658406448364258,
389
+ 0.026435583114624024,
390
+ 0.02649907112121582,
391
+ 0.026415103912353514
392
  ]
393
  },
394
  "throughput": {
395
  "unit": "tokens/s",
396
+ "value": 9633.562487388395
397
  },
398
  "energy": null,
399
  "efficiency": null
 
401
  "decode": {
402
  "memory": {
403
  "unit": "MB",
404
+ "max_ram": 1076.424704,
405
  "max_vram": 3472.883712,
406
  "max_reserved": 2988.4416,
407
  "max_allocated": 2813.773312
408
  },
409
  "latency": {
410
  "unit": "s",
411
+ "mean": 5.279526395797735,
412
+ "stdev": 0.00993230247497534,
413
  "values": [
414
+ 5.269594093322759,
415
+ 5.28945869827271
416
  ]
417
  },
418
  "throughput": {
419
  "unit": "tokens/s",
420
+ "value": 48.29978692842004
421
  },
422
  "energy": null,
423
  "efficiency": null
 
426
  "memory": null,
427
  "latency": {
428
  "unit": "s",
429
+ "mean": 0.020704025081559725,
430
+ "stdev": 0.00010196179261765438,
431
  "values": [
432
+ 0.020859136581420898,
433
+ 0.020944639205932616,
434
+ 0.020755456924438476,
435
+ 0.020674560546875,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
436
  0.02068172836303711,
437
+ 0.02071468734741211,
438
+ 0.020702016830444335,
439
+ 0.02065203285217285,
440
+ 0.02072166442871094,
441
+ 0.020758527755737305,
442
+ 0.020718591690063477,
443
+ 0.02061516761779785,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
444
  0.02065510368347168,
445
+ 0.020706432342529297,
446
+ 0.02067750358581543,
447
+ 0.020694143295288087,
448
+ 0.020802431106567383,
449
+ 0.020725887298583986,
450
+ 0.02066828727722168,
451
+ 0.021192703247070312,
452
+ 0.02065020751953125,
453
+ 0.020725568771362304,
454
+ 0.02066454315185547,
455
+ 0.020765439987182617,
456
+ 0.020684799194335936,
457
+ 0.020590591430664062,
458
+ 0.020682752609252928,
459
+ 0.020702239990234374,
460
+ 0.02076873588562012,
461
+ 0.02069196891784668,
462
+ 0.02070025634765625,
463
+ 0.020766719818115235,
464
+ 0.020716447830200196,
465
+ 0.020642816543579103,
466
+ 0.020700159072875975,
467
+ 0.020789472579956055,
468
+ 0.0206693115234375,
469
+ 0.020702112197875978,
470
+ 0.02072985649108887,
471
+ 0.020701183319091796,
472
+ 0.020668415069580077,
473
+ 0.02065715217590332,
474
+ 0.02106777572631836,
475
+ 0.0206878719329834,
476
+ 0.02063052749633789,
477
+ 0.020654239654541016,
478
+ 0.020613983154296876,
479
+ 0.0206878719329834,
480
+ 0.02072700881958008,
481
+ 0.020580352783203124,
482
+ 0.020659103393554687,
483
  0.02068284797668457,
484
+ 0.02064668846130371,
485
+ 0.020600831985473633,
486
+ 0.02063564872741699,
487
+ 0.02062131118774414,
488
+ 0.020624383926391602,
489
+ 0.020766719818115235,
490
+ 0.02067558479309082,
491
+ 0.02066329574584961,
492
+ 0.02066227149963379,
493
+ 0.020685823440551757,
494
+ 0.020711423873901368,
495
+ 0.020632575988769532,
496
+ 0.02075551986694336,
497
+ 0.02082009506225586,
498
+ 0.020694847106933593,
499
+ 0.02068809509277344,
500
+ 0.02064259147644043,
501
  0.02062131118774414,
502
+ 0.020661247253417968,
503
+ 0.020577280044555665,
504
+ 0.02062131118774414,
505
+ 0.020658176422119142,
506
+ 0.020678720474243163,
507
+ 0.020717504501342774,
508
+ 0.020609024047851563,
509
  0.02069606399536133,
510
+ 0.02068172836303711,
511
+ 0.020799488067626954,
512
+ 0.020641855239868164,
513
+ 0.020627519607543946,
514
+ 0.020568960189819335,
515
+ 0.020596736907958983,
516
+ 0.020793344497680662,
517
+ 0.02071347236633301,
518
+ 0.02062131118774414,
 
 
 
 
 
 
 
 
 
 
 
 
519
  0.020641792297363282,
520
+ 0.02064384078979492,
521
+ 0.02061516761779785,
522
+ 0.020642816543579103,
523
+ 0.02063564872741699,
524
+ 0.020674560546875,
525
+ 0.02069196891784668,
526
+ 0.020574207305908202,
527
+ 0.0205980167388916,
528
+ 0.02068556785583496,
529
+ 0.020603904724121092,
530
+ 0.02057423973083496,
531
+ 0.020614112854003906,
532
+ 0.02062233543395996,
533
+ 0.020620288848876952,
534
+ 0.020574207305908202,
 
 
 
535
  0.020555776596069338,
536
+ 0.0206878719329834,
537
+ 0.020524063110351563,
538
+ 0.02053116798400879,
539
+ 0.02061311912536621,
540
+ 0.02059878349304199,
541
+ 0.020771839141845702,
542
  0.020594688415527345,
543
+ 0.02059775924682617,
544
+ 0.020543487548828124,
545
+ 0.020624383926391602,
546
+ 0.02062131118774414,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
547
  0.020744192123413087,
548
+ 0.020716543197631835,
549
+ 0.0208721923828125,
550
+ 0.02067251205444336,
551
  0.020632575988769532,
552
+ 0.020591615676879883,
553
+ 0.020762624740600585,
554
+ 0.020567039489746093,
555
+ 0.020663488388061525,
556
+ 0.02058425521850586,
557
+ 0.02062131118774414,
558
+ 0.020470783233642577,
559
+ 0.020634624481201173,
560
+ 0.020599807739257812,
561
+ 0.020747264862060546,
562
+ 0.020543487548828124,
563
+ 0.020505599975585938,
564
+ 0.020653055191040038,
565
  0.020528127670288086,
566
+ 0.020540607452392577,
567
+ 0.020747072219848634,
568
+ 0.020601856231689454,
569
+ 0.02061516761779785,
570
+ 0.020512767791748047,
571
+ 0.02066739273071289,
572
+ 0.02101043128967285,
573
+ 0.020612096786499022,
574
+ 0.020543487548828124,
 
 
 
 
 
 
575
  0.020560895919799805,
576
+ 0.020541439056396483,
 
 
 
 
 
 
 
577
  0.020624383926391602,
578
  0.020682752609252928,
579
+ 0.020559072494506836,
580
+ 0.02060700798034668,
581
+ 0.020598623275756837,
582
+ 0.020634527206420897,
583
+ 0.02063689613342285,
584
+ 0.020578079223632813,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
585
  0.020603904724121092,
 
 
 
 
 
 
 
 
 
 
 
 
 
586
  0.020553728103637696,
587
+ 0.020601856231689454,
588
+ 0.020695039749145508,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
589
  0.020588544845581053,
590
+ 0.02061635208129883,
591
+ 0.02053222465515137,
592
+ 0.02056380844116211,
593
+ 0.020607999801635742,
594
+ 0.02070528030395508,
595
+ 0.020700159072875975,
596
+ 0.020611072540283205,
597
+ 0.020611072540283205,
598
+ 0.02066227149963379,
599
+ 0.02072166442871094,
600
+ 0.0206376953125,
601
+ 0.02064793586730957,
602
+ 0.020562944412231447,
603
+ 0.02061516761779785,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
604
  0.020588544845581053,
605
+ 0.020751359939575196,
606
+ 0.02062233543395996,
607
+ 0.02066431999206543,
608
+ 0.02060492706298828,
609
+ 0.02067148780822754,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
610
  0.020642816543579103,
611
+ 0.020737024307250978,
612
+ 0.020640832901000977,
613
+ 0.02061612892150879,
 
 
614
  0.0206059513092041,
615
+ 0.020583423614501953,
616
+ 0.02064300727844238,
617
+ 0.020832191467285155,
618
+ 0.02064371109008789,
619
+ 0.020692991256713866,
620
+ 0.020749311447143554,
621
+ 0.02064793586730957,
622
+ 0.020620288848876952,
623
+ 0.020593664169311524,
624
+ 0.020661247253417968,
625
+ 0.02055788803100586,
626
+ 0.020618175506591795,
627
+ 0.02065920066833496,
628
+ 0.020591615676879883,
629
+ 0.02053222465515137,
630
+ 0.02066227149963379,
631
+ 0.020748287200927733,
632
+ 0.020586496353149415,
633
+ 0.020619264602661135,
634
+ 0.020553951263427735,
635
+ 0.02062544059753418,
636
+ 0.020607744216918945,
637
+ 0.02081279945373535,
638
+ 0.020661247253417968,
639
+ 0.02067353630065918,
640
+ 0.020642816543579103,
641
+ 0.020534271240234374,
642
+ 0.020592639923095703,
643
+ 0.02060495948791504,
644
+ 0.02076684761047363,
645
+ 0.020738912582397462,
646
+ 0.02106675148010254,
647
+ 0.02061516761779785,
648
  0.020684799194335936,
649
+ 0.020710399627685547,
650
+ 0.020617216110229493,
651
+ 0.02067148780822754,
652
+ 0.020619264602661135,
653
+ 0.020625408172607423,
654
+ 0.02062848091125488,
655
+ 0.020742143630981445,
656
+ 0.020644863128662108,
657
+ 0.02068172836303711,
658
+ 0.020685823440551757,
659
+ 0.020706304550170897,
660
+ 0.020658176422119142,
661
  0.0206561279296875,
662
+ 0.020780288696289062,
663
+ 0.020814592361450196,
664
+ 0.020787200927734374,
665
+ 0.020692991256713866,
666
+ 0.020666368484497072,
667
+ 0.020717567443847656,
668
+ 0.020717567443847656,
669
+ 0.021210111618041993,
670
+ 0.020718591690063477,
671
+ 0.020545536041259766,
672
  0.02059775924682617,
673
+ 0.020728832244873048,
674
+ 0.020724895477294922,
675
+ 0.02086895942687988,
676
+ 0.020658399581909178,
677
+ 0.020689695358276368,
678
+ 0.02064384078979492,
679
+ 0.02061311912536621,
680
+ 0.020554847717285156,
681
+ 0.02063862419128418,
682
+ 0.020618240356445314,
683
+ 0.02063564872741699,
684
+ 0.02070528030395508,
685
+ 0.020617216110229493,
686
+ 0.020632575988769532,
687
+ 0.020831232070922853,
 
 
 
688
  0.020730880737304686,
689
+ 0.020661247253417968,
690
+ 0.02063564872741699,
691
+ 0.02058956718444824,
692
+ 0.020624383926391602,
693
+ 0.020620288848876952,
694
+ 0.020745216369628908,
695
+ 0.02062233543395996,
696
+ 0.020625408172607423,
697
+ 0.020590591430664062,
698
+ 0.02065510368347168,
699
+ 0.020554752349853517,
700
+ 0.020686016082763672,
701
+ 0.020630336761474608,
702
+ 0.02066739273071289,
703
  0.020602880477905275,
704
+ 0.020599807739257812,
705
+ 0.02066227149963379,
706
+ 0.020781055450439453,
707
+ 0.020757503509521484,
708
+ 0.02068172836303711,
709
+ 0.02069196891784668,
710
+ 0.020753631591796873,
711
+ 0.02064156723022461,
712
+ 0.020612096786499022,
713
  0.020714496612548827,
714
+ 0.020677759170532228,
715
+ 0.02070412826538086,
716
+ 0.020716543197631835,
717
+ 0.020699136734008788,
718
+ 0.02065715217590332,
719
+ 0.02069606399536133,
720
+ 0.02068992042541504,
721
+ 0.02086092758178711,
722
+ 0.02075657653808594,
723
+ 0.020718496322631837,
724
+ 0.02067353630065918,
725
+ 0.020723712921142577,
726
+ 0.02065203285217285,
727
+ 0.020785152435302736,
728
+ 0.020725759506225586,
729
+ 0.02070425605773926,
730
+ 0.020720640182495118,
731
+ 0.02067967987060547,
732
+ 0.020620288848876952,
733
+ 0.02084351921081543,
734
+ 0.020770816802978515,
735
+ 0.02064896011352539,
736
  0.020632575988769532,
737
+ 0.02067148780822754,
738
+ 0.02073206329345703,
739
+ 0.020799327850341796,
740
+ 0.020742143630981445,
741
+ 0.0208035831451416,
742
+ 0.021182464599609374,
743
+ 0.020771839141845702,
744
+ 0.02078227233886719,
745
+ 0.020694847106933593,
746
+ 0.020682752609252928,
747
+ 0.02068889617919922,
748
+ 0.02064588737487793,
749
+ 0.020617216110229493,
750
+ 0.0208035831451416,
751
+ 0.02065836715698242,
752
+ 0.02068160057067871,
753
+ 0.020668352127075195,
754
+ 0.02067967987060547,
755
+ 0.020775936126708985,
756
+ 0.02070425605773926,
757
+ 0.0205948486328125,
758
+ 0.020661088943481447,
759
+ 0.020722688674926756,
760
+ 0.020619264602661135,
761
+ 0.020813823699951172,
762
+ 0.02069811248779297,
763
+ 0.020722911834716796,
764
+ 0.020669376373291016,
765
+ 0.021006175994873047,
766
+ 0.02070425605773926,
767
+ 0.020853759765625,
768
+ 0.02075152015686035,
769
+ 0.02070512008666992,
770
+ 0.020742143630981445,
771
+ 0.020789375305175783,
772
+ 0.020760448455810546,
773
+ 0.020699136734008788,
774
+ 0.02066739273071289,
775
+ 0.020701183319091796,
776
+ 0.020699199676513673,
777
+ 0.020850624084472656,
778
+ 0.02069708824157715,
779
+ 0.02063052749633789,
780
+ 0.020595712661743162,
781
  0.02058137512207031,
782
+ 0.02088140869140625,
783
+ 0.020709375381469726,
784
+ 0.020756479263305663,
785
+ 0.02065920066833496,
786
+ 0.02067251205444336,
787
+ 0.020570112228393556,
788
+ 0.020824064254760744,
789
+ 0.02070537567138672,
790
+ 0.020781984329223634,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
791
  0.02067046356201172,
792
+ 0.020776960372924806,
793
+ 0.020809728622436522,
794
+ 0.020686847686767578,
795
+ 0.02071865653991699,
796
+ 0.02076460838317871,
797
+ 0.020714496612548827,
798
+ 0.02071244812011719,
799
+ 0.020717567443847656,
800
+ 0.020840448379516603,
801
+ 0.020730880737304686,
802
+ 0.020720640182495118,
803
+ 0.02066739273071289,
804
+ 0.020601856231689454,
805
+ 0.020784128189086915,
806
+ 0.020626432418823244,
807
+ 0.020948991775512696,
808
+ 0.02071244812011719,
809
+ 0.02062748718261719,
810
+ 0.020591583251953125,
811
+ 0.02068182373046875,
812
+ 0.020749343872070312,
813
+ 0.02070822334289551,
814
+ 0.020611072540283205,
815
+ 0.020685823440551757,
816
+ 0.020792320251464845,
817
+ 0.020669439315795898,
818
+ 0.02065100860595703,
819
+ 0.02063871955871582,
820
+ 0.0206376953125,
821
+ 0.020743167877197266,
822
+ 0.020699136734008788,
823
+ 0.020752384185791017,
824
+ 0.020657215118408203,
825
+ 0.02077791976928711,
826
+ 0.020658176422119142,
827
+ 0.020772064208984375,
828
+ 0.020746015548706056,
829
+ 0.02069305610656738,
830
+ 0.02096940803527832,
831
+ 0.020650047302246094,
832
+ 0.020726720809936525,
833
+ 0.02069606399536133,
834
+ 0.020827392578125,
835
+ 0.020813568115234375,
836
+ 0.02082099151611328,
837
+ 0.02085273551940918,
838
+ 0.020779008865356444,
839
+ 0.02097587203979492,
840
+ 0.020939680099487306,
841
+ 0.02078499221801758,
842
+ 0.020780031204223632,
843
+ 0.020730880737304686,
844
+ 0.020779008865356444,
845
+ 0.020703231811523438,
846
+ 0.02081996726989746,
847
+ 0.020818944931030273,
848
+ 0.020812864303588866,
849
+ 0.020809919357299804,
850
+ 0.02072652816772461,
851
+ 0.020700159072875975,
852
+ 0.020783103942871094,
853
+ 0.020875263214111327,
854
+ 0.02069708824157715,
855
+ 0.020783103942871094,
856
+ 0.02071244812011719,
857
+ 0.020780031204223632,
858
+ 0.02080460739135742,
859
+ 0.020715744018554687,
860
+ 0.020759328842163086,
861
+ 0.020738271713256835,
862
+ 0.020748064041137694,
863
+ 0.021140480041503908,
864
+ 0.020797439575195312,
865
+ 0.02082508850097656,
866
+ 0.02072985649108887,
867
+ 0.02085990333557129,
868
+ 0.020775999069213867,
869
+ 0.020735935211181642,
870
+ 0.02071244812011719,
871
+ 0.020711423873901368,
872
+ 0.020822015762329102,
873
+ 0.020744192123413087,
874
+ 0.02083020782470703,
875
+ 0.02087014389038086,
876
+ 0.020952064514160155,
877
+ 0.020782079696655274,
878
+ 0.020738048553466795,
879
+ 0.020733951568603515,
880
+ 0.020818944931030273,
881
+ 0.020761600494384767,
882
+ 0.020756479263305663,
883
+ 0.020747520446777343,
884
+ 0.020792064666748048,
885
+ 0.020923423767089843,
886
+ 0.02071139144897461,
887
+ 0.020823040008544923,
888
+ 0.02070425605773926,
889
+ 0.020710399627685547,
890
+ 0.020715583801269533,
891
+ 0.02084966468811035,
892
+ 0.02071651268005371,
893
+ 0.020825056076049803,
894
+ 0.020769792556762694,
895
+ 0.020923391342163086,
896
+ 0.020727807998657227,
897
+ 0.02071561622619629,
898
+ 0.020726688385009767,
899
+ 0.020784128189086915,
900
+ 0.02086604881286621,
901
+ 0.020758527755737305,
902
+ 0.02071244812011719,
903
+ 0.020731903076171874,
904
+ 0.020806880950927736,
905
+ 0.02084227180480957,
906
+ 0.020832256317138673,
907
+ 0.020734975814819336,
908
+ 0.020674560546875,
909
+ 0.020768768310546876,
910
+ 0.020809728622436522,
911
+ 0.0208721923828125,
912
+ 0.020742303848266603,
913
+ 0.02078704071044922,
914
+ 0.020695039749145508,
915
+ 0.020815872192382814,
916
+ 0.020751359939575196,
917
+ 0.02069708824157715,
918
+ 0.020732927322387695,
919
+ 0.02082508850097656,
920
+ 0.020777984619140624,
921
+ 0.020817920684814452,
922
+ 0.020761600494384767,
923
+ 0.020726783752441406,
924
+ 0.02085171127319336,
925
+ 0.020764671325683593,
926
+ 0.020816896438598635,
927
+ 0.020728031158447267,
928
+ 0.020716320037841796,
929
+ 0.020725984573364258,
930
+ 0.020809503555297853,
931
+ 0.02082611274719238,
932
+ 0.020709375381469726,
933
+ 0.020767744064331056,
934
+ 0.020746240615844725,
935
+ 0.02080460739135742,
936
+ 0.021136480331420897,
937
+ 0.02105641555786133,
938
+ 0.020779104232788087,
939
+ 0.020695968627929686,
940
+ 0.020717664718627928,
941
+ 0.020724639892578126
942
  ]
943
  },
944
  "throughput": {
945
  "unit": "tokens/s",
946
+ "value": 48.29978692842008
947
  },
948
  "energy": null,
949
  "efficiency": null