kreas commited on
Commit
2456a8c
1 Parent(s): 3a9adf4

Upload /Mistral-7B-v0.1/fp4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json with huggingface_hub

Browse files
Mistral-7B-v0.1/fp4_batch_size_1_sq_len_256_new_tokens_256/benchmark_report.json CHANGED
@@ -2,192 +2,194 @@
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
- "max_ram": 2301.93152,
6
  "max_vram": 5490.343936,
7
  "max_reserved": 5005.901824,
8
  "max_allocated": 4844.946944
9
  },
10
  "latency": {
11
  "unit": "s",
12
- "mean": 0.05857614369977985,
13
- "stdev": 0.0008302679798154835,
14
  "values": [
15
- 0.06381891250610351,
16
- 0.06281932830810547,
17
- 0.06022348785400391,
18
- 0.05860966491699219,
19
- 0.0618342399597168,
20
- 0.0585615348815918,
21
- 0.05860249710083008,
22
- 0.05805072021484375,
23
- 0.05850726318359375,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
24
  0.058031105041503904,
25
- 0.05855027389526367,
26
- 0.05803007888793945,
27
- 0.05856051254272461,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
28
  0.058054656982421876,
29
- 0.05854207992553711,
30
- 0.0580208625793457,
31
- 0.05854719924926758,
32
- 0.05802204895019531,
33
- 0.05857894515991211,
34
- 0.05808230209350586,
35
- 0.05855539321899414,
36
- 0.0580423698425293,
37
- 0.05932032012939453,
38
- 0.059046913146972656,
39
- 0.05960396957397461,
40
- 0.05911859130859375,
41
- 0.059568126678466796,
42
- 0.05920767974853516,
43
- 0.06301081466674804,
44
- 0.06096403121948242,
45
- 0.060050430297851565,
46
- 0.05905408096313477,
47
- 0.05959987258911133,
48
- 0.05905100631713867,
49
- 0.059723808288574216,
50
- 0.05927731323242187,
51
- 0.05963289642333985,
52
- 0.05914419174194336,
53
- 0.059578369140625,
54
- 0.05913087844848633,
55
- 0.05960192108154297,
56
- 0.05910220718383789,
57
- 0.05963264083862305,
58
- 0.05902336120605469,
59
- 0.05855846405029297,
60
- 0.05803212738037109,
61
- 0.058598400115966794,
62
- 0.0580711669921875,
63
- 0.05856172943115234,
64
- 0.058028030395507815,
65
- 0.05850726318359375,
66
- 0.05857177734375,
67
- 0.05864243316650391,
68
  0.05802598571777344,
69
- 0.05853081512451172,
70
- 0.05799628829956055,
71
- 0.05854003143310547,
72
- 0.057988094329833983,
73
- 0.05852671813964844,
 
 
 
 
 
 
 
 
 
 
74
  0.05803212738037109,
75
- 0.05858614349365234,
76
- 0.05816320037841797,
77
- 0.05857593536376953,
78
- 0.05813145446777344,
79
- 0.05851136016845703,
80
- 0.0580761604309082,
81
- 0.05858816146850586,
82
- 0.05805363082885742,
83
- 0.058525760650634764,
84
- 0.058047489166259764,
85
- 0.05869465637207031,
86
- 0.05797273635864258,
87
- 0.058534912109375,
88
- 0.05804032135009766,
89
- 0.058517505645751956,
90
- 0.058041343688964846,
91
- 0.05847654342651367,
92
- 0.05807206344604492,
93
- 0.05860665512084961,
94
- 0.058014720916748044,
95
- 0.05856883239746094,
96
- 0.05803519821166992,
97
- 0.058552318572998044,
98
- 0.05805184173583984,
99
- 0.05860454559326172,
100
- 0.05807820892333984,
101
- 0.058534912109375,
102
- 0.05807923126220703,
103
- 0.05852262496948242,
104
- 0.05813043212890625,
105
- 0.05863759994506836,
106
- 0.05811513519287109,
107
- 0.05857791900634766,
108
- 0.058016895294189456,
109
- 0.058554367065429686,
110
- 0.058039295196533204,
111
- 0.058689537048339846,
112
- 0.05808127975463867,
113
- 0.05857177734375,
114
- 0.05810287857055664,
115
- 0.05849190521240234,
116
- 0.05806284713745117,
117
- 0.058573951721191404,
118
- 0.05795123291015625,
119
- 0.05870796966552734,
120
- 0.058074111938476565,
121
- 0.05857279968261719,
122
- 0.058011646270751956,
123
- 0.05849702453613281,
124
- 0.05799116897583008,
125
- 0.05852774429321289,
126
- 0.058044414520263675,
127
- 0.05851238250732422,
128
- 0.05804339218139649,
129
- 0.05851238250732422,
130
- 0.05805055999755859,
131
- 0.05854003143310547,
132
- 0.05801491165161133,
133
- 0.05850009536743164,
134
- 0.05796454238891602,
135
- 0.058548225402832034,
136
- 0.05805363082885742,
137
- 0.05862707138061524,
138
- 0.05803014373779297,
139
- 0.05860966491699219,
140
- 0.05808947372436524,
141
- 0.058665985107421874,
142
- 0.0581130256652832,
143
- 0.058554367065429686,
144
- 0.05805977630615235,
145
- 0.05861580657958984,
146
- 0.05815091323852539,
147
- 0.05855846405029297,
148
- 0.05809561538696289,
149
- 0.05858201599121094,
150
- 0.05802188873291016,
151
- 0.058552318572998044,
152
- 0.05803427124023437,
153
- 0.05859532928466797,
154
- 0.05815014266967773,
155
- 0.058510337829589844,
156
- 0.058039295196533204,
157
- 0.058534912109375,
158
- 0.058065921783447265,
159
- 0.058518527984619144,
160
- 0.05804339218139649,
161
- 0.05852687835693359,
162
- 0.057988094329833983,
163
- 0.0585533447265625,
164
- 0.05807513427734375,
165
- 0.05859635162353516,
166
- 0.05810073471069336,
167
- 0.05857689666748047,
168
- 0.058019840240478515,
169
- 0.058548225402832034,
170
- 0.05804851150512695,
171
- 0.05857689666748047,
172
- 0.058054656982421876,
173
- 0.05865574264526367,
174
- 0.05800447845458984,
175
- 0.058589183807373046,
176
- 0.05818368148803711,
177
- 0.05852569580078125,
178
- 0.05803427124023437,
179
- 0.05852671813964844,
180
- 0.058237953186035155,
181
- 0.058616832733154295,
182
- 0.05808947372436524,
183
- 0.05861478424072265,
184
- 0.05806796646118164,
185
- 0.05856665420532227
186
  ]
187
  },
188
  "throughput": {
189
  "unit": "tokens/s",
190
- "value": 4370.379882159469
191
  },
192
  "energy": null,
193
  "efficiency": null
@@ -195,23 +197,23 @@
195
  "decode": {
196
  "memory": {
197
  "unit": "MB",
198
- "max_ram": 2301.93152,
199
  "max_vram": 5710.544896,
200
  "max_reserved": 5226.102784,
201
  "max_allocated": 4911.274496
202
  },
203
  "latency": {
204
  "unit": "s",
205
- "mean": 8.695093782424927,
206
- "stdev": 0.007343614578248392,
207
  "values": [
208
- 8.702437397003175,
209
- 8.687750167846678
210
  ]
211
  },
212
  "throughput": {
213
  "unit": "tokens/s",
214
- "value": 29.326883226426162
215
  },
216
  "energy": null,
217
  "efficiency": null
@@ -220,524 +222,524 @@
220
  "memory": null,
221
  "latency": {
222
  "unit": "s",
223
- "mean": 0.034098406989901645,
224
- "stdev": 0.00021590978745798326,
225
  "values": [
226
- 0.03628236770629883,
227
- 0.03566080093383789,
228
- 0.034069694519042966,
229
- 0.034637760162353516,
230
- 0.03399769592285156,
231
- 0.03394271850585937,
232
- 0.03400582504272461,
233
- 0.034051071166992186,
234
- 0.03412684631347656,
235
- 0.03408486557006836,
236
- 0.033995777130126956,
237
- 0.034131233215332034,
238
- 0.0339719352722168,
239
- 0.034051071166992186,
240
- 0.03400703811645508,
241
- 0.033979393005371096,
242
- 0.03400089645385742,
243
- 0.034164737701416016,
244
- 0.034124801635742184,
245
- 0.03409100723266602,
246
- 0.03402137756347656,
247
- 0.03407974243164062,
248
- 0.03397836685180664,
249
- 0.034019359588623045,
250
- 0.033979358673095705,
251
- 0.03401955032348633,
252
- 0.03403855895996094,
253
- 0.03402547073364258,
254
- 0.033980415344238284,
255
- 0.03414220809936523,
256
- 0.03406131362915039,
257
- 0.03420159912109375,
258
- 0.033979393005371096,
259
- 0.03399782562255859,
260
- 0.0340049934387207,
261
- 0.033941505432128906,
262
- 0.03395174407958984,
263
- 0.03401852798461914,
264
- 0.03400271987915039,
265
- 0.034016254425048825,
266
- 0.03416582489013672,
267
- 0.034086112976074216,
268
- 0.03400265502929688,
269
- 0.03410054397583008,
270
- 0.03403744125366211,
271
- 0.034029823303222656,
272
- 0.033952510833740235,
273
- 0.033960960388183595,
274
- 0.034405376434326174,
275
- 0.03412275314331055,
276
- 0.034081790924072264,
277
- 0.03401334381103516,
278
- 0.03394339370727539,
279
- 0.03402137756347656,
280
- 0.03395072174072265,
281
- 0.033980415344238284,
282
- 0.03403673553466797,
283
- 0.03390566253662109,
284
- 0.034050048828125,
285
- 0.033933311462402346,
286
- 0.03404083251953125,
287
- 0.03403987121582031,
288
- 0.03453228759765625,
289
- 0.03408281707763672,
290
- 0.03415347290039063,
291
- 0.034164737701416016,
292
- 0.03414323043823242,
293
- 0.03395177459716797,
294
- 0.03406844711303711,
295
- 0.0340766716003418,
296
- 0.03393535995483398,
297
- 0.034083839416503905,
298
- 0.03400806427001953,
299
- 0.0340766716003418,
300
- 0.034103294372558594,
301
- 0.03399884796142578,
302
- 0.03405311965942383,
303
- 0.03410227203369141,
304
- 0.034154495239257815,
305
- 0.03422822570800781,
306
- 0.03407155227661133,
307
- 0.03411558532714844,
308
- 0.034181121826171876,
309
- 0.03395072174072265,
310
- 0.0339343376159668,
311
- 0.03463996887207031,
312
- 0.035277729034423826,
313
- 0.03420998382568359,
314
- 0.03403142547607422,
315
- 0.03399785614013672,
316
- 0.0341800651550293,
317
- 0.03399884796142578,
318
- 0.03392716979980469,
319
- 0.03418931198120117,
320
- 0.03441049575805664,
321
- 0.034067455291748046,
322
- 0.03419340896606445,
323
- 0.034181121826171876,
324
- 0.034081790924072264,
325
- 0.03391795349121094,
326
- 0.034121726989746096,
327
- 0.03409113693237305,
328
- 0.03407244873046875,
329
- 0.03398860931396484,
330
- 0.034108417510986325,
331
- 0.03392739105224609,
332
- 0.034040607452392575,
333
- 0.03440127944946289,
334
- 0.0341319694519043,
335
- 0.03408281707763672,
336
- 0.03409203338623047,
337
- 0.03407257461547852,
338
- 0.03420467376708984,
339
- 0.03425491333007812,
340
- 0.03420870590209961,
341
- 0.03405311965942383,
342
- 0.034200576782226565,
343
- 0.03402239990234375,
344
- 0.0341401596069336,
345
- 0.03440127944946289,
346
- 0.0341739501953125,
347
- 0.034528255462646484,
348
- 0.03402239990234375,
349
- 0.03421004867553711,
350
- 0.03417984008789063,
351
- 0.034136062622070314,
352
- 0.03405619049072266,
353
- 0.03408099365234375,
354
- 0.0339832649230957,
355
- 0.03407769775390625,
356
- 0.03402239990234375,
357
- 0.033997886657714846,
358
- 0.03397727966308594,
359
- 0.033999870300292966,
360
- 0.03434188842773438,
361
- 0.03419443130493164,
362
- 0.034141185760498044,
363
- 0.03399270248413086,
364
- 0.0341739501953125,
365
- 0.034081790924072264,
366
- 0.03394047927856445,
367
- 0.03403673553466797,
368
- 0.0341319694519043,
369
- 0.03405740737915039,
370
- 0.03393209457397461,
371
- 0.033942527770996093,
372
- 0.03403059387207031,
373
- 0.03404800033569336,
374
- 0.03400908660888672,
375
- 0.034331649780273435,
376
- 0.03421184158325195,
377
- 0.03435443115234375,
378
- 0.03420134353637695,
379
- 0.03426816177368164,
380
- 0.03393228912353516,
381
- 0.03400908660888672,
382
- 0.03412684631347656,
383
- 0.034129150390625,
384
- 0.03614796829223633,
385
- 0.03564851379394531,
386
- 0.03397529602050781,
387
- 0.034062335968017575,
388
- 0.03400422286987305,
389
- 0.03412863922119141,
390
- 0.03412582397460937,
391
- 0.034103294372558594,
392
- 0.03458560180664062,
393
- 0.03418956756591797,
394
- 0.034194175720214846,
395
- 0.03406335830688476,
396
- 0.03398553466796875,
397
- 0.0342724494934082,
398
- 0.034103103637695316,
399
- 0.03434086227416992,
400
- 0.03405516815185547,
401
- 0.03430201721191406,
402
- 0.03409913635253906,
403
- 0.03403673553466797,
404
- 0.033966079711914066,
405
- 0.03410432052612305,
406
- 0.03444224166870117,
407
- 0.03417001724243164,
408
- 0.03418505477905273,
409
- 0.03386265563964844,
410
- 0.03397017669677734,
411
- 0.034032638549804685,
412
- 0.0340582389831543,
413
- 0.03399168014526367,
414
- 0.034012161254882815,
415
- 0.034141185760498044,
416
- 0.03405721664428711,
417
- 0.03396915054321289,
418
- 0.034121726989746096,
419
- 0.03386188888549805,
420
- 0.03405696105957031,
421
- 0.03410124969482422,
422
- 0.034269184112548826,
423
- 0.03411382293701172,
424
- 0.034248416900634765,
425
- 0.034219009399414066,
426
- 0.03418214416503906,
427
- 0.034151424407958986,
428
- 0.0339046401977539,
429
- 0.03398963165283203,
430
- 0.033982463836669925,
431
- 0.03405209732055664,
432
- 0.03408793640136719,
433
- 0.03399168014526367,
434
- 0.034157569885253904,
435
- 0.034210975646972654,
436
- 0.03403145599365234,
437
- 0.03397753524780273,
438
- 0.03403859329223633,
439
- 0.0341319694519043,
440
- 0.03439411163330078,
441
- 0.03415347290039063,
442
- 0.034293758392333985,
443
- 0.03403673553466797,
444
- 0.03397017669677734,
445
- 0.03397324752807617,
446
- 0.03410636901855469,
447
- 0.03424665451049805,
448
- 0.034342910766601564,
449
- 0.03414745712280273,
450
- 0.03412057495117188,
451
- 0.03457228851318359,
452
- 0.03399782562255859,
453
- 0.03409920120239258,
454
- 0.03402547073364258,
455
- 0.03401113510131836,
456
- 0.03400396728515625,
457
- 0.03404201507568359,
458
- 0.03412054443359375,
459
- 0.034321407318115234,
460
- 0.03399168014526367,
461
- 0.03422518539428711,
462
- 0.03407356643676758,
463
- 0.03408614349365234,
464
- 0.03407846450805664,
465
- 0.03453440093994141,
466
- 0.033966079711914066,
467
- 0.03400294494628906,
468
- 0.0340766716003418,
469
- 0.0340398063659668,
470
- 0.03415347290039063,
471
- 0.03408281707763672,
472
- 0.03398144149780274,
473
- 0.03398963165283203,
474
- 0.03396915054321289,
475
- 0.034024574279785155,
476
- 0.03406118392944336,
477
- 0.03399270248413086,
478
- 0.03393024063110352,
479
- 0.03407769775390625,
480
- 0.033993728637695314,
481
- 0.03409100723266602,
482
- 0.03407772827148438,
483
- 0.034181087493896485,
484
- 0.03403878402709961,
485
- 0.033949695587158206,
486
- 0.034135040283203126,
487
- 0.033960960388183595,
488
- 0.03411056137084961,
489
- 0.03406326293945312,
490
- 0.03409100723266602,
491
- 0.03390262222290039,
492
- 0.034061279296875,
493
- 0.03401113510131836,
494
- 0.03412070465087891,
495
- 0.033941505432128906,
496
- 0.03399168014526367,
497
- 0.03433369445800781,
498
- 0.034135040283203126,
499
- 0.034249729156494144,
500
- 0.03402751922607422,
501
- 0.03406438446044922,
502
- 0.03402751922607422,
503
- 0.034086910247802735,
504
- 0.034106529235839844,
505
- 0.03399356842041015,
506
- 0.034092288970947265,
507
- 0.033952510833740235,
508
- 0.03446169662475586,
509
- 0.03402342224121094,
510
- 0.03408281707763672,
511
- 0.03402239990234375,
512
- 0.03410150527954101,
513
- 0.034180862426757816,
514
- 0.034127872467041014,
515
- 0.034127872467041014,
516
- 0.03403673553466797,
517
- 0.03419852828979492,
518
- 0.03410124969482422,
519
- 0.03399782562255859,
520
- 0.03407462310791016,
521
- 0.033979393005371096,
522
- 0.034492416381835936,
523
- 0.03398144149780274,
524
- 0.034055328369140624,
525
- 0.0340478401184082,
526
- 0.0340316162109375,
527
- 0.03405926513671875,
528
- 0.03417599868774414,
529
- 0.034097152709960936,
530
- 0.034233345031738284,
531
- 0.03410124969482422,
532
- 0.03407257461547852,
533
- 0.033928192138671875,
534
- 0.033993728637695314,
535
- 0.03400294494628906,
536
- 0.03401321411132813,
537
- 0.03391075134277344,
538
- 0.033941505432128906,
539
- 0.0339046401977539,
540
- 0.03389235305786133,
541
- 0.03415683364868164,
542
- 0.03391561508178711,
543
- 0.03406643295288086,
544
- 0.033915008544921875,
545
- 0.03405401611328125,
546
- 0.03401523208618164,
547
- 0.03400601577758789,
548
- 0.03399996948242188,
549
- 0.034083744049072266,
550
- 0.03423344039916992,
551
- 0.03428956985473633,
552
- 0.034285568237304685,
553
- 0.03408486557006836,
554
- 0.03400294494628906,
555
- 0.03427328109741211,
556
- 0.0341401596069336,
557
- 0.03427840042114258,
558
- 0.034034687042236327,
559
- 0.03410432052612305,
560
- 0.034202625274658206,
561
- 0.033977344512939454,
562
- 0.03398556900024414,
563
- 0.034028511047363284,
564
- 0.03398963165283203,
565
- 0.033857536315917966,
566
- 0.03380940628051758,
567
- 0.03450368118286133,
568
- 0.03392931365966797,
569
- 0.03396700668334961,
570
- 0.03400316619873047,
571
- 0.0340098876953125,
572
- 0.03404390335083008,
573
- 0.03405215835571289,
574
- 0.0340695686340332,
575
- 0.03408883285522461,
576
- 0.0339918098449707,
577
- 0.03410726547241211,
578
- 0.03415552139282227,
579
- 0.03422003173828125,
580
- 0.034081790924072264,
581
- 0.03435007858276367,
582
- 0.03429683303833008,
583
- 0.03409408187866211,
584
- 0.03406643295288086,
585
- 0.03416985702514649,
586
- 0.0342108154296875,
587
- 0.034151424407958986,
588
- 0.0341739501953125,
589
- 0.03408486557006836,
590
- 0.03400908660888672,
591
- 0.034136062622070314,
592
- 0.0341739501953125,
593
- 0.033947647094726564,
594
- 0.03400089645385742,
595
- 0.03400806427001953,
596
- 0.034118656158447266,
597
- 0.03423539352416992,
598
- 0.03395686340332031,
599
- 0.034132991790771484,
600
- 0.03408588790893555,
601
- 0.03402649688720703,
602
- 0.03408281707763672,
603
- 0.03407257461547852,
604
- 0.03407769775390625,
605
- 0.034097152709960936,
606
- 0.03401318359375,
607
- 0.034118656158447266,
608
- 0.03398553466796875,
609
- 0.03404800033569336,
610
- 0.03410124969482422,
611
- 0.034016254425048825,
612
- 0.03385139083862305,
613
- 0.03412582397460937,
614
- 0.0339159049987793,
615
- 0.034051071166992186,
616
- 0.03405209732055664,
617
- 0.03405516815185547,
618
- 0.034100223541259765,
619
- 0.0340316162109375,
620
- 0.03413401412963867,
621
- 0.03420467376708984,
622
- 0.034171009063720705,
623
- 0.0342342414855957,
624
- 0.03423660659790039,
625
- 0.034111297607421875,
626
- 0.034010112762451174,
627
- 0.03454873657226563,
628
- 0.03408816146850586,
629
- 0.03411740875244141,
630
- 0.03412070465087891,
631
- 0.03405414581298828,
632
- 0.034078720092773435,
633
- 0.03394559860229492,
634
- 0.03400089645385742,
635
- 0.03396710586547851,
636
- 0.03402239990234375,
637
- 0.033979393005371096,
638
- 0.033915969848632814,
639
- 0.033915840148925784,
640
- 0.03395276641845703,
641
- 0.03442073440551758,
642
- 0.03392419052124023,
643
- 0.03398953628540039,
644
- 0.03402678298950195,
645
- 0.03412041473388672,
646
- 0.03397836685180664,
647
- 0.03405926513671875,
648
- 0.034098175048828124,
649
- 0.034055233001708984,
650
- 0.03411347198486328,
651
- 0.03404390335083008,
652
- 0.03412188720703125,
653
- 0.034101089477539065,
654
- 0.033991935729980466,
655
- 0.03402931213378906,
656
- 0.034159713745117185,
657
- 0.034114463806152344,
658
- 0.03398963165283203,
659
- 0.03418316650390625,
660
- 0.034050048828125,
661
- 0.03405209732055664,
662
- 0.034123966217041016,
663
- 0.0341512336730957,
664
- 0.033997886657714846,
665
- 0.03404179382324219,
666
- 0.034022689819335934,
667
- 0.03412656021118164,
668
- 0.034103294372558594,
669
- 0.033999870300292966,
670
- 0.033821697235107424,
671
- 0.03398553466796875,
672
- 0.03391795349121094,
673
- 0.033854465484619144,
674
- 0.03394047927856445,
675
- 0.03391692733764649,
676
- 0.03389132690429687,
677
- 0.03437977600097656,
678
- 0.03417190551757812,
679
- 0.03403776168823242,
680
- 0.03397856140136719,
681
- 0.03391468811035156,
682
- 0.03411763381958008,
683
- 0.03391897583007813,
684
- 0.034062335968017575,
685
- 0.034083839416503905,
686
- 0.03448320007324219,
687
- 0.0339947509765625,
688
- 0.033877246856689455,
689
- 0.033944320678710935,
690
- 0.03401420974731445,
691
- 0.03403571319580078,
692
- 0.03406335830688476,
693
- 0.033979393005371096,
694
- 0.03424374389648437,
695
- 0.03400278472900391,
696
- 0.034034687042236327,
697
- 0.03404083251953125,
698
- 0.034141185760498044,
699
- 0.03418521499633789,
700
- 0.03460505676269531,
701
- 0.03421184158325195,
702
- 0.03398361587524414,
703
- 0.03405811309814453,
704
- 0.0340766716003418,
705
- 0.03408588790893555,
706
- 0.034078720092773435,
707
- 0.03402751922607422,
708
- 0.03404185485839844,
709
- 0.03400908660888672,
710
- 0.0341401596069336,
711
- 0.03412582397460937,
712
- 0.03403673553466797,
713
- 0.03415961456298828,
714
- 0.03410227203369141,
715
- 0.03419647979736328,
716
- 0.034081790924072264,
717
- 0.03415347290039063,
718
- 0.03402956771850586,
719
- 0.03396915054321289,
720
- 0.0339947509765625,
721
- 0.034049022674560545,
722
- 0.03402444839477539,
723
- 0.03402956771850586,
724
- 0.034067455291748046,
725
- 0.03402444839477539,
726
- 0.03407676696777344,
727
- 0.034051998138427735,
728
- 0.03416892623901367,
729
- 0.033885089874267575,
730
- 0.033993728637695314,
731
- 0.03404288101196289,
732
- 0.03388108825683594,
733
- 0.03398553466796875,
734
- 0.03392435073852539,
735
- 0.03385011291503906
736
  ]
737
  },
738
  "throughput": {
739
  "unit": "tokens/s",
740
- "value": 29.326883226426187
741
  },
742
  "energy": null,
743
  "efficiency": null
 
2
  "prefill": {
3
  "memory": {
4
  "unit": "MB",
5
+ "max_ram": 2520.65792,
6
  "max_vram": 5490.343936,
7
  "max_reserved": 5005.901824,
8
  "max_allocated": 4844.946944
9
  },
10
  "latency": {
11
  "unit": "s",
12
+ "mean": 0.05782990103925586,
13
+ "stdev": 0.0005964412042560866,
14
  "values": [
15
+ 0.06358777618408203,
16
+ 0.06096588897705078,
17
+ 0.05835059356689453,
18
+ 0.05796454238891602,
19
+ 0.06010879898071289,
20
+ 0.05883596801757812,
21
+ 0.05797478485107422,
22
+ 0.057490432739257816,
23
+ 0.058055679321289064,
24
+ 0.057474048614501956,
25
+ 0.05794508743286133,
26
+ 0.057530399322509765,
27
+ 0.058011646270751956,
28
+ 0.057504768371582034,
29
+ 0.05803519821166992,
30
+ 0.05745471954345703,
31
+ 0.058103809356689455,
32
+ 0.05746585464477539,
33
+ 0.058008575439453126,
34
+ 0.05751603317260742,
35
+ 0.05798297500610351,
36
+ 0.05747711944580078,
37
+ 0.05790617752075195,
38
+ 0.05746585464477539,
39
+ 0.05800755310058594,
40
+ 0.057613311767578126,
41
+ 0.05802905654907226,
42
+ 0.057499870300292966,
43
+ 0.0579317741394043,
44
+ 0.057447425842285155,
45
+ 0.05799628829956055,
46
+ 0.057475070953369144,
47
+ 0.05798297500610351,
48
+ 0.05747097778320313,
49
+ 0.05802598571777344,
50
+ 0.05750886535644531,
51
+ 0.057940990447998046,
52
+ 0.05746790313720703,
53
+ 0.057981952667236325,
54
+ 0.05747945785522461,
55
+ 0.05788671875,
56
+ 0.05744144058227539,
57
+ 0.057985023498535154,
58
+ 0.05744435119628906,
59
+ 0.05794406509399414,
60
+ 0.057447425842285155,
61
+ 0.05793382263183594,
62
+ 0.05748223876953125,
63
+ 0.05795635223388672,
64
+ 0.05742601776123047,
65
+ 0.05796761703491211,
66
+ 0.05755392074584961,
67
+ 0.057981952667236325,
68
+ 0.05740851211547852,
69
+ 0.05795123291015625,
70
+ 0.05747097778320313,
71
+ 0.05796761703491211,
72
+ 0.05746905517578125,
73
+ 0.05791846466064453,
74
+ 0.057673728942871094,
75
+ 0.0579317741394043,
76
+ 0.05744876861572266,
77
  0.058031105041503904,
78
+ 0.05749657440185547,
79
+ 0.058363903045654295,
80
+ 0.05752627182006836,
81
+ 0.05801062393188477,
82
+ 0.0574730224609375,
83
+ 0.0579317741394043,
84
+ 0.05747817611694336,
85
+ 0.05791846466064453,
86
+ 0.05748534393310547,
87
+ 0.05795840072631836,
88
+ 0.05748428726196289,
89
+ 0.05795328140258789,
90
+ 0.05747711944580078,
91
+ 0.0579317741394043,
92
+ 0.05742182540893555,
93
+ 0.05800447845458984,
94
+ 0.05746380615234375,
95
+ 0.05791743850708008,
96
+ 0.057507839202880856,
97
+ 0.05794713592529297,
98
+ 0.05748428726196289,
99
+ 0.057913345336914064,
100
+ 0.05747711944580078,
101
+ 0.05811404800415039,
102
+ 0.05752115249633789,
103
+ 0.05795123291015625,
104
+ 0.05747609710693359,
105
+ 0.05806182479858398,
106
+ 0.057431041717529295,
107
+ 0.058003551483154295,
108
+ 0.057504768371582034,
109
+ 0.05822873687744141,
110
+ 0.05754470443725586,
111
+ 0.057981952667236325,
112
+ 0.05751193618774414,
113
+ 0.057957374572753906,
114
+ 0.057504768371582034,
115
+ 0.05802598571777344,
116
+ 0.05748428726196289,
117
+ 0.05797785568237305,
118
+ 0.05748428726196289,
119
+ 0.05798912048339844,
120
+ 0.05749248123168945,
121
+ 0.05801369476318359,
122
+ 0.057491455078125,
123
+ 0.0580055046081543,
124
+ 0.05748735809326172,
125
+ 0.05794815826416016,
126
+ 0.05745356750488281,
127
+ 0.057985023498535154,
128
+ 0.05748121643066406,
129
+ 0.05798092651367188,
130
+ 0.05744947052001953,
131
+ 0.05799935913085937,
132
+ 0.05751910400390625,
133
  0.058054656982421876,
134
+ 0.05749862289428711,
135
+ 0.05798912048339844,
136
+ 0.057724929809570315,
137
+ 0.058025054931640625,
138
+ 0.05746380615234375,
139
+ 0.05796147155761719,
140
+ 0.05753753662109375,
141
+ 0.058057727813720705,
142
+ 0.05752217483520508,
143
+ 0.05796044921875,
144
+ 0.05764198303222656,
145
+ 0.05800960159301758,
146
+ 0.05755904006958008,
147
+ 0.05798096084594727,
148
+ 0.05750374221801758,
149
+ 0.05801369476318359,
150
+ 0.057490432739257816,
151
+ 0.05797683334350586,
152
+ 0.05748633575439453,
153
+ 0.05793088150024414,
154
+ 0.05748553466796875,
155
+ 0.058016769409179686,
156
+ 0.05753548812866211,
157
+ 0.058022911071777344,
158
+ 0.057499870300292966,
159
+ 0.058057727813720705,
160
+ 0.057475070953369144,
161
+ 0.05803007888793945,
162
+ 0.05758771133422851,
163
+ 0.057985023498535154,
164
+ 0.05752115249633789,
165
+ 0.05801574325561523,
166
+ 0.05750681686401367,
167
+ 0.05796454238891602,
168
+ 0.05759078216552734,
 
 
 
 
169
  0.05802598571777344,
170
+ 0.05755084609985352,
171
+ 0.05821440124511719,
172
+ 0.057540607452392575,
173
+ 0.05798400115966797,
174
+ 0.057490432739257816,
175
+ 0.05804646301269531,
176
+ 0.057545726776123046,
177
+ 0.05795644760131836,
178
+ 0.057491455078125,
179
+ 0.058218494415283206,
180
+ 0.057534465789794924,
181
+ 0.05807308959960938,
182
+ 0.05757952117919922,
183
+ 0.058028030395507815,
184
+ 0.05753548812866211,
185
  0.05803212738037109,
186
+ 0.05754982376098633,
187
+ 0.05800447845458984
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
188
  ]
189
  },
190
  "throughput": {
191
  "unit": "tokens/s",
192
+ "value": 4426.775688691273
193
  },
194
  "energy": null,
195
  "efficiency": null
 
197
  "decode": {
198
  "memory": {
199
  "unit": "MB",
200
+ "max_ram": 2521.706496,
201
  "max_vram": 5710.544896,
202
  "max_reserved": 5226.102784,
203
  "max_allocated": 4911.274496
204
  },
205
  "latency": {
206
  "unit": "s",
207
+ "mean": 8.440941043853758,
208
+ "stdev": 0.011413997650144836,
209
  "values": [
210
+ 8.452355041503903,
211
+ 8.429527046203614
212
  ]
213
  },
214
  "throughput": {
215
  "unit": "tokens/s",
216
+ "value": 30.20990179592326
217
  },
218
  "energy": null,
219
  "efficiency": null
 
222
  "memory": null,
223
  "latency": {
224
  "unit": "s",
225
+ "mean": 0.03310172958374023,
226
+ "stdev": 0.00021079061247777177,
227
  "values": [
228
+ 0.03572844696044922,
229
+ 0.035100608825683596,
230
+ 0.03332723236083984,
231
+ 0.033161407470703126,
232
+ 0.03317523193359375,
233
+ 0.03329228973388672,
234
+ 0.03314790344238281,
235
+ 0.033102848052978515,
236
+ 0.033140735626220705,
237
+ 0.0331387825012207,
238
+ 0.0332327995300293,
239
+ 0.033122337341308594,
240
+ 0.03316016006469726,
241
+ 0.03321548843383789,
242
+ 0.03321651077270508,
243
+ 0.03313151931762695,
244
+ 0.033123615264892575,
245
+ 0.03307388687133789,
246
+ 0.03308544158935547,
247
+ 0.03306291198730469,
248
+ 0.033051647186279294,
249
+ 0.033107967376708985,
250
+ 0.03318374252319336,
251
+ 0.03298406219482422,
252
+ 0.03306496047973633,
253
+ 0.032949249267578126,
254
+ 0.03324415969848633,
255
+ 0.03315507125854492,
256
+ 0.033086463928222655,
257
+ 0.033476608276367184,
258
+ 0.03312639999389649,
259
+ 0.03313663864135742,
260
+ 0.03316838455200195,
261
+ 0.03322470474243164,
262
+ 0.03312947082519531,
263
+ 0.033007614135742186,
264
+ 0.033124351501464845,
265
+ 0.0332492790222168,
266
+ 0.03316428756713867,
267
+ 0.033317886352539065,
268
+ 0.033315040588378905,
269
+ 0.033176353454589844,
270
+ 0.03321036911010742,
271
+ 0.033285247802734376,
272
+ 0.033796993255615235,
273
+ 0.033329151153564454,
274
+ 0.03318067169189453,
275
+ 0.03320729446411133,
276
+ 0.03332505416870117,
277
+ 0.03320012664794922,
278
+ 0.03318374252319336,
279
+ 0.03324415969848633,
280
+ 0.03316438293457031,
281
+ 0.033195934295654296,
282
+ 0.03311820983886719,
283
+ 0.03318374252319336,
284
+ 0.03317452621459961,
285
+ 0.03331379318237305,
286
+ 0.03316249465942383,
287
+ 0.03321932983398437,
288
+ 0.033314815521240236,
289
+ 0.03326976013183594,
290
+ 0.033185791015625,
291
+ 0.033154048919677735,
292
+ 0.03321343994140625,
293
+ 0.03322163009643555,
294
+ 0.03335168075561523,
295
+ 0.03324006271362305,
296
+ 0.033123390197753906,
297
+ 0.03322463989257812,
298
+ 0.033182880401611325,
299
+ 0.03321225738525391,
300
+ 0.03322675323486328,
301
+ 0.03322367858886719,
302
+ 0.033095745086669924,
303
+ 0.033196990966796874,
304
+ 0.03314995193481445,
305
+ 0.0331960334777832,
306
+ 0.033209598541259766,
307
+ 0.033299198150634764,
308
+ 0.03322470474243164,
309
+ 0.03321241760253906,
310
+ 0.03313663864135742,
311
+ 0.03336294555664063,
312
+ 0.033037441253662106,
313
+ 0.03419123077392578,
314
+ 0.03421500778198242,
315
+ 0.033410976409912106,
316
+ 0.033175743103027344,
317
+ 0.03322457504272461,
318
+ 0.033476768493652345,
319
+ 0.03319180679321289,
320
+ 0.033048480987548826,
321
+ 0.03319091033935547,
322
+ 0.033099777221679685,
323
+ 0.03322473526000977,
324
+ 0.03324105453491211,
325
+ 0.03316326522827148,
326
+ 0.03314176177978516,
327
+ 0.033277950286865234,
328
+ 0.03313868713378906,
329
+ 0.03322272109985352,
330
+ 0.03307513427734375,
331
+ 0.033260543823242186,
332
+ 0.03368038558959961,
333
+ 0.03302297592163086,
334
+ 0.033067008972167966,
335
+ 0.033122337341308594,
336
+ 0.033328094482421876,
337
+ 0.033113086700439456,
338
+ 0.03310079956054687,
339
+ 0.033173503875732424,
340
+ 0.0330967025756836,
341
+ 0.03319529724121094,
342
+ 0.033060577392578124,
343
+ 0.03325459289550781,
344
+ 0.033119041442871096,
345
+ 0.03300454330444336,
346
+ 0.03299532699584961,
347
+ 0.03313049697875976,
348
+ 0.03316326522827148,
349
+ 0.032993377685546874,
350
+ 0.03323587036132813,
351
+ 0.03308441543579101,
352
+ 0.03307443237304687,
353
+ 0.033071872711181644,
354
+ 0.03312134552001953,
355
+ 0.032997310638427736,
356
+ 0.033071392059326174,
357
+ 0.0330206413269043,
358
+ 0.03294230270385742,
359
+ 0.03292649459838867,
360
+ 0.03303936004638672,
361
+ 0.03300249481201172,
362
+ 0.03306393432617188,
363
+ 0.03303123092651367,
364
+ 0.0329420166015625,
365
+ 0.03299343872070312,
366
+ 0.033041248321533205,
367
+ 0.033091583251953126,
368
+ 0.03301375961303711,
369
+ 0.03321654510498047,
370
+ 0.03327587127685547,
371
+ 0.032876544952392575,
372
+ 0.033081344604492184,
373
+ 0.03303628921508789,
374
+ 0.03301068878173828,
375
+ 0.03292876815795898,
376
+ 0.03303644943237305,
377
+ 0.03296649551391601,
378
+ 0.03305984115600586,
379
+ 0.033483966827392575,
380
+ 0.033032222747802736,
381
+ 0.032884513854980466,
382
+ 0.032895999908447264,
383
+ 0.032985183715820314,
384
+ 0.032986015319824216,
385
+ 0.032955390930175785,
386
+ 0.032912384033203124,
387
+ 0.033081344604492184,
388
+ 0.03307724761962891,
389
+ 0.03327199935913086,
390
+ 0.033079105377197264,
391
+ 0.03313779067993164,
392
+ 0.033027008056640626,
393
+ 0.033469375610351564,
394
+ 0.03287756729125976,
395
+ 0.03308748626708984,
396
+ 0.03295235061645508,
397
+ 0.033172447204589846,
398
+ 0.03306393432617188,
399
+ 0.0331141128540039,
400
+ 0.032939006805419925,
401
+ 0.03323289489746094,
402
+ 0.03303535842895508,
403
+ 0.03311196899414062,
404
+ 0.032935935974121096,
405
+ 0.033086463928222655,
406
+ 0.03290828704833984,
407
+ 0.032909313201904294,
408
+ 0.03294630432128906,
409
+ 0.032944000244140625,
410
+ 0.032927745819091796,
411
+ 0.03303760147094727,
412
+ 0.03321929550170898,
413
+ 0.033099777221679685,
414
+ 0.033108192443847655,
415
+ 0.03321628952026367,
416
+ 0.03309363174438477,
417
+ 0.03308236694335937,
418
+ 0.03294416046142578,
419
+ 0.0331366081237793,
420
+ 0.03298406219482422,
421
+ 0.03304550552368164,
422
+ 0.033030208587646485,
423
+ 0.03293689727783203,
424
+ 0.03298099136352539,
425
+ 0.03285094451904297,
426
+ 0.03304457473754883,
427
+ 0.0329901123046875,
428
+ 0.033124351501464845,
429
+ 0.03314191818237305,
430
+ 0.03306275177001953,
431
+ 0.03311513519287109,
432
+ 0.03307212829589844,
433
+ 0.033007614135742186,
434
+ 0.03311513519287109,
435
+ 0.033165313720703124,
436
+ 0.033040382385253905,
437
+ 0.03298611068725586,
438
+ 0.03293491363525391,
439
+ 0.03302822494506836,
440
+ 0.03345292663574219,
441
+ 0.03327907180786133,
442
+ 0.03291638565063477,
443
+ 0.033116161346435545,
444
+ 0.032914432525634765,
445
+ 0.033037311553955076,
446
+ 0.03298918533325195,
447
+ 0.033058815002441407,
448
+ 0.032919551849365236,
449
+ 0.033051647186279294,
450
+ 0.03299964904785156,
451
+ 0.03303094482421875,
452
+ 0.03297075271606445,
453
+ 0.03306086349487305,
454
+ 0.03337420654296875,
455
+ 0.033068031311035154,
456
+ 0.0329431037902832,
457
+ 0.03307827377319336,
458
+ 0.03304857635498047,
459
+ 0.03309372711181641,
460
+ 0.03320412826538086,
461
+ 0.033113086700439456,
462
+ 0.033181697845458984,
463
+ 0.03314710235595703,
464
+ 0.033155902862548825,
465
+ 0.03309580612182617,
466
+ 0.03299833679199219,
467
+ 0.03306691360473633,
468
+ 0.03307417678833008,
469
+ 0.0330885124206543,
470
+ 0.03295654296875,
471
+ 0.033167232513427736,
472
+ 0.03298611068725586,
473
+ 0.03306601715087891,
474
+ 0.03310895919799805,
475
+ 0.03291033554077148,
476
+ 0.03291340637207031,
477
+ 0.033197246551513675,
478
+ 0.033151809692382815,
479
+ 0.03296672058105469,
480
+ 0.03305161666870117,
481
+ 0.03302601623535156,
482
+ 0.03341107177734375,
483
+ 0.0331673583984375,
484
+ 0.03307724761962891,
485
+ 0.033185791015625,
486
+ 0.033075199127197266,
487
+ 0.032939006805419925,
488
+ 0.03308031845092774,
489
+ 0.0333240966796875,
490
+ 0.03308230209350586,
491
+ 0.03307929611206055,
492
+ 0.03302604675292969,
493
+ 0.03306086349487305,
494
+ 0.03299225616455078,
495
+ 0.033046817779541014,
496
+ 0.0331363525390625,
497
+ 0.033320960998535154,
498
+ 0.03310079956054687,
499
+ 0.033565696716308595,
500
+ 0.033091808319091795,
501
+ 0.033137439727783206,
502
+ 0.03304959869384766,
503
+ 0.033058815002441407,
504
+ 0.033068031311035154,
505
+ 0.03316633605957031,
506
+ 0.0330618896484375,
507
+ 0.03309081649780273,
508
+ 0.03296128082275391,
509
+ 0.03320832061767578,
510
+ 0.03308441543579101,
511
+ 0.0332861442565918,
512
+ 0.03323904037475586,
513
+ 0.03363942337036133,
514
+ 0.033037311553955076,
515
+ 0.03306598281860352,
516
+ 0.03304579162597656,
517
+ 0.03302883148193359,
518
+ 0.03300966262817383,
519
+ 0.0331776008605957,
520
+ 0.032996353149414064,
521
+ 0.033170433044433595,
522
+ 0.033067230224609376,
523
+ 0.03310160064697266,
524
+ 0.03306528091430664,
525
+ 0.033051326751708986,
526
+ 0.03304345703125,
527
+ 0.033067008972167966,
528
+ 0.033113086700439456,
529
+ 0.03313663864135742,
530
+ 0.03306496047973633,
531
+ 0.03307628631591797,
532
+ 0.03310688018798828,
533
+ 0.0332042236328125,
534
+ 0.033149185180664065,
535
+ 0.03320499038696289,
536
+ 0.033081375122070315,
537
+ 0.03317679977416992,
538
+ 0.03298892974853516,
539
+ 0.03305472183227539,
540
+ 0.03310182571411133,
541
+ 0.03306496047973633,
542
+ 0.03302707290649414,
543
+ 0.03310182571411133,
544
+ 0.03304652786254883,
545
+ 0.03307622528076172,
546
+ 0.03299737548828125,
547
+ 0.033175552368164066,
548
+ 0.0331776008605957,
549
+ 0.0331141128540039,
550
+ 0.03305267333984375,
551
+ 0.03300966262817383,
552
+ 0.033143806457519534,
553
+ 0.03303734588623047,
554
+ 0.03301801681518555,
555
+ 0.03318764877319336,
556
+ 0.03318067169189453,
557
+ 0.03320217514038086,
558
+ 0.033108192443847655,
559
+ 0.03315894317626953,
560
+ 0.03373673629760742,
561
+ 0.03318268966674805,
562
+ 0.033173503875732424,
563
+ 0.033205249786376956,
564
+ 0.03317891311645508,
565
+ 0.03320291137695312,
566
+ 0.03308236694335937,
567
+ 0.0331069450378418,
568
+ 0.03297814559936523,
569
+ 0.033092384338378904,
570
+ 0.032952320098876955,
571
+ 0.03308441543579101,
572
+ 0.033097793579101566,
573
+ 0.033175487518310544,
574
+ 0.03356159973144531,
575
+ 0.03320012664794922,
576
+ 0.03310182571411133,
577
+ 0.03315814590454102,
578
+ 0.03322060775756836,
579
+ 0.0331673583984375,
580
+ 0.03310079956054687,
581
+ 0.033051647186279294,
582
+ 0.03307334518432617,
583
+ 0.033067840576171875,
584
+ 0.0331409912109375,
585
+ 0.0331220474243164,
586
+ 0.033089534759521484,
587
+ 0.033050624847412106,
588
+ 0.033097728729248044,
589
+ 0.033023998260498046,
590
+ 0.03313356781005859,
591
+ 0.032981056213378906,
592
+ 0.03310995101928711,
593
+ 0.03301171112060547,
594
+ 0.03317046356201172,
595
+ 0.03301577758789063,
596
+ 0.03308348846435547,
597
+ 0.033062816619873044,
598
+ 0.03309283065795898,
599
+ 0.03302889633178711,
600
+ 0.03303936004638672,
601
+ 0.03303424072265625,
602
+ 0.03306905746459961,
603
+ 0.03305779266357422,
604
+ 0.03301171112060547,
605
+ 0.03303219223022461,
606
+ 0.03308748626708984,
607
+ 0.03295129776000977,
608
+ 0.03302912139892578,
609
+ 0.03304652786254883,
610
+ 0.0329238395690918,
611
+ 0.033054527282714845,
612
+ 0.03309363174438477,
613
+ 0.032879615783691404,
614
+ 0.032865409851074216,
615
+ 0.0330463981628418,
616
+ 0.032925918579101564,
617
+ 0.03297257614135742,
618
+ 0.03290726470947265,
619
+ 0.03301593780517578,
620
+ 0.032984031677246096,
621
+ 0.03342959976196289,
622
+ 0.032863040924072266,
623
+ 0.03292364883422851,
624
+ 0.03295948791503906,
625
+ 0.03286220932006836,
626
+ 0.03288576126098633,
627
+ 0.03292876815795898,
628
+ 0.03298611068725586,
629
+ 0.033123519897460936,
630
+ 0.032947200775146485,
631
+ 0.03296553421020508,
632
+ 0.03312015914916992,
633
+ 0.033159168243408206,
634
+ 0.03298713684082031,
635
+ 0.03338854217529297,
636
+ 0.032838878631591795,
637
+ 0.03298502349853515,
638
+ 0.03306480026245117,
639
+ 0.03301200103759765,
640
+ 0.03290083312988281,
641
+ 0.032909313201904294,
642
+ 0.032974048614501955,
643
+ 0.03303504180908203,
644
+ 0.032996353149414064,
645
+ 0.032892929077148435,
646
+ 0.0328172492980957,
647
+ 0.03301279830932617,
648
+ 0.03296352005004883,
649
+ 0.03294198226928711,
650
+ 0.03305574417114258,
651
+ 0.03306905746459961,
652
+ 0.033056766510009765,
653
+ 0.03306291198730469,
654
+ 0.03307724761962891,
655
+ 0.033140960693359374,
656
+ 0.033064735412597655,
657
+ 0.03323104095458984,
658
+ 0.032940097808837894,
659
+ 0.03315276718139649,
660
+ 0.03301273727416992,
661
+ 0.03298406219482422,
662
+ 0.03290009689331055,
663
+ 0.03299532699584961,
664
+ 0.03298303985595703,
665
+ 0.03297894287109375,
666
+ 0.03300873565673828,
667
+ 0.032878559112548826,
668
+ 0.03284883117675781,
669
+ 0.03292364883422851,
670
+ 0.032948513031005856,
671
+ 0.032984798431396484,
672
+ 0.033023998260498046,
673
+ 0.03298924636840821,
674
+ 0.03287340927124023,
675
+ 0.032911361694335936,
676
+ 0.03284400177001953,
677
+ 0.03291027069091797,
678
+ 0.033060703277587894,
679
+ 0.033124351501464845,
680
+ 0.03297382354736328,
681
+ 0.03303014373779297,
682
+ 0.03348992156982422,
683
+ 0.03299235153198242,
684
+ 0.033053791046142575,
685
+ 0.03306399917602539,
686
+ 0.032955135345458984,
687
+ 0.032991359710693356,
688
+ 0.032892799377441405,
689
+ 0.0329881591796875,
690
+ 0.03290828704833984,
691
+ 0.03292160034179688,
692
+ 0.03300454330444336,
693
+ 0.033035263061523434,
694
+ 0.033078369140625,
695
+ 0.03300649642944336,
696
+ 0.03344086456298828,
697
+ 0.033134559631347656,
698
+ 0.03300755310058594,
699
+ 0.03307929611206055,
700
+ 0.033031169891357424,
701
+ 0.032952320098876955,
702
+ 0.033089534759521484,
703
+ 0.03298918533325195,
704
+ 0.032939006805419925,
705
+ 0.032966655731201173,
706
+ 0.03299430465698242,
707
+ 0.03299356842041016,
708
+ 0.033051361083984376,
709
+ 0.033113086700439456,
710
+ 0.03297689437866211,
711
+ 0.03301171112060547,
712
+ 0.03291862487792969,
713
+ 0.03299523162841797,
714
+ 0.03288371276855469,
715
+ 0.03292876815795898,
716
+ 0.033075199127197266,
717
+ 0.032998401641845705,
718
+ 0.03321651077270508,
719
+ 0.03300352096557617,
720
+ 0.0330250244140625,
721
+ 0.033081344604492184,
722
+ 0.03307724761962891,
723
+ 0.033104896545410156,
724
+ 0.032911361694335936,
725
+ 0.03300864028930664,
726
+ 0.03287142562866211,
727
+ 0.0329483528137207,
728
+ 0.03305571365356445,
729
+ 0.03292559814453125,
730
+ 0.032968704223632815,
731
+ 0.03297689437866211,
732
+ 0.03288576126098633,
733
+ 0.033040382385253905,
734
+ 0.032901119232177735,
735
+ 0.03300044631958008,
736
+ 0.0329543685913086,
737
+ 0.032833534240722655
738
  ]
739
  },
740
  "throughput": {
741
  "unit": "tokens/s",
742
+ "value": 30.209901795923255
743
  },
744
  "energy": null,
745
  "efficiency": null