Spaces:

arcee-ai
/

Benchmarks

Running

App Files Files Community

Julien Simon commited on Sep 4

Commit

9f46468

•

1 Parent(s): 0c0f086

Fix N/A values

Browse files

Files changed (2) hide show

app.py +10 -5
results_llama_spark.py +10 -0

app.py CHANGED Viewed

@@ -9,7 +9,7 @@ import re
 import gradio as gr
 import pandas as pd
-from results import results
 logging.basicConfig(level=logging.DEBUG)
@@ -107,14 +107,19 @@ def display_results(model_name):
                     cloud = config.get("cloud", "N/A")
                     instance_type = config.get("instanceType", "N/A")
                     if "configurations" in config:
                         for nested_config in config["configurations"]:
                             data.append(
                                 {
                                     "Cloud": cloud,
                                     "Instance Type": instance_type,
-                                    "GPU": config.get("gpu", "N/A"),
-                                    "GPU RAM": config.get("gpuRAM", "N/A"),
                                     "Status": nested_config.get("status", "N/A"),
                                     "Quantization": nested_config.get(
                                         "quantization", "N/A"
@@ -134,8 +139,8 @@ def display_results(model_name):
                             {
                                 "Cloud": cloud,
                                 "Instance Type": instance_type,
-                                "GPU": config.get("gpu", "N/A"),
-                                "GPU RAM": config.get("gpuRAM", "N/A"),
                                 "Status": config.get("status", "N/A"),
                                 "Quantization": config.get("quantization", "N/A"),
                                 "Container": config.get(

 import gradio as gr
 import pandas as pd
+from results import instance_type_mappings, results
 logging.basicConfig(level=logging.DEBUG)
                     cloud = config.get("cloud", "N/A")
                     instance_type = config.get("instanceType", "N/A")
+                    # Fetch GPU and GPU RAM information from instance_type_mappings
+                    instance_info = instance_type_mappings.get(instance_type, {})
+                    gpu = instance_info.get("gpu", "N/A")
+                    gpu_ram = instance_info.get("gpuRAM", "N/A")
                     if "configurations" in config:
                         for nested_config in config["configurations"]:
                             data.append(
                                 {
                                     "Cloud": cloud,
                                     "Instance Type": instance_type,
+                                    "GPU": gpu,
+                                    "GPU RAM": gpu_ram,
                                     "Status": nested_config.get("status", "N/A"),
                                     "Quantization": nested_config.get(
                                         "quantization", "N/A"
                             {
                                 "Cloud": cloud,
                                 "Instance Type": instance_type,
+                                "GPU": gpu,
+                                "GPU RAM": gpu_ram,
                                 "Status": config.get("status", "N/A"),
                                 "Quantization": config.get("quantization", "N/A"),
                                 "Container": config.get(

results_llama_spark.py CHANGED Viewed

@@ -54,6 +54,16 @@ results_llama_spark = {
                 {"container": "vLLM 0.5.5", "tokensPerSecond": "43.4"},
             ],
         },
         {
             "instanceType": "p4d.24xlarge",
             "quantization": "none",

                 {"container": "vLLM 0.5.5", "tokensPerSecond": "43.4"},
             ],
         },
+        {
+            "instanceType": "g6e.12xlarge",
+            "quantization": "none",
+            "status": "OK",
+            "configurations": [
+                {"container": "TGI 2.2.0", "tokensPerSecond": "112"},
+                {"container": "SGLang 0.2.13", "tokensPerSecond": "123"},
+                {"container": "vLLM 0.5.5", "tokensPerSecond": "106"},
+            ],
+        },
         {
             "instanceType": "p4d.24xlarge",
             "quantization": "none",