Spaces:

Bias-Leaderboard
/

leaderboard

Sleeping

meg-huggingface commited on Jan 18

Commit

3b2722d

•

1 Parent(s): 971bce4

Adding CPU (float32) support

Files changed (2) hide show

scripts/create_request_file.py CHANGED Viewed

@@ -12,7 +12,7 @@ from src.envs import TOKEN
 EVAL_REQUESTS_PATH = "eval-queue"
 QUEUE_REPO = "open-llm-leaderboard/requests"
-precisions = ("float16", "bfloat16", "8bit (LLM.int8)", "4bit (QLoRA / FP4)", "GPTQ")
 model_types = ("pretrained", "fine-tuned", "RL-tuned", "instruction-tuned")
 weight_types = ("Original", "Delta", "Adapter")

 EVAL_REQUESTS_PATH = "eval-queue"
 QUEUE_REPO = "open-llm-leaderboard/requests"
+precisions = ("float16", "bfloat16", "8bit (LLM.int8)", "4bit (QLoRA / FP4)", "GPTQ", "float32")
 model_types = ("pretrained", "fine-tuned", "RL-tuned", "instruction-tuned")
 weight_types = ("Original", "Delta", "Adapter")

src/backend/manage_requests.py CHANGED Viewed

@@ -26,7 +26,7 @@ class EvalRequest:
     def get_model_args(self):
         model_args = f"pretrained={self.model},revision={self.revision}"
-        if self.precision in ["float16", "bfloat16"]:
             model_args += f",dtype={self.precision}"
         # Quantized models need some added config, the install of bits and bytes, etc
         #elif self.precision == "8bit":

     def get_model_args(self):
         model_args = f"pretrained={self.model},revision={self.revision}"
+        if self.precision in ["float16", "bfloat16", "float32"]:
             model_args += f",dtype={self.precision}"
         # Quantized models need some added config, the install of bits and bytes, etc
         #elif self.precision == "8bit":