ibm-granite
/

granite-3.0-3b-a800m-instruct

@@ -12,8 +12,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: instruction-following
-        name: IFEval
     metrics:
     - name: pass@1
       type: pass@1
@@ -22,8 +22,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: instruction-following
-        name: MT-Bench
     metrics:
     - name: pass@1
       type: pass@1
@@ -32,18 +32,18 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: human-exams
-        name: AGI-Eval
     metrics:
     - name: pass@1
       type: pass@1
-      value: 25.70
       veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: human-exams
-        name: MMLU
     metrics:
     - name: pass@1
       type: pass@1
@@ -52,8 +52,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: human-exams
-        name: MMLU-Pro
     metrics:
     - name: pass@1
       type: pass@1
@@ -62,18 +62,18 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: OBQA
     metrics:
     - name: pass@1
       type: pass@1
-      value: 40.80
       veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: SIQA
     metrics:
     - name: pass@1
       type: pass@1
@@ -82,8 +82,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: Hellaswag
     metrics:
     - name: pass@1
       type: pass@1
@@ -92,8 +92,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: WinoGrande
     metrics:
     - name: pass@1
       type: pass@1
@@ -102,18 +102,18 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: commonsense
-        name: TruthfulQA
     metrics:
     - name: pass@1
       type: pass@1
-      value: 48.00
       veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: reading-comprehension
-        name: BoolQ
     metrics:
     - name: pass@1
       type: pass@1
@@ -122,8 +122,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: reading-comprehension
-        name: SQuAD 2.0
     metrics:
     - name: pass@1
       type: pass@1
@@ -132,8 +132,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: reasoning
-        name: ARC-C
     metrics:
     - name: pass@1
       type: pass@1
@@ -142,8 +142,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: reasoning
-        name: GPQA
     metrics:
     - name: pass@1
       type: pass@1
@@ -152,18 +152,18 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: reasoning
-        name: BBH
     metrics:
     - name: pass@1
       type: pass@1
-      value: 37.70
       veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: code
-        name: HumanEvalSynthesis
     metrics:
     - name: pass@1
       type: pass@1
@@ -172,8 +172,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: code
-        name: HumanEvalExplain
     metrics:
     - name: pass@1
       type: pass@1
@@ -182,8 +182,8 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: code
-        name: HumanEvalFix
     metrics:
     - name: pass@1
       type: pass@1
@@ -192,53 +192,55 @@ model-index:
   - task:
       type: text-generation
     dataset:
-        type: code
-        name: MBPP
     metrics:
     - name: pass@1
       type: pass@1
-      value: 27.40
-      veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: math
-        name: GSM8K
     metrics:
     - name: pass@1
       type: pass@1
       value: 47.54
-      veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: math
-        name: MATH
     metrics:
     - name: pass@1
       type: pass@1
       value: 19.86
-      veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: multilingual
-        name: PAWS-X (7 langs)
     metrics:
     - name: pass@1
       type: pass@1
       value: 50.23
-      veriefied: false
   - task:
       type: text-generation
     dataset:
-        type: multilingual
-        name: MGSM (6 langs)
     metrics:
     - name: pass@1
       type: pass@1
       value: 28.87
-      veriefied: false
 ---
 <!-- ![image/png](https://cdn-uploads.huggingface.co/production/uploads/62cd5057674cdb524450093d/1hzxoPwqkBJXshKVVe6_9.png) -->

   - task:
       type: text-generation
     dataset:
+      type: instruction-following
+      name: IFEval
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: instruction-following
+      name: MT-Bench
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: human-exams
+      name: AGI-Eval
     metrics:
     - name: pass@1
       type: pass@1
+      value: 25.7
       veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: human-exams
+      name: MMLU
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: human-exams
+      name: MMLU-Pro
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: OBQA
     metrics:
     - name: pass@1
       type: pass@1
+      value: 40.8
       veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: SIQA
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: Hellaswag
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: WinoGrande
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: commonsense
+      name: TruthfulQA
     metrics:
     - name: pass@1
       type: pass@1
+      value: 48
       veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: reading-comprehension
+      name: BoolQ
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: reading-comprehension
+      name: SQuAD 2.0
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: reasoning
+      name: ARC-C
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: reasoning
+      name: GPQA
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: reasoning
+      name: BBH
     metrics:
     - name: pass@1
       type: pass@1
+      value: 37.7
       veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: code
+      name: HumanEvalSynthesis
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: code
+      name: HumanEvalExplain
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: code
+      name: HumanEvalFix
     metrics:
     - name: pass@1
       type: pass@1
   - task:
       type: text-generation
     dataset:
+      type: code
+      name: MBPP
     metrics:
     - name: pass@1
       type: pass@1
+      value: 27.4
+      veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: math
+      name: GSM8K
     metrics:
     - name: pass@1
       type: pass@1
       value: 47.54
+      veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: math
+      name: MATH
     metrics:
     - name: pass@1
       type: pass@1
       value: 19.86
+      veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: multilingual
+      name: PAWS-X (7 langs)
     metrics:
     - name: pass@1
       type: pass@1
       value: 50.23
+      veriefied: false
   - task:
       type: text-generation
     dataset:
+      type: multilingual
+      name: MGSM (6 langs)
     metrics:
     - name: pass@1
       type: pass@1
       value: 28.87
+      veriefied: false
+base_model:
+- ibm-granite/granite-3.0-3b-a800m-base
 ---
 <!-- ![image/png](https://cdn-uploads.huggingface.co/production/uploads/62cd5057674cdb524450093d/1hzxoPwqkBJXshKVVe6_9.png) -->