OpenLLM-Ro
/

RoGemma2-9b-Instruct-2024-10-09

Safetensors

Romanian

gemma2

Eval Results

Model card Files Files and versions Community

mihaimasala commited on 30 days ago

Commit

f740b82

•

1 Parent(s): e123088

Update README.md

Browse files

Files changed (1) hide show

README.md +78 -4

README.md CHANGED Viewed

@@ -116,6 +116,24 @@ model-index:
             - name: Average macro-f1
               type: macro-f1
               value: 62.49
         - task:
             type: text-generation
           dataset:
@@ -134,6 +152,24 @@ model-index:
             - name: Average bleu
               type: bleu
               value: 23.16
         - task:
             type: text-generation
           dataset:
@@ -152,6 +188,24 @@ model-index:
             - name: Average f1
               type: f1
               value: 70.74
         - task:
             type: text-generation
           dataset:
@@ -170,6 +224,24 @@ model-index:
             - name: Average pearson
               type: pearson
               value: 77.10
         - task:
             type: text-generation
           dataset:
@@ -417,6 +489,7 @@ model-index:
               type: pearson
               value: 71.33
 ---
 # Model Card for Model ID
@@ -540,10 +613,10 @@ print(tokenizer.decode(outputs[0]))
 <td><center><strong>RO-EN<br>(Bleu)</strong></center>
 </tr>
 <tr>
-<td>gemma-2-9b-it</td><td><center>90.82</center></td><td><center>52.51</center></td><td><center>-</center></td><td><center>-</center></td><td><center>19.97</center></td><td><center><strong>28.94</strong></center></td><td><center>-</center></td><td><center>-</center></td>
 </tr>
 <tr>
-<td><em>RoGemma2-9b-Instruct-2024-10-09</em></td><td><center><em>96.19</em></center></td><td><center><em>62.49</em></center></td><td><center><em>-</em></center></td><td><center><em>-</em></center></td><td><center><em>25.74</em></center></td><td><center><em>23.16</em></center></td><td><center><em>-</em></center></td><td><center><em>-</em></center></td>
 </tr>
 <tr>
 <td>RoGemma2-9b-Instruct-DPO-2024-10-09</td><td><center><strong>97.74</strong></center></td><td><center><strong>67.40</strong></center></td><td><center>-</center></td><td><center>-</center></td><td><center><strong>27.32</strong></center></td><td><center>15.96</center></td><td><center>-</center></td><td><center>-</center></td>
@@ -578,10 +651,10 @@ print(tokenizer.decode(outputs[0]))
 <td><center><strong>(Pearson)</strong></center></td>
 </tr>
 <tr>
-<td>gemma-2-9b-it</td><td><center>37.56</center></td><td><center>57.48</center></td><td><center>-</center></td><td><center>-</center></td><td><center>71.39</center></td><td><center>71.73</center></td><td><center>-</center></td><td><center>-</center></td>
 </tr>
 <tr>
-<td><em>RoGemma2-9b-Instruct-2024-10-09</em></td><td><center><em><strong>51.37</strong></em></center></td><td><center><em><strong>70.74</strong></em></center></td><td><center><em>-</em></center></td><td><center><em>-</em></center></td><td><center><em>77.15</em></center></td><td><center><em>77.10</em></center></td><td><center><em>-</em></center></td><td><center><em>-</em></center></td>
 </tr>
 <tr>
 <td>RoGemma2-9b-Instruct-DPO-2024-10-09</td><td><center>32.42</center></td><td><center>58.68</center></td><td><center>-</center></td><td><center>-</center></td><td><center><strong>80.82</strong></center></td><td><center><strong>81.50</strong></center></td><td><center>-</center></td><td><center>-</center></td>
@@ -635,6 +708,7 @@ print(tokenizer.decode(outputs[0]))
 </tbody>
 </table>
 ## RoGemma2 Model Family
 | Model              | Link  |

             - name: Average macro-f1
               type: macro-f1
               value: 62.49
+        - task:
+            type: text-generation
+          dataset:
+            name: LaRoSeDa_binary_finetuned
+            type: LaRoSeDa_binary_finetuned
+          metrics:
+            - name: Average macro-f1
+              type: macro-f1
+              value: 98.93
+        - task:
+            type: text-generation
+          dataset:
+            name: LaRoSeDa_multiclass_finetuned
+            type: LaRoSeDa_multiclass_finetuned
+          metrics:
+            - name: Average macro-f1
+              type: macro-f1
+              value: 88.33
         - task:
             type: text-generation
           dataset:
             - name: Average bleu
               type: bleu
               value: 23.16
+        - task:
+            type: text-generation
+          dataset:
+            name: WMT_EN-RO_finetuned
+            type: WMT_EN-RO_finetuned
+          metrics:
+            - name: Average bleu
+              type: bleu
+              value: 28.43
+        - task:
+            type: text-generation
+          dataset:
+            name: WMT_RO-EN_finetuned
+            type: WMT_RO-EN_finetuned
+          metrics:
+            - name: Average bleu
+              type: bleu
+              value: 40.94
         - task:
             type: text-generation
           dataset:
             - name: Average f1
               type: f1
               value: 70.74
+        - task:
+            type: text-generation
+          dataset:
+            name: XQuAD_finetuned
+            type: XQuAD_finetuned
+          metrics:
+            - name: Average exact_match
+              type: exact_match
+              value: 50.00
+        - task:
+            type: text-generation
+          dataset:
+            name: XQuAD_finetuned
+            type: XQuAD_finetuned
+          metrics:
+            - name: Average f1
+              type: f1
+              value: 64.10
         - task:
             type: text-generation
           dataset:
             - name: Average pearson
               type: pearson
               value: 77.10
+        - task:
+            type: text-generation
+          dataset:
+            name: STS_finetuned
+            type: STS_finetuned
+          metrics:
+            - name: Average spearman
+              type: spearman
+              value: 89.45
+        - task:
+            type: text-generation
+          dataset:
+            name: STS_finetuned
+            type: STS_finetuned
+          metrics:
+            - name: Average pearson
+              type: pearson
+              value: 89.89
         - task:
             type: text-generation
           dataset:
               type: pearson
               value: 71.33
 ---
 # Model Card for Model ID
 <td><center><strong>RO-EN<br>(Bleu)</strong></center>
 </tr>
 <tr>
+<td>gemma-2-9b-it</td><td><center>90.82</center></td><td><center>52.51</center></td><td><center><strong>98.97</strong></center></td><td><center>86.02</center></td><td><center>19.97</center></td><td><center><strong>28.94</strong></center></td><td><center>27.94</center></td><td><center><strong>41.61</strong></center></td>
 </tr>
 <tr>
+<td><em>RoGemma2-9b-Instruct-2024-10-09</em></td><td><center><em>96.19</em></center></td><td><center><em>62.49</em></center></td><td><center><em>98.93</em></center></td><td><center><em><strong>88.33</strong></em></center></td><td><center><em>25.74</em></center></td><td><center><em>23.16</em></center></td><td><center><em><strong>28.43</strong></em></center></td><td><center><em>40.94</em></center></td>
 </tr>
 <tr>
 <td>RoGemma2-9b-Instruct-DPO-2024-10-09</td><td><center><strong>97.74</strong></center></td><td><center><strong>67.40</strong></center></td><td><center>-</center></td><td><center>-</center></td><td><center><strong>27.32</strong></center></td><td><center>15.96</center></td><td><center>-</center></td><td><center>-</center></td>
 <td><center><strong>(Pearson)</strong></center></td>
 </tr>
 <tr>
+<td>gemma-2-9b-it</td><td><center>37.56</center></td><td><center>57.48</center></td><td><center><strong>71.09</strong></center></td><td><center><strong>84.78</strong></center></td><td><center>71.39</center></td><td><center>71.73</center></td><td><center>89.07</center></td><td><center>89.29</center></td>
 </tr>
 <tr>
+<td><em>RoGemma2-9b-Instruct-2024-10-09</em></td><td><center><em><strong>51.37</strong></em></center></td><td><center><em><strong>70.74</strong></em></center></td><td><center><em>50.00</em></center></td><td><center><em>64.10</em></center></td><td><center><em>77.15</em></center></td><td><center><em>77.10</em></center></td><td><center><em><strong>89.45</strong></em></center></td><td><center><em><strong>89.89</strong></em></center></td>
 </tr>
 <tr>
 <td>RoGemma2-9b-Instruct-DPO-2024-10-09</td><td><center>32.42</center></td><td><center>58.68</center></td><td><center>-</center></td><td><center>-</center></td><td><center><strong>80.82</strong></center></td><td><center><strong>81.50</strong></center></td><td><center>-</center></td><td><center>-</center></td>
 </tbody>
 </table>
 ## RoGemma2 Model Family
 | Model              | Link  |