Spaces:
Running
on
CPU Upgrade
Running
on
CPU Upgrade
Upload app.py
Browse files
app.py
CHANGED
@@ -2,7 +2,7 @@ import gradio as gr
|
|
2 |
import pandas as pd
|
3 |
|
4 |
csv_filename = 'leaderboard.csv'
|
5 |
-
|
6 |
|
7 |
def get_data_classifica():
|
8 |
dataset = pd.read_csv("leaderboard_general.csv", sep=',')
|
@@ -10,7 +10,7 @@ def get_data_classifica():
|
|
10 |
dataset.rename(columns={'model ': 'model'}, inplace=True)
|
11 |
df_classifica = dataset[['model', 'helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']]
|
12 |
df_classifica['media'] = df_classifica[['helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']].mean(axis=1)
|
13 |
-
df_classifica['media'] = df_classifica['media'].round(
|
14 |
df_classifica = df_classifica.sort_values(by='media', ascending=False)
|
15 |
df_classifica = df_classifica[['model', 'media', 'helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']]
|
16 |
|
@@ -27,7 +27,7 @@ with gr.Blocks() as demo:
|
|
27 |
with gr.Tab('Classifica Generale'):
|
28 |
|
29 |
gr.Markdown('''# Classifica generale degli LLM italiani''')
|
30 |
-
discord_link = 'https://discord.
|
31 |
gr.Markdown('''
|
32 |
I modelli sottostanti sono stati testati con [lm_evaluation_harness](https://github.com/EleutherAI/lm-evaluation-harness) su task specifici per l'italiano introdotti con questa [PR](https://github.com/EleutherAI/lm-evaluation-harness/pull/1358).
|
33 |
L'intero progetto, i modelli e i dataset sono rigorosamente open source e tutti i risultati sono riproducibili lanciando dei comandi come questo:
|
@@ -68,9 +68,9 @@ with gr.Blocks() as demo:
|
|
68 |
|
69 |
form_link = "https://forms.gle/Gc9Dfu52xSBhQPpAA"
|
70 |
gr.Markdown('''# Community discord
|
71 |
-
Se vuoi contribuire al progetto o semplicemente unirti alla community di LLM italiani unisciti al nostro [discord!](https://discord.
|
72 |
# Aggiungi il tuo modello
|
73 |
-
Se hai sviluppato un tuo modello che vuoi far valutare, compila il form [qui](
|
74 |
''')
|
75 |
|
76 |
with gr.Tab('Sponsor'):
|
|
|
2 |
import pandas as pd
|
3 |
|
4 |
csv_filename = 'leaderboard.csv'
|
5 |
+
url = 'https://docs.google.com/spreadsheets/d/1Oh3nrbdWjKuh9twJsc9yJLppiJeD_BZyKgCTOxRkALM/export?format=csv'
|
6 |
|
7 |
def get_data_classifica():
|
8 |
dataset = pd.read_csv("leaderboard_general.csv", sep=',')
|
|
|
10 |
dataset.rename(columns={'model ': 'model'}, inplace=True)
|
11 |
df_classifica = dataset[['model', 'helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']]
|
12 |
df_classifica['media'] = df_classifica[['helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']].mean(axis=1)
|
13 |
+
df_classifica['media'] = df_classifica['media'].round(4)
|
14 |
df_classifica = df_classifica.sort_values(by='media', ascending=False)
|
15 |
df_classifica = df_classifica[['model', 'media', 'helloswag_it acc norm', 'arc_it acc norm', 'm_mmul acc shot 5']]
|
16 |
|
|
|
27 |
with gr.Tab('Classifica Generale'):
|
28 |
|
29 |
gr.Markdown('''# Classifica generale degli LLM italiani''')
|
30 |
+
discord_link = 'https://discord.com/invite/nfgaTG3H'
|
31 |
gr.Markdown('''
|
32 |
I modelli sottostanti sono stati testati con [lm_evaluation_harness](https://github.com/EleutherAI/lm-evaluation-harness) su task specifici per l'italiano introdotti con questa [PR](https://github.com/EleutherAI/lm-evaluation-harness/pull/1358).
|
33 |
L'intero progetto, i modelli e i dataset sono rigorosamente open source e tutti i risultati sono riproducibili lanciando dei comandi come questo:
|
|
|
68 |
|
69 |
form_link = "https://forms.gle/Gc9Dfu52xSBhQPpAA"
|
70 |
gr.Markdown('''# Community discord
|
71 |
+
Se vuoi contribuire al progetto o semplicemente unirti alla community di LLM italiani unisciti al nostro [discord!](https://discord.com/invite/nfgaTG3H)
|
72 |
# Aggiungi il tuo modello
|
73 |
+
Se hai sviluppato un tuo modello che vuoi far valutare, compila il form [qui]({form_link}) è tutto gratuito!
|
74 |
''')
|
75 |
|
76 |
with gr.Tab('Sponsor'):
|