LLM_leaderboard / 通用语言能力排行榜-大模型裁判.csv
Li
Update 通用语言能力排行榜-大模型裁判.csv
db04d5e verified
排名,大模型,机构,Elo得分
🥇,GPT4-Turbo,OpenAI,1391
🥈,GPT3.5-Turbo,OpenAI,1197
🥉,讯飞星火v3.0,科大讯飞,1104
4,ChatGLM3-6B,清华&智谱,1074
5,GPT4,OpenAI,1048
6,文心一言4(ERNIE-Bot4.0),百度,1040
7,通义千问2(qwen-max),阿里巴巴,1036
8,商汤日日新(Sensenova),商汤科技,1026
9,MiniMax(abab5.5-chat),MiniMax,1022
10,百川(baichuan2-13b-chat-v1),百川智能,942
11,千帆-llama2,Meta/百度千帆,906
12,360智脑(360GPT_S2_V9),360,860
13,悟道・天鹰(AquilaChat-7B,智源研究院,755
14,BLOOMZ-7B,BigScience,601