Alina Lozovskaya's picture

Alina Lozovskaya

alozowski

·

https://www.linkedin.com/in/lozovskaya/

AI & ML interests

NLP in all aspects

Recent Activity

New activity 2 days ago

open-llm-leaderboard/open_llm_leaderboard:Reproducibility error

New activity 2 days ago

open-llm-leaderboard/open_llm_leaderboard:Model benchmarks degraded after re-evaluation

New activity 2 days ago

open-llm-leaderboard/open_llm_leaderboard:Suggestion: Table refresh timer

View all activity

Organizations

alozowski's activity

New activity in open-llm-leaderboard/open_llm_leaderboard 2 days ago

Reproducibility error

#1020 opened 3 days ago by

Model benchmarks degraded after re-evaluation

#1018 opened 9 days ago by

Suggestion: Table refresh timer

#1015 opened 12 days ago by

Is the score computed by lm-eval-harness normalized?

#1011 opened 16 days ago by

New activity in open-llm-leaderboard/open_llm_leaderboard 3 days ago

Re-run failed eval fblgit/cybertron-v4-qw7B-UNAMGS

#1021 opened 3 days ago by

New activity in open-llm-leaderboard/open_llm_leaderboard 4 days ago

Failed model for open llm bechmark

#1019 opened 5 days ago by

New activity in open-llm-leaderboard-old/open_llm_leaderboard 8 days ago

Interpretation of result details?

#1 opened 4 months ago by

New activity in open-llm-leaderboard/open_llm_leaderboard 9 days ago

add-co2-column

#1017 opened 9 days ago by

New activity in open-llm-leaderboard/open_llm_leaderboard 10 days ago

OOM when use vllm to accelerate compute

#1012 opened 16 days ago by

New activity in open-llm-leaderboard/open_llm_leaderboard 15 days ago

Update LLM

#1013 opened 15 days ago by

add-co2-column

#1014 opened 15 days ago by

Finished but no result

#1010 opened 16 days ago by

New activity in open-llm-leaderboard/open_llm_leaderboard 16 days ago

Failed evaluation again for `fblgit/TheBeagle-v2beta-32B-MGS`

#994 opened 29 days ago by

New activity in open-llm-leaderboard/open_llm_leaderboard 17 days ago

Still empty main benchmark scores

#1009 opened 17 days ago by

Failed test and missing model

#1008 opened 17 days ago by

Marked deleted/incomplete

#1006 opened 20 days ago by

Failed Model

#1005 opened 21 days ago by

update model

#1002 opened 23 days ago by

New activity in open-llm-leaderboard/open_llm_leaderboard 19 days ago

Empty main benchmark scores

#1007 opened 19 days ago by

New activity in open-llm-leaderboard/open_llm_leaderboard 22 days ago

bump-up-transformers

#1003 opened 22 days ago by