kirv
/

Mistral-7b-tokens4b-v1

Model card Files Files and versions Community

kirv commited on May 5

Commit

9d2631a

•

1 Parent(s): d170b0b

Update README.md

Files changed (1) hide show

README.md +2 -0

README.md CHANGED Viewed

@@ -11,6 +11,7 @@ base_model:
 ---
 Модель mistralai/Mistral-7B-v0.1, обучение всех слоев с ~4млрд токенов из датасета.
 130 часов 2xTesla H100.
 ```
@@ -30,4 +31,5 @@ gradient_accumulation_steps: 5
 loss: 2.03
 По https://github.com/NLP-Core-Team/mmlu_ru
 Квантизация в 4b: accuracy_total=41.86218134391028

 ---
 Модель mistralai/Mistral-7B-v0.1, обучение всех слоев с ~4млрд токенов из датасета.
 130 часов 2xTesla H100.
 ```
 loss: 2.03
 По https://github.com/NLP-Core-Team/mmlu_ru
 Квантизация в 4b: accuracy_total=41.86218134391028