kirv commited on
Commit
9d2631a
1 Parent(s): d170b0b

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +2 -0
README.md CHANGED
@@ -11,6 +11,7 @@ base_model:
11
  ---
12
 
13
  Модель mistralai/Mistral-7B-v0.1, обучение всех слоев с ~4млрд токенов из датасета.
 
14
  130 часов 2xTesla H100.
15
 
16
  ```
@@ -30,4 +31,5 @@ gradient_accumulation_steps: 5
30
  loss: 2.03
31
 
32
  По https://github.com/NLP-Core-Team/mmlu_ru
 
33
  Квантизация в 4b: accuracy_total=41.86218134391028
 
11
  ---
12
 
13
  Модель mistralai/Mistral-7B-v0.1, обучение всех слоев с ~4млрд токенов из датасета.
14
+
15
  130 часов 2xTesla H100.
16
 
17
  ```
 
31
  loss: 2.03
32
 
33
  По https://github.com/NLP-Core-Team/mmlu_ru
34
+
35
  Квантизация в 4b: accuracy_total=41.86218134391028