Vikhrmodels
/

Vikhr-Nemo-12B-Instruct-R-21-09-24

Safetensors

English

Russian

mistral

Model card Files Files and versions Community

hivaze commited on 2 days ago

Commit

a16509b

•

1 Parent(s): c8febca

Initial version of README

Browse files

Files changed (1) hide show

README.md +35 -1

README.md CHANGED Viewed

@@ -1,3 +1,37 @@
 ---
 license: apache-2.0
----

 ---
 license: apache-2.0
+datasets:
+- Vikhrmodels/GrandMaster-PRO-MAX
+- Vikhrmodels/Grounded-RAG-RU-v2
+language:
+- en
+- ru
+base_model:
+- mistralai/Mistral-Nemo-Instruct-2407
+---
+## Vikhr-Nemo-12B-Instruct-R-21-09-24
+### Описание
+**Vikhr-Nemo** - это наша фалгманская умнимодальная LLM (Large Language Model) представляющая из себя улучшенную версию [mistralai/Mistral-Nemo-Instruct-2407](https://huggingface.co/mistralai/Mistral-Nemo-Instruct-2407) командой **VikhrModels**, адаптированную преимущественно для русского и английского языков. Для ее обучения мы использовали несколько этапов включаюзих в себя **SFT** и **SMPO** - нашу собственную вариацию DPO, подробнее читайте в секции *"Как эта модель создавалась"*.
+Модель оптимизированна для различных вариантов использования, включая рассуждения, обобщение и ответы на вопросы. Vikhr-Nemo обладает возможностью многоязычной генерации, и высокопроизводительными возможностями RAG. Модель иммет лучшие оценки среди прочих на наших инструктивных и RAG бенчарках и, поэтому, мы верим, что в некоторыых случаях может использоваться как локальная замена для gpt-4o-mini от OpenAI.
+Весь использованный код для обучения выложен в нашем репозитории [effective_llm_alignment](https://github.com/VikhrModels/leffective_llm_alignment/) на GitHub, а основаные датасеты дсотупны в нашем [профиле на HF](https://huggingface.co/Vikhrmodels).
+### Особенности
+1. Высокое качество генераций на русском и английском языках, а также некоторых других языках, благодаря датасету Grandmaster-PRO-MAX и исходной модели.
+2. Поддержка системных промптов для регулриования стиля ответов
+3. Поддержка до 128k токенов контекста благодаря исходной модели
+4. Grounded RAG режим - модель имеет специальную роль documents и специальный режим работы для поиска идентификаторов релевантных вопросу пользователя документов и использования их для ответа на вопрос, вдохновлено аналогичной способность модели Command-R
+### Метрики и оценка качества
+### Как эта модель создавалась
+### Как работать с RAG
+### Нюансы и ограничения
+### Авторы