tuva
/

turu

Text Classification

language-classification

Model card Files Files and versions Community

tuva commited on May 29

Commit

dc898ff

•

1 Parent(s): 9f0ee73

Update README.md

Files changed (1) hide show

README.md +41 -1

README.md CHANGED Viewed

@@ -1,4 +1,44 @@
 # Language Classifier
-This model is trained to classify text as either Russian or Tuvan language.

+---
+language: [ru, tyv]
+tags:
+- language-classification
+- russian
+- tuvan
+license: mit
+datasets:
+- custom
+metrics:
+- accuracy
+widget:
+  - text: "В Туве приступили к разработке проектно-сметной документации новой котельной Шагонара"
+  - text: "Тываның Баштыңы часкы тарылга ажылдарын дүргедедирин негээн"
+---
 # Language Classifier
+## Описание
+Данная модель обучена для классификации текста на русский или тувинский язык. Модель основана на логистической регрессии и использует TF-IDF векторизацию для преобразования текста в числовые признаки. Она может быть использована для определения языка текста, что особенно полезно для многоязычных приложений.
+## Архитектура модели
+Модель состоит из следующих компонентов:
+- **TF-IDF Vectorizer**: Преобразует текстовые данные в векторные представления.
+- **Logistic Regression**: Классификатор, обученный на данных, размеченных по языкам.
+## Использование
+Вы можете использовать эту модель для определения языка текста. Пример использования:
+```python
+from transformers import pipeline
+# Загрузка модели и пайплайна
+classifier = pipeline("text-classification", model="tuva/turu")
+# Пример текстов для классификации
+texts = ["В Туве приступили к разработке проектно-сметной документации новой котельной Шагонара", "Тываның Баштыңы часкы тарылга ажылдарын дүргедедирин негээн"]
+# Получение предсказаний
+predictions = classifier(texts)
+print(predictions)