tuva commited on
Commit
dc898ff
1 Parent(s): 9f0ee73

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +41 -1
README.md CHANGED
@@ -1,4 +1,44 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
 
2
  # Language Classifier
3
 
4
- This model is trained to classify text as either Russian or Tuvan language.
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ ---
2
+ language: [ru, tyv]
3
+ tags:
4
+ - language-classification
5
+ - russian
6
+ - tuvan
7
+ license: mit
8
+ datasets:
9
+ - custom
10
+ metrics:
11
+ - accuracy
12
+ widget:
13
+ - text: "В Туве приступили к разработке проектно-сметной документации новой котельной Шагонара"
14
+ - text: "Тываның Баштыңы часкы тарылга ажылдарын дүргедедирин негээн"
15
+ ---
16
 
17
  # Language Classifier
18
 
19
+ ## Описание
20
+
21
+ Данная модель обучена для классификации текста на русский или тувинский язык. Модель основана на логистической регрессии и использует TF-IDF векторизацию для преобразования текста в числовые признаки. Она может быть использована для определения языка текста, что особенно полезно для многоязычных приложений.
22
+
23
+ ## Архитектура модели
24
+
25
+ Модель состоит из следующих компонентов:
26
+ - **TF-IDF Vectorizer**: Преобразует текстовые данные в векторные представления.
27
+ - **Logistic Regression**: Классификатор, обученный на данных, размеченных по языкам.
28
+
29
+ ## Использование
30
+
31
+ Вы можете использовать эту модель для определения языка текста. Пример использования:
32
+
33
+ ```python
34
+ from transformers import pipeline
35
+
36
+ # Загрузка модели и пайплайна
37
+ classifier = pipeline("text-classification", model="tuva/turu")
38
+
39
+ # Пример текстов для классификации
40
+ texts = ["В Туве приступили к разработке проектно-сметной документации новой котельной Шагонара", "Тываның Баштыңы часкы тарылга ажылдарын дүргедедирин негээн"]
41
+
42
+ # Получение предсказаний
43
+ predictions = classifier(texts)
44
+ print(predictions)