File size: 1,381 Bytes
4b973cb
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
---
license: mit
---
Вот карточка модели на русском языке для репозитория ruaccent/RUAccent-stressed-encoder:

# RUAccent-stressed-encoder

Эта модель представляет собой дистиллированную версию StressCDLM, специально обученную char level модель для экспериментов, когда модели нужно видеть символы и отфайнтюненую на корпусе ударений. 

## Описание модели

RUAccent-stressed-encoder - это энкодер, оптимизированный для обработки русского текста с ударениями. Предназначен для интеграции в качестве текстового энкодера в TTS системы.

## Использование


```python
import torch
from transformers import AutoModel
import chartk

tokenizer = chartk.CharacterTokenizer.from_pretrained('ruaccent/RUAccent-stressed-encoder')
model = AutoModel.from_pretrained('ruaccent/RUAccent-stressed-encoder')

text = "На гор+е сто+ит з+амок"

inputs = tokenizer(text, return_tensors='pt', padding=True, truncation=True, max_length=512)

with torch.no_grad():
    outputs = model(**inputs)

last_hidden_state = outputs.last_hidden_state
```