metadata
license: mit
datasets:
- Den4ikAI/ru_sberquad_long_answers
language:
- ru
widget:
- text: >-
<SC6>Текст: Основными конкурентами РН Протон-М по цене и по выводимой
полезной нагрузке являются американская РН Falcon 9, европейская ракета
тяжёлого класса Ариан-5 компании Арианэспас и международный проект Морской
старт с РН средне-тяжёлого класса Зенит. Кроме того, конкурентами по массе
полезной нагрузки, выводимой на орбиту, могут считаться американские
носители Атлас-5 и Дельта-4, а также японский носитель H-IIB. Тем не менее
стоимость последних трёх упомянутых РН значительно превышает стоимость РН
Протон-М, и поэтому они фактически не конкурируют с Протоном на рынке
коммерческих запусков[145].\nВопрос: Как называется Японский
носитель?\nОтвет: <extra_id_0>
pipeline_tag: text2text-generation
Den4ikAI/FRED-T5-LARGE_text_qa
Модель обучена отвечать на вопросы с помощью текста.
Wandb: link
Использование
from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
import torch
from transformers import GenerationConfig
use_cuda = torch.cuda.is_available()
device = torch.device("cuda" if use_cuda else "cpu")
generation_config = GenerationConfig.from_pretrained("Den4ikAI/FRED-T5-LARGE_text_qa")
tokenizer = AutoTokenizer.from_pretrained("Den4ikAI/FRED-T5-LARGE_text_qa")
model = AutoModelForSeq2SeqLM.from_pretrained("Den4ikAI/FRED-T5-LARGE_text_qa").to(device)
model.eval()
def generate(prompt):
data = tokenizer(f"{prompt}", return_tensors="pt").to(model.device)
output_ids = model.generate(
**data,
generation_config=generation_config
)[0]
print(tokenizer.decode(data["input_ids"][0].tolist()))
out = tokenizer.decode(output_ids.tolist())
return out
while 1:
prompt = '''<SC6>Текст: {}\nВопрос: {}\nОтвет: <extra_id_0>
'''.format(input('Текст: '), input('Вопрос: '))
print(generate(prompt))