Den4ikAI's picture
Update README.md
19260ac
|
raw
history blame
2.53 kB
metadata
license: mit
datasets:
  - Den4ikAI/ru_sberquad_long_answers
language:
  - ru
widget:
  - text: >-
      <SC6>Текст: Основными конкурентами РН Протон-М по цене и по выводимой
      полезной нагрузке являются американская РН Falcon 9, европейская ракета
      тяжёлого класса Ариан-5 компании Арианэспас и международный проект Морской
      старт с РН средне-тяжёлого класса Зенит. Кроме того, конкурентами по массе
      полезной нагрузки, выводимой на орбиту, могут считаться американские
      носители Атлас-5 и Дельта-4, а также японский носитель H-IIB. Тем не менее
      стоимость последних трёх упомянутых РН значительно превышает стоимость РН
      Протон-М, и поэтому они фактически не конкурируют с Протоном на рынке
      коммерческих запусков[145].\nВопрос: Как называется Японский
      носитель?\nОтвет: <extra_id_0>
pipeline_tag: text2text-generation

Den4ikAI/FRED-T5-LARGE_text_qa

Модель обучена отвечать на вопросы с помощью текста.

Wandb: link

Использование

from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
import torch
from transformers import GenerationConfig

use_cuda = torch.cuda.is_available()
device = torch.device("cuda" if use_cuda else "cpu")
generation_config = GenerationConfig.from_pretrained("Den4ikAI/FRED-T5-LARGE_text_qa")
tokenizer = AutoTokenizer.from_pretrained("Den4ikAI/FRED-T5-LARGE_text_qa")
model = AutoModelForSeq2SeqLM.from_pretrained("Den4ikAI/FRED-T5-LARGE_text_qa").to(device)
model.eval()

def generate(prompt):
  data = tokenizer(f"{prompt}", return_tensors="pt").to(model.device)
  output_ids = model.generate(
      **data,
      generation_config=generation_config
  )[0]
  print(tokenizer.decode(data["input_ids"][0].tolist()))
  out = tokenizer.decode(output_ids.tolist())
  return out

while 1:
  prompt = '''<SC6>Текст: {}\nВопрос: {}\nОтвет: <extra_id_0>
  '''.format(input('Текст: '), input('Вопрос: '))
  print(generate(prompt))