Spaces:
Runtime error
Runtime error
# -*- coding: utf-8 -*- | |
"""Gradio_GPT_bot.ipynb | |
import os | |
os.system ('export TRANSFORMERS_CACHE = /my/cache/dir') | |
Automatically generated by Colaboratory. | |
Original file is located at | |
https://colab.research.google.com/drive/18CH6wtcr46hWqBqpzieH_oBOmJHecOVl | |
# Imports | |
""" | |
# Commented out IPython magic to ensure Python compatibility. | |
# %%capture | |
# # установка gradio для написания веб интерефейса | |
# # установка transformers для использования языковых моделей с платформы HF | |
#!pip install gradio transformers | |
import random | |
import time | |
from typing import List, Dict, Tuple, Union | |
#from IPython import display | |
import gradio as gr | |
import torch | |
import transformers | |
"""# Tokenizer and Model | |
**Инициализация модели** | |
Страница модели | |
https://huggingface.co/ai-forever/rugpt3medium_based_on_gpt2 | |
""" | |
from transformers import pipeline | |
from transformers import AutoTokenizer, AutoModelForCausalLM, GenerationConfig | |
# # инициализация через pipeline | |
# model_name = "ai-forever/rugpt3medium_based_on_gpt2" | |
# pipe = pipeline("text-generation", model=model_name) | |
# sample = pipeline('test test', pad_token_id=generator.tokenizer.eos_token_id) | |
model_name = "ai-forever/rugpt3medium_based_on_gpt2" | |
model = AutoModelForCausalLM.from_pretrained(model_name) | |
tokenizer = AutoTokenizer.from_pretrained(model_name) | |
tokenizer.pad_token_id = tokenizer.eos_token_id | |
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu') | |
model = model.to(DEVICE) | |
"""Генерация текста""" | |
# Commented out IPython magic to ensure Python compatibility. | |
# %%time | |
# | |
# # токенизация текста в индексы токенов и маски внимания | |
# text_promt = 'меня засосала опасная трясина ' | |
# inputs = tokenizer(text_promt, return_tensors="pt").to(DEVICE) | |
# | |
# # конфиг словарь для генерации текста | |
# gen_config_dict = dict( | |
# do_sample=True, # делать ли случайное семплирование с параметрами ниже (если False то выскочит предупреждение) | |
# max_new_tokens=30, # сколько максимум новых токенов надо генерировать | |
# top_k=50, # семплировать только из top_k самых вероятных токенов | |
# top_p=0.9, # семплировать только из токенов сумма вероятностей которых не больше top_p | |
# temperature=2.0, # температура для софтмакса | |
# num_beams=3, # параметр алгоритма Beam search | |
# repetition_penalty=2.0, # штраф за то что модель повторяется | |
# pad_token_id=tokenizer.pad_token_id, # установить токен pad чтобы не было предупреждения | |
# ) | |
# # конфиг для генерации текста из словаря | |
# generation_config = GenerationConfig(**gen_config_dict) | |
# | |
# # генерация текста (индексы токенов) | |
# output = model.generate(**inputs, generation_config=generation_config) | |
# | |
# # сопостовление идексам токенов слов из словаря токенайзера | |
# generated_text = tokenizer.decode(output[0], skip_special_tokens=False) | |
# | |
# # удаление исходного промта из ответа потому что он тоже возвращается | |
# generated_text = generated_text[len(text_promt):] | |
# generated_text | |
"""Функция для генерации""" | |
# функция принимает текстовый запрос и словарь параметров генерации | |
def generate_text(text_promt: str, gen_config_dict: Dict[str, Union[float, int]]) -> str: | |
inputs = tokenizer(text_promt, return_tensors="pt").to(DEVICE) | |
generation_config = GenerationConfig(**gen_config_dict) | |
output = model.generate(**inputs, pad_token_id=tokenizer.eos_token_id, generation_config=generation_config) | |
generated_text = tokenizer.decode(output[0], skip_special_tokens=True) | |
generated_text = generated_text[len(text_promt):] | |
return generated_text | |
# конфиг словарь для генерации текста | |
gen_config_dict = dict( | |
do_sample=True, # делать ли случайное семплирование с параметрами ниже (если False то выскочит предупреждение) | |
max_new_tokens=20, # сколько максимум новых токенов надо генерировать | |
top_k=50, # семплировать только из top_k самых вероятных токенов | |
top_p=0.9, # семплировать только из токенов сумма вероятностей которых не больше top_p | |
temperature=2.0, # температура для софтмакса | |
num_beams=3, # параметр алгоритма Beam search | |
repetition_penalty=2.0, # штраф за то что модель повторяется | |
pad_token_id=tokenizer.pad_token_id, # установить токен pad чтобы не было предупреждения | |
) | |
text_promt = 'в небесной канцелярии выходной' | |
generated_text = generate_text(text_promt, gen_config_dict) | |
generated_text | |
"""# Gradio App | |
## Новый интерфейс Чат-бота | |
Вариант с системным промтом и разными входными аргументами и настройками | |
""" | |
import gradio as gr | |
# функция будет вызыватся при нажатии на Enter в окошке вовода текста | |
# кроме обычных аргументов - сообщения пользователя и истории - принимает еще параметры для конфига генерации | |
def generate(message, history, *components): | |
# print(system_promt) | |
# обновление словаря новыми агрументами и создание конфига генерации текста | |
gen_config.update(dict(zip(gen_config.keys(), components))) | |
gen_config['top_k'] = int(gen_config['top_k']) | |
gen_config['num_beams'] = int(gen_config['num_beams']) | |
generation_config = GenerationConfig(**gen_config) | |
# добавить системный промт в начало запроса и сгенерировать текст | |
promt = message | |
inputs = tokenizer(promt, return_tensors="pt").to(DEVICE) | |
output = model.generate(**inputs, generation_config=generation_config, pad_token_id=tokenizer.eos_token_id) | |
generated_text = tokenizer.decode(output[0], skip_special_tokens=True) | |
generated_text = generated_text[len(promt):] | |
# имитация набора сообщения чат-ботом (посимвольня генерация через yield в цикле) | |
for i in range(len(generated_text)): | |
time.sleep(0.05) # задержка с которой бот вводит текст | |
yield generated_text[:i+1] | |
# словарь для конфига генерации текста | |
gen_config = dict( | |
do_sample=False, | |
max_length=60, | |
top_k=50, | |
top_p=0.9, | |
temperature=2.0, | |
num_beams=3, | |
repetition_penalty=2.0, | |
) | |
# компоненты настройки конфига генерации текста | |
components = [ | |
gr.Checkbox(label="do_sample", value=gen_config["do_sample"]), | |
gr.Slider(label="max_length", value=gen_config["max_length"], minimum=1, maximum=300, step=10), | |
gr.Number(label="top_k", value=gen_config["top_k"], minimum=0, maximum=50, step=10), | |
gr.Number(label="top_p", value=gen_config["top_p"], minimum=0, maximum=1, step=0.1), | |
gr.Number(label="temperature", value=gen_config["temperature"], minimum=0, maximum=10, step=0.1), | |
gr.Number(label="num_beams", value=gen_config["num_beams"], minimum=0, maximum=5, step=1), | |
gr.Number(label="repetition_penalty", value=gen_config["repetition_penalty"], minimum=0, maximum=5, step=0.1), | |
] | |
# при нажатии Enter в чате будет вызыватся функция generate | |
interface = gr.ChatInterface( | |
generate, | |
chatbot=gr.Chatbot(height=300), # вход для функции generate: message | |
textbox=gr.Textbox(placeholder="Задайте любой вопрос", container=False, scale=2), # выходной бокс для текста | |
# дополнительные входы для функции generate (*components) | |
additional_inputs=components, | |
# настройки оформления | |
title="Чат-бот T10", # название страницы | |
description="Окно переписки с ботом", # описание окошка переписки | |
theme="Glass", # темы: Glass, Monochrome, Soft | |
# examples=["Hello", "Am I cool?", "Are tomatoes vegetables?"], # примеры должны быть множественными если аргументов много | |
# cache_examples=True, # кешировать примеры | |
# дполнительные кнопки (если не нужна какая либо кнопка ставим None) | |
submit_btn='Отправить', | |
retry_btn='Повторить вопрос', | |
undo_btn="Удалить предыдущий вопрос", | |
clear_btn="Очистить историю", | |
) | |