Spaces:

Emil25
/

g19_project

Sleeping

App Files Files Community

g19_project / pages /Final_project.py

Emil25

Upload Final_project.py

d910a94 11 months ago

raw

history blame

4.36 kB

	import streamlit as st
	import pandas as pd
	import requests
	from wordcloud import WordCloud
	import matplotlib.pyplot as plt
	import os
	import re

	# Установка API URL и заголовков
	API_URL_TRA = "https://api-inference.huggingface.co/models/Helsinki-NLP/opus-mt-en-ru"
	API_URL_KEY = "https://api-inference.huggingface.co/models/ml6team/keyphrase-extraction-kbir-inspec"
	API_URL_SUM = "https://api-inference.huggingface.co/models/facebook/bart-large-cnn"

	headers = {"Authorization": os.getenv("API_TOKEN")}


	# Функция для получения ключевых слов
	def get_key_words(payload):
	response = requests.post(API_URL_KEY, headers=headers, json=payload)
	return response.json()

	# Функция для перевода слова
	def translate_key_words(payload):
	response = requests.post(API_URL_TRA, headers=headers, json=payload)
	return response.json()

	# Функция для составления конспекта
	def make_summary(payload):
	response = requests.post(API_URL_SUM, headers=headers, json=payload)
	return response.json()


	# Очищаем список слов
	def clean_list(words_list):
	cleaned_words_list = []
	for word in words_list:
	word = word.lower()
	word =re.sub(r"[^а-яА-Яa-zA-Z\s]", "", word)
	word = word.lstrip()
	word = word.rstrip()
	cleaned_words_list.append(word)
	return cleaned_words_list


	# Настраиваем заголовок и название страницы
	st.set_page_config(layout="wide", page_title="Students' Personal Assistant")
	st.markdown(' # :female-student: Персональный помощник для студентов')

	st.divider()
	st.markdown('# :blue_book: Конспект на английском языке')

	col1, col2 = st.columns(2)
	text_from_tarea = col1.text_area('Введите тект статьи на английском языке', height=500)

	button_start = st.button('Обработать текст')
	key_words_list = []


	if button_start:
	with st.spinner('Составляем конспект...'):
	# Составляем конспект
	summary_text = make_summary({"inputs": text_from_tarea})
	col2.text_area('Конспект статьи', height=500, value=summary_text[0]['summary_text'])

	with st.spinner('Получаем ключевые слова...'):
	# Извлекаем ключевые слова
	kew_words = get_key_words({"inputs": text_from_tarea})
	for key_word in kew_words:
	key_words_list.append(key_word['word'].lower())

	sorted_keywords = set(sorted(key_words_list))
	sorted_keywords = clean_list(sorted_keywords)

	with st.spinner('Переводим ключевые слова...'):
	# Переводим ключевые слова
	translated_words_dict = translate_key_words({"inputs": sorted_keywords})
	print(translated_words_dict)
	translated_words_list = [word['translation_text'] for word in translated_words_dict]

	# Создаем карточки
	cleaned_words_list_ru = clean_list(translated_words_list)
	cards_list = []
	for item1, item2 in zip(sorted_keywords, cleaned_words_list_ru):
	cards_list.append([item1, item2])

	st.success('Готово')

	with st.spinner('Создаем WordCloud...'):
	# Выводим Word Cloud
	st.set_option('deprecation.showPyplotGlobalUse', False)
	words_str = ', '.join(sorted_keywords)
	w = WordCloud(background_color="white", width=1600, height=800).generate(words_str)
	plt.imshow(w, interpolation='bilinear')
	plt.imshow(w)
	plt.axis("off")
	st.pyplot()

	# Выводим карточки
	st.markdown('# :bookmark_tabs: Карточки из ключевых слов')
	col1, col2, col3 = st.columns(3)
	columns = [col1, col2, col3]
	for index, el in enumerate(cards_list):
	with columns[(index + 1) % 3]:
	with st.container(border=True):
	col4, col5 = st.columns([0.1, 0.9])
	with col4:
	st.write("# :flower_playing_cards:")
	with col5:
	st.write(f'## :green[{el[0]}]')
	st.write(f'### :blue[{el[1]}]')