Spaces:

polygraf-ai
/

article_writer

Runtime error

App Files Files Community

eljanmahammadli commited on Aug 5, 2024

Commit

f716a54

1 Parent(s): 3dae562

changed LLM client choices (gemini, claude, GPT-4o-mini)

Browse files

Files changed (3) hide show

ai_generate.py +51 -27
app.py +35 -24
requirements.txt +3 -1

ai_generate.py CHANGED Viewed

@@ -3,6 +3,8 @@ from openai import OpenAI
 import os
 from transformers import pipeline
 from groq import Groq
 from langchain_community.document_loaders import PyMuPDFLoader
 from langchain_community.document_loaders import TextLoader
 from langchain_community.embeddings.sentence_transformer import (
@@ -19,9 +21,20 @@ from dotenv import load_dotenv
 load_dotenv()
 groq_client = Groq(
     api_key=os.environ.get("GROQ_API_KEY"),
 )
 def create_db_with_langchain(path):
@@ -67,7 +80,6 @@ def generate_groq_base(text, model):
         ],
         temperature=1,
         max_tokens=1024,
-        top_p=1,
         stream=True,
         stop=None,
     )
@@ -88,35 +100,47 @@ def generate_groq(text, model, path):
 def generate_openai(text, model, openai_client):
     message = [{"role": "user", "content": text}]
     response = openai_client.chat.completions.create(
-        model=model, messages=message, temperature=0.2, max_tokens=800, frequency_penalty=0.0
     )
     return response.choices[0].message.content
-def generate(text, model, path, api):
-    if model == "Llama 3":
         return generate_groq(text, "llama3-70b-8192", path)
-    elif model == "Groq":
-        return generate_groq(text, "llama3-groq-70b-8192-tool-use-preview", path)
-    elif model == "Mistral":
-        return generate_groq(text, "mixtral-8x7b-32768", path)
-    elif model == "Gemma":
-        return generate_groq(text, "gemma2-9b-it", path)
-    elif model == "OpenAI GPT 3.5":
-        try:
-            openai_client = OpenAI(api_key=api)
-            return generate_openai(text, "gpt-3.5-turbo", openai_client)
-        except:
-            return "Please add a valid API key"
-    elif model == "OpenAI GPT 4":
-        try:
-            openai_client = OpenAI(api_key=api)
-            return generate_openai(text, "gpt-4-turbo", openai_client)
-        except:
-            return "Please add a valid API key"
     elif model == "OpenAI GPT 4o":
-        try:
-            openai_client = OpenAI(api_key=api)
-            return generate_openai(text, "gpt-4o", openai_client)
-        except:
-            return "Please add a valid API key"

 import os
 from transformers import pipeline
 from groq import Groq
+import google.generativeai as genai
+import anthropic
 from langchain_community.document_loaders import PyMuPDFLoader
 from langchain_community.document_loaders import TextLoader
 from langchain_community.embeddings.sentence_transformer import (
 load_dotenv()
+os.environ["GRPC_VERBOSITY"] = "ERROR"
+os.environ["GLOG_minloglevel"] = "2"
 groq_client = Groq(
     api_key=os.environ.get("GROQ_API_KEY"),
 )
+openai_client = OpenAI(api_key=os.environ.get("OPENAI_API_KEY"))
+# give access to all APIs for GCP instance
+# gcloud auth application-default login
+genai.configure(api_key=os.environ.get("GENAI_API_KEY"))
+gemini_client = genai.GenerativeModel(
+    model_name=f"models/gemini-1.5-pro", system_instruction="You are helpful assistant."
+)
+claude_client = anthropic.Anthropic(api_key=os.environ.get("ANTHROPIC_API_KEY"))
 def create_db_with_langchain(path):
         ],
         temperature=1,
         max_tokens=1024,
         stream=True,
         stop=None,
     )
 def generate_openai(text, model, openai_client):
     message = [{"role": "user", "content": text}]
     response = openai_client.chat.completions.create(
+        model=model,
+        messages=message,
+        temperature=1,
+        max_tokens=1024,
     )
     return response.choices[0].message.content
+def generate_gemini(text, model, gemini_client):
+    response = gemini_client.generate_content(
+        text,
+        generation_config={
+            "max_output_tokens": 1024,
+            "temperature": 1,
+        },
+    )
+    return response.text.strip()
+def generate_claude(text, model, claude_client):
+    response = claude_client.messages.create(
+        model=model,
+        max_tokens=1024,
+        temperature=1.0,
+        system="You are helpful assistant.",
+        messages=[{"role": "user", "content": [{"type": "text", "text": text}]}],
+    )
+    return response.content[0].text.strip()
+def generate(text, model, path, api=None):
+    if model == "LLaMA 3":
         return generate_groq(text, "llama3-70b-8192", path)
+    elif model == "OpenAI GPT 4o Mini":
+        return generate_openai(text, "gpt-4o-mini", openai_client)
     elif model == "OpenAI GPT 4o":
+        return generate_openai(text, "gpt-4o", openai_client)
+    elif model == "OpenAI GPT 4":
+        return generate_openai(text, "gpt-4-turbo", openai_client)
+    elif model == "Gemini 1.5 Pro":
+        return generate_gemini(text, "", gemini_client)
+    elif model == "Claude Sonnet 3.5":
+        return generate_claude(text, "claude-3-5-sonnet-20240620", claude_client)

app.py CHANGED Viewed

@@ -2,8 +2,6 @@ import openai
 import gradio as gr
 from typing import Dict, List
 import re
-from humanize import paraphrase_text
-from ai_generate import generate
 import requests
 import language_tool_python
 import torch
@@ -13,12 +11,13 @@ from transformers import AutoTokenizer, AutoModelForSequenceClassification, pipe
 from scipy.special import softmax
 from collections import defaultdict
 import nltk
 from utils import remove_special_characters
 from plagiarism import google_search, months, domain_list, build_date
-from datetime import date
-# Check if CUDA is available
-device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
 print(f"Using device: {device}")
 models = {
@@ -65,7 +64,7 @@ def format_and_correct(text: str) -> str:
     Please correct the formatting, grammar, and spelling errors in the following text without changing its content significantly. Ensure proper paragraph breaks and maintain the original content:
     {text}
     """
-    corrected_text = generate(prompt, "Groq", None)
     return clean_text(corrected_text)
@@ -287,7 +286,7 @@ def generate_article(
     conclusion_type: str,
     ai_model: str,
     content_string: str,
-    api_key: str = None,
     pdf_file_input=None,
     generated_article: str = None,
     user_comments: str = None,
@@ -317,7 +316,8 @@ def generate_article(
         prompt = generate_prompt(settings)
     print(prompt)
-    if ai_model in ["OpenAI GPT 3.5", "OpenAI GPT 4"]:
         response = openai.ChatCompletion.create(
             model="gpt-4" if ai_model == "OpenAI GPT 4" else "gpt-3.5-turbo",
             messages=[
@@ -334,7 +334,11 @@ def generate_article(
         )
         article = response.choices[0].message.content.strip()
     else:
-        article = generate(prompt, ai_model, pdf_file_input, api_key)
     return clean_text(article)
@@ -407,7 +411,7 @@ def generate_and_format(
     num_examples,
     conclusion_type,
     ai_model,
-    api_key,
     google_search_check,
     year_from,
     month_from,
@@ -457,7 +461,7 @@ def generate_and_format(
         conclusion_type,
         ai_model,
         content_string,
-        api_key,
         pdf_file_input,
         generated_article,
         user_comments,
@@ -624,6 +628,13 @@ def create_interface():
                                 placeholder="Enter comma-separated keywords",
                                 elem_classes="input-highlight-yellow",
                             )
                         with gr.Row():
                             month_from = gr.Dropdown(
                                 choices=months,
@@ -644,26 +655,26 @@ def create_interface():
                             day_to = gr.Textbox(label="To Day", value=d1[0])
                             year_to = gr.Textbox(label="To Year", value=d1[2])
-                        with gr.Row():
-                            domains_to_include = gr.Dropdown(
-                                domain_list,
-                                value=domain_list,
-                                multiselect=True,
-                                label="Domains To Include",
-                            )
                     gr.Markdown("# Add Optional PDF File with Information", elem_classes="text-center text-3xl mb-6")
                     pdf_file_input = gr.File(label="Upload PDF")
                 with gr.Group():
                     gr.Markdown("## AI Model Configuration", elem_classes="text-xl mb-4")
                     ai_generator = gr.Dropdown(
-                        choices=["Llama 3", "Groq", "Mistral", "Gemma", "OpenAI GPT 3.5", "OpenAI GPT 4"],
-                        value="Llama 3",
                         label="AI Model",
                         elem_classes="input-highlight-pink",
                     )
-                    input_api = gr.Textbox(label="API Key", visible=False)
-                    ai_generator.change(update_visibility_api, ai_generator, input_api)
                 generate_btn = gr.Button("Generate Article", variant="primary")
@@ -754,7 +765,7 @@ def create_interface():
                 input_num_examples,
                 input_conclusion,
                 ai_generator,
-                input_api,
                 google_search_check,
                 year_from,
                 month_from,
@@ -787,7 +798,7 @@ def create_interface():
                 input_num_examples,
                 input_conclusion,
                 ai_generator,
-                input_api,
                 google_search_check,
                 year_from,
                 month_from,

 import gradio as gr
 from typing import Dict, List
 import re
 import requests
 import language_tool_python
 import torch
 from scipy.special import softmax
 from collections import defaultdict
 import nltk
+from datetime import date
 from utils import remove_special_characters
 from plagiarism import google_search, months, domain_list, build_date
+from humanize import paraphrase_text, device
+from ai_generate import generate
 print(f"Using device: {device}")
 models = {
     Please correct the formatting, grammar, and spelling errors in the following text without changing its content significantly. Ensure proper paragraph breaks and maintain the original content:
     {text}
     """
+    corrected_text = generate(prompt, "Llama 3", None)
     return clean_text(corrected_text)
     conclusion_type: str,
     ai_model: str,
     content_string: str,
+    # api_key: str = None,
     pdf_file_input=None,
     generated_article: str = None,
     user_comments: str = None,
         prompt = generate_prompt(settings)
     print(prompt)
+    # TODO: Why do we need this ??
+    if ai_model in ["OpenAI GPT 3.5"]:
         response = openai.ChatCompletion.create(
             model="gpt-4" if ai_model == "OpenAI GPT 4" else "gpt-3.5-turbo",
             messages=[
         )
         article = response.choices[0].message.content.strip()
     else:
+        article = generate(
+            prompt,
+            ai_model,
+            pdf_file_input,  # api_key
+        )
     return clean_text(article)
     num_examples,
     conclusion_type,
     ai_model,
+    # api_key,
     google_search_check,
     year_from,
     month_from,
         conclusion_type,
         ai_model,
         content_string,
+        # api_key,
         pdf_file_input,
         generated_article,
         user_comments,
                                 placeholder="Enter comma-separated keywords",
                                 elem_classes="input-highlight-yellow",
                             )
+                        with gr.Row():
+                            domains_to_include = gr.Dropdown(
+                                domain_list,
+                                value=domain_list,
+                                multiselect=True,
+                                label="Domains To Include",
+                            )
                         with gr.Row():
                             month_from = gr.Dropdown(
                                 choices=months,
                             day_to = gr.Textbox(label="To Day", value=d1[0])
                             year_to = gr.Textbox(label="To Year", value=d1[2])
                     gr.Markdown("# Add Optional PDF File with Information", elem_classes="text-center text-3xl mb-6")
                     pdf_file_input = gr.File(label="Upload PDF")
                 with gr.Group():
                     gr.Markdown("## AI Model Configuration", elem_classes="text-xl mb-4")
                     ai_generator = gr.Dropdown(
+                        choices=[
+                            "OpenAI GPT 4",
+                            "OpenAI GPT 4o",
+                            "OpenAI GPT 4o Mini",
+                            "Claude Sonnet 3.5",
+                            "Gemini 1.5 Pro",
+                            "LLaMA 3",
+                        ],
+                        value="OpenAI GPT 4o Mini",
                         label="AI Model",
                         elem_classes="input-highlight-pink",
                     )
+                    # input_api = gr.Textbox(label="API Key", visible=False)
+                    # ai_generator.change(update_visibility_api, ai_generator, input_api)
                 generate_btn = gr.Button("Generate Article", variant="primary")
                 input_num_examples,
                 input_conclusion,
                 ai_generator,
+                # input_api,
                 google_search_check,
                 year_from,
                 month_from,
                 input_num_examples,
                 input_conclusion,
                 ai_generator,
+                # input_api,
                 google_search_check,
                 year_from,
                 month_from,

requirements.txt CHANGED Viewed

@@ -19,4 +19,6 @@ sentence-transformers
 langchain-community
 pymupdf
 chromadb
-language-tool-python

 langchain-community
 pymupdf
 chromadb
+language-tool-python
+anthropic
+google-generativeai