Spaces:

AiKontent
/

demo-crunchybot

Runtime error

App Files Files Community

Richie-O3 commited on Mar 26

Commit

cf91c74

•

1 Parent(s): 67fe721

add audio and video functionality

Browse files

Files changed (4) hide show

app.py +32 -11
backend_functions.py +480 -59
gcp.py +28 -0
utils.py +19 -0

app.py CHANGED Viewed

@@ -3,7 +3,7 @@ import os
 import time
 from utils import make_invisible, make_visible
-from backend_functions import get_answer_text
 from dotenv import load_dotenv
 load_dotenv()
@@ -11,21 +11,36 @@ load_dotenv()
 with gr.Blocks() as main_app:
     with gr.Tab('Chatbot'):
         user_id = gr.State('')  # id used to find the chat into the database
-        chat = gr.Chatbot(label="Chatbot Crunchyroll")
         messages = gr.State([])
         with gr.Row():
             text = gr.Textbox(label='Write your question')
-        with gr.Row():
-            with gr.Column():
                 button_text = gr.Button(value='Submit text')
-            with gr.Column():
                 clear_button = gr.ClearButton([chat, messages])
@@ -55,21 +70,27 @@ with gr.Blocks() as main_app:
     # )
     text.submit(
-        fn=get_answer_text,
-        inputs=[text, chat, messages],
-        outputs=[chat]
     ).then(
         lambda: None, None, [text]
     )
     button_text.click(
-        fn=get_answer_text,
-        inputs=[text, chat, messages],
-        outputs=[chat]
     ).then(
         lambda: None, None, [text]
     )
 main_app.launch(debug=True, auth=(os.environ.get('SPACE_USERNAME'), os.environ.get('SPACE_PASSWORD')))

 import time
 from utils import make_invisible, make_visible
+from backend_functions import get_answer, init_greeting, export_dataframe
 from dotenv import load_dotenv
 load_dotenv()
 with gr.Blocks() as main_app:
+    times_functions = gr.State([[], [], []])
     with gr.Tab('Chatbot'):
         user_id = gr.State('')  # id used to find the chat into the database
+        with gr.Column():
+            with gr.Row():
+                chat = gr.Chatbot(label="Chatbot Crunchyroll")
+                output_video = gr.Video(interactive=False, label='Video', autoplay=True, height=400)
+        output_audio = gr.Audio(interactive=False, label='Audio', autoplay=False)
         messages = gr.State([])
         with gr.Row():
             text = gr.Textbox(label='Write your question')
+        with gr.Column():
+            with gr.Row():
                 button_text = gr.Button(value='Submit text')
                 clear_button = gr.ClearButton([chat, messages])
+    with gr.Tab('Times'):
+        columns = ["User Message", "Chatbot Response", "Standalone Question", "Create Embedding", "Query Pinecone",
+                   "Context Prompt", "Final Response GPT", "Create Clean Message", "Create Audio Elevenlabs", "Create Video D-iD", "Final Time"]
+        table_times = gr.DataFrame(headers=columns, visible=False, interactive=False)
+        export_button = gr.Button(value="Export CSV")
     # )
     text.submit(
+        fn=get_answer,
+        inputs=[text, chat, messages, output_audio, output_video, table_times],
+        outputs=[chat, output_audio, output_video, table_times]
     ).then(
         lambda: None, None, [text]
     )
     button_text.click(
+        fn=get_answer,
+        inputs=[text, chat, messages, output_audio, output_video, table_times],
+        outputs=[chat, output_audio, output_video, table_times]
     ).then(
         lambda: None, None, [text]
     )
+    export_button.click(
+        fn=export_dataframe,
+        inputs=table_times,
+    )
+    main_app.load(init_greeting, inputs=[chat, messages], outputs=[chat, messages])
 main_app.launch(debug=True, auth=(os.environ.get('SPACE_USERNAME'), os.environ.get('SPACE_PASSWORD')))

backend_functions.py CHANGED Viewed

@@ -1,12 +1,21 @@
 import gradio as gr
-import random
 import os
 from openai import OpenAI
 from pinecone import Pinecone
 import uuid
 from pymongo.mongo_client import MongoClient
 from dotenv import load_dotenv
 load_dotenv()
 OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
@@ -19,6 +28,15 @@ PINECONE_HOST = os.getenv("PINECONE_HOST")
 DB_USER_NAME = os.getenv("DB_USER_NAME")
 DB_PASSWORD = os.getenv("DB_PASSWORD")
 # Chat
 openai_client = OpenAI(api_key=OPENAI_API_KEY)
@@ -49,112 +67,515 @@ def _add_question_vectorstore(question: str, response: str):
     index.upsert([(vector_id, vector_embedding, vector_metadata)])
-def _update_elements(question, chatbot, output, history_messages):
-    chatbot.append([question, output])
-    history_messages.append({'role': 'user', 'content': question})
-    history_messages.append({'role': 'assistant', 'content': output})
-    return chatbot
 def _query_pinecone(embedding):
-    results = index.query(
-                    vector=embedding,
-                    top_k=10,
-                    include_metadata=True,
-                )
-    final_results = """"""
-    for result in results['matches']:
-        final_results += f"{result['metadata']['text']}\n"
     return final_results
 def _general_prompt(context):
-    with open("prompt_general.txt", "r") as file:
-        file_prompt = file.read().replace("\n", "")
-    context_prompt = file_prompt.replace('CONTEXT', context)
-    print(context_prompt)
-    print("--------------------")
     return context_prompt
 def _call_embedding(text: str):
-    response = openai_client.embeddings.create(
-        input=text,
-        model='text-embedding-ada-002'
-    )
     return response.data[0].embedding
 def _call_gpt(prompt: str, message: str):
-    response = openai_client.chat.completions.create(
-        model=MODEL_OPENAI,
-        temperature=0.2,
-        messages=[
-            {'role': 'system', 'content': prompt},
-            {'role': 'user', 'content': message}
-        ]
-    )
     return response.choices[0].message.content
 def _call_gpt_standalone(prompt: str):
-    response = openai_client.chat.completions.create(
-        model=MODEL_OPENAI,
-        temperature=0.2,
-        messages=[
-            {'role': 'system', 'content': prompt},
-        ]
-    )
     return response.choices[0].message.content
 def _get_standalone_question(question, history_messages):
-    with open("prompt_standalone_message.txt", "r") as file:
-        file_prompt_standalone = file.read().replace("\n", "")
-    history = ''
-    for i, msg in enumerate(history_messages):
         try:
-            if i == 0:
-                continue  # Omit the prompt
-            if i % 2 == 0:
-                history += f'user: {msg["content"]}\n'
-            else:
-                history += f'assistant: {msg["content"]}\n'
         except Exception as e:
             print(e)
-    prompt_standalone = file_prompt_standalone.replace('HISTORY', history).replace('QUESTION', question)
-    standalone_msg_q = _call_gpt_standalone(prompt_standalone)
-    print(standalone_msg_q)
-    print("------------------")
-    return standalone_msg_q
-def get_answer_text(question: str, chatbot: list[tuple[str, str]], history_messages):
     """
     Gets the answer of the chatbot
     """
     if len(chatbot) == 8:
         message_output = 'Un placer haberte ayudado, hasta luego!'
     else:
         standalone_msg_q = _get_standalone_question(question, history_messages) # create standalone question or message
         output_embedding = _call_embedding(standalone_msg_q) # create embedding of standalone question or message
         best_results = _query_pinecone(output_embedding) # get nearest embeddings
         final_context_prompt = _general_prompt(best_results) # create context/general prompt
-        message_output = _call_gpt(final_context_prompt, question)
     if "Respuesta:" in message_output:
         message_output.replace("Respuesta:", "")
     print(history_messages)
-    return _update_elements(question, chatbot, message_output, history_messages)

 import gradio as gr
+import requests
 import os
+import time
+from datetime import timedelta
 from openai import OpenAI
 from pinecone import Pinecone
 import uuid
+import re
+import pandas as pd
+import tensorflow as tf
+from utils import create_folders
+from google.cloud import storage
+from elevenlabs.client import ElevenLabs, AsyncElevenLabs
+from elevenlabs import play, save, Voice, stream
 from pymongo.mongo_client import MongoClient
+from gcp import download_credentials
 from dotenv import load_dotenv
 load_dotenv()
 OPENAI_API_KEY = os.getenv("OPENAI_API_KEY")
 DB_USER_NAME = os.getenv("DB_USER_NAME")
 DB_PASSWORD = os.getenv("DB_PASSWORD")
+API_KEY_ELEVENLABS = os.getenv("API_KEY_ELEVENLABS")
+D_ID_KEY = os.getenv("D_ID_KEY")
+IMG_XAVY = os.getenv("IMG_XAVY")
+CREDENTIALS_GCP = os.getenv("GOOGLE_APPLICATION_CREDENTIALS")
+NAME_BUCKET = os.getenv("NAME_BUCKET")
 # Chat
 openai_client = OpenAI(api_key=OPENAI_API_KEY)
     index.upsert([(vector_id, vector_embedding, vector_metadata)])
+def _update_elements(question, chatbot, output, history_messages, url_audio, url_video, df_table_times):
+    if tf.test.is_gpu_available():
+        chatbot.append([question, output])
+        new_comp_audio = gr.Audio(value=str(url_audio), autoplay=False, label="Audio")
+        new_comp_video = gr.Video(value=str(url_video), autoplay=True, height=400, label="Video")
+        history_messages.append({'role': 'user', 'content': question})
+        history_messages.append({'role': 'assistant', 'content': output})
+    else:
+        chatbot.append([question, output])
+        new_comp_audio = gr.Audio(value=str(url_audio), autoplay=False, label="Audio")
+        new_comp_video = gr.Video(value=str(url_video), autoplay=True, height=400, label="Video")
+        history_messages.append({'role': 'user', 'content': question})
+        history_messages.append({'role': 'assistant', 'content': output})
+    return chatbot, new_comp_audio, new_comp_video, df_table_times
 def _query_pinecone(embedding):
+    if tf.test.is_gpu_available():
+        results = index.query(
+                        vector=embedding,
+                        top_k=10,
+                        include_metadata=True,
+                    )
+        final_results = """"""
+        for result in results['matches']:
+            final_results += f"{result['metadata']['text']}\n"
+    else:
+        results = index.query(
+                        vector=embedding,
+                        top_k=10,
+                        include_metadata=True,
+                    )
+        final_results = """"""
+        for result in results['matches']:
+            final_results += f"{result['metadata']['text']}\n"
     return final_results
 def _general_prompt(context):
+    if tf.test.is_gpu_available():
+        with open("prompt_general.txt", "r") as file:
+            file_prompt = file.read().replace("\n", "")
+        context_prompt = file_prompt.replace('CONTEXT', context)
+        print(context_prompt)
+        print("--------------------")
+    else:
+        with open("prompt_general.txt", "r") as file:
+            file_prompt = file.read().replace("\n", "")
+        context_prompt = file_prompt.replace('CONTEXT', context)
+        print(context_prompt)
+        print("--------------------")
     return context_prompt
 def _call_embedding(text: str):
+    if tf.test.is_gpu_available():
+        response = openai_client.embeddings.create(
+            input=text,
+            model='text-embedding-ada-002'
+        )
+    else:
+        response = openai_client.embeddings.create(
+            input=text,
+            model='text-embedding-ada-002'
+        )
     return response.data[0].embedding
 def _call_gpt(prompt: str, message: str):
+    if tf.test.is_gpu_available():
+        response = openai_client.chat.completions.create(
+            model=MODEL_OPENAI,
+            temperature=0.2,
+            messages=[
+                {'role': 'system', 'content': prompt},
+                {'role': 'user', 'content': message}
+            ]
+        )
+    else:
+        response = openai_client.chat.completions.create(
+            model=MODEL_OPENAI,
+            temperature=0.2,
+            messages=[
+                {'role': 'system', 'content': prompt},
+                {'role': 'user', 'content': message}
+            ]
+        )
     return response.choices[0].message.content
 def _call_gpt_standalone(prompt: str):
+    if tf.test.is_gpu_available():
+        response = openai_client.chat.completions.create(
+            model=MODEL_OPENAI,
+            temperature=0.2,
+            messages=[
+                {'role': 'system', 'content': prompt},
+            ]
+        )
+    else:
+        response = openai_client.chat.completions.create(
+            model=MODEL_OPENAI,
+            temperature=0.2,
+            messages=[
+                {'role': 'system', 'content': prompt},
+            ]
+        )
     return response.choices[0].message.content
 def _get_standalone_question(question, history_messages):
+    if tf.test.is_gpu_available():
+        with open("prompt_standalone_message.txt", "r") as file:
+            file_prompt_standalone = file.read().replace("\n", "")
+        history = ''
+        for i, msg in enumerate(history_messages):
+            try:
+                if i == 0:
+                    continue  # Omit the prompt
+                if i % 2 == 0:
+                    history += f'user: {msg["content"]}\n'
+                else:
+                    history += f'assistant: {msg["content"]}\n'
+            except Exception as e:
+                print(e)
+        prompt_standalone = file_prompt_standalone.replace('HISTORY', history).replace('QUESTION', question)
+        standalone_msg_q = _call_gpt_standalone(prompt_standalone)
+        print(standalone_msg_q)
+        print("------------------")
+    else:
+        with open("prompt_standalone_message.txt", "r") as file:
+            file_prompt_standalone = file.read().replace("\n", "")
+        history = ''
+        for i, msg in enumerate(history_messages):
+            try:
+                if i == 0:
+                    continue  # Omit the prompt
+                if i % 2 == 0:
+                    history += f'user: {msg["content"]}\n'
+                else:
+                    history += f'assistant: {msg["content"]}\n'
+            except Exception as e:
+                print(e)
+        prompt_standalone = file_prompt_standalone.replace('HISTORY', history).replace('QUESTION', question)
+        standalone_msg_q = _call_gpt_standalone(prompt_standalone)
+        print(standalone_msg_q)
+        print("------------------")
+    return standalone_msg_q
+def _create_clean_message(text: str):
+    clean_answer = re.sub(r'http[s]?://\S+', 'el siguiente link', text)
+    return clean_answer
+def _create_audio(clean_text: str):
+    if tf.test.is_gpu_available():
+        download_credentials()
+        create_folders()
+        STORAGE_CLIENT = storage.Client.from_service_account_json(CREDENTIALS_GCP)
+        unique_id = str(uuid.uuid4())
+        # Create audio file
+        client_elevenlabs = ElevenLabs(api_key=API_KEY_ELEVENLABS)
+        voice_custom = Voice(voice_id = "ZQe5CZNOzWyzPSCn5a3c")
+        audio = client_elevenlabs.generate(
+            text=clean_text,
+            voice=voice_custom,
+            model="eleven_multilingual_v2"
+        )
+        source_audio_file_name = f'./audios/file_audio_{unique_id}.wav'
         try:
+            save(audio, source_audio_file_name)
         except Exception as e:
             print(e)
+        # Save audio and get url of gcp
+        destination_blob_name_audio = unique_id + '.wav'
+        bucket = STORAGE_CLIENT.bucket(NAME_BUCKET)
+        blob = bucket.blob(destination_blob_name_audio)
+        try:
+            blob.upload_from_filename(source_audio_file_name)
+        except Exception as e:
+            print(e)
+        signed_url_audio = "None"
+        try:
+            url_expiration = timedelta(minutes=15)
+            signed_url_audio = blob.generate_signed_url(expiration=url_expiration)
+        except Exception as e:
+            print(e)
+    else:
+        download_credentials()
+        create_folders()
+        STORAGE_CLIENT = storage.Client.from_service_account_json(CREDENTIALS_GCP)
+        unique_id = str(uuid.uuid4())
+        # Create audio file
+        client_elevenlabs = ElevenLabs(api_key=API_KEY_ELEVENLABS)
+        voice_custom = Voice(voice_id = "ZQe5CZNOzWyzPSCn5a3c")
+        audio = client_elevenlabs.generate(
+            text=clean_text,
+            voice=voice_custom,
+            model="eleven_multilingual_v2"
+        )
+        source_audio_file_name = f'./audios/file_audio_{unique_id}.wav'
+        try:
+            save(audio, source_audio_file_name)
+        except Exception as e:
+            print(e)
+        # Save audio and get url of gcp
+        destination_blob_name_audio = unique_id + '.wav'
+        bucket = STORAGE_CLIENT.bucket(NAME_BUCKET)
+        blob = bucket.blob(destination_blob_name_audio)
+        try:
+            blob.upload_from_filename(source_audio_file_name)
+        except Exception as e:
+            print(e)
+        signed_url_audio = "None"
+        try:
+            url_expiration = timedelta(minutes=15)
+            signed_url_audio = blob.generate_signed_url(expiration=url_expiration)
+        except Exception as e:
+            print(e)
+    return signed_url_audio, unique_id
+def _create_video(link_audio: str, unique_id: str):
+    if tf.test.is_gpu_available():
+        STORAGE_CLIENT = storage.Client.from_service_account_json(CREDENTIALS_GCP)
+        bucket = STORAGE_CLIENT.bucket(NAME_BUCKET)
+        # Create video talk with file audio created by elevenlabs api
+        url_did = "https://api.d-id.com/talks"
+        payload = {
+            "script": {
+                "type": "audio",
+                "provider": {
+                    "type": "microsoft",
+                    "voice_id": "en-US-JennyNeural"
+                },
+                "ssml": "false",
+                "audio_url": link_audio
+            },
+            "config": {
+                "fluent": "false",
+                "pad_audio": "0.0",
+                "stitch": True
+            },
+            "source_url": IMG_XAVY
+        }
+        headers = {
+            "accept": "application/json",
+            "content-type": "application/json",
+            "authorization": f"Basic {D_ID_KEY}"
+        }
+        request_create_talk = requests.post(url_did, json=payload, headers=headers)
+        resp_create_talk = request_create_talk.json()
+        talk_id = "None"
+        try:
+            talk_id = resp_create_talk['id']
+        except Exception as e:
+            print(e)
+        # Get url of video file
+        url_get_talk_id = f"https://api.d-id.com/talks/{talk_id}"
+        while True:
+            request_video_url = requests.get(url_get_talk_id, headers=headers)
+            resp_video_url = request_video_url.json()
+            if resp_video_url['status'] == 'done':
+                break
+            # Sleep until the video is ready
+            time.sleep(0.5)
+        result_url_video = resp_video_url['result_url']
+        # Saves the video into a file to later upload it to the GCP
+        source_video_file_name = f'./videos/video_final_{unique_id}.mp4'
+        request_video = requests.get(result_url_video)
+        if request_video.status_code == 200:
+            with open(source_video_file_name, 'wb') as outfile:
+                outfile.write(request_video.content)
+        # Save video file to the GCP
+        destination_blob_name_video = unique_id + '.mp4'
+        # Configure bucket
+        blob = bucket.blob(destination_blob_name_video)
+        try:
+            blob.upload_from_filename(source_video_file_name)
+        except Exception as e:
+            print(e)
+        signed_url_video = "None"
+        try:
+            url_expiration_video = timedelta(minutes=15)
+            signed_url_video = blob.generate_signed_url(expiration=url_expiration_video)
+        except Exception as e:
+            print(e)
+    else:
+        STORAGE_CLIENT = storage.Client.from_service_account_json(CREDENTIALS_GCP)
+        bucket = STORAGE_CLIENT.bucket(NAME_BUCKET)
+        # Create video talk with file audio created by elevenlabs api
+        url_did = "https://api.d-id.com/talks"
+        payload = {
+            "script": {
+                "type": "audio",
+                "provider": {
+                    "type": "microsoft",
+                    "voice_id": "en-US-JennyNeural"
+                },
+                "ssml": "false",
+                "audio_url": link_audio
+            },
+            "config": {
+                "fluent": "false",
+                "pad_audio": "0.0",
+                "stitch": True
+            },
+            "source_url": IMG_XAVY
+        }
+        headers = {
+            "accept": "application/json",
+            "content-type": "application/json",
+            "authorization": f"Basic {D_ID_KEY}"
+        }
+        request_create_talk = requests.post(url_did, json=payload, headers=headers)
+        resp_create_talk = request_create_talk.json()
+        talk_id = "None"
+        try:
+            talk_id = resp_create_talk['id']
+        except Exception as e:
+            print(e)
+        # Get url of video file
+        url_get_talk_id = f"https://api.d-id.com/talks/{talk_id}"
+        while True:
+            request_video_url = requests.get(url_get_talk_id, headers=headers)
+            resp_video_url = request_video_url.json()
+            if resp_video_url['status'] == 'done':
+                break
+            # Sleep until the video is ready
+            time.sleep(0.5)
+        result_url_video = resp_video_url['result_url']
+        # Saves the video into a file to later upload it to the GCP
+        source_video_file_name = f'./videos/video_final_{unique_id}.mp4'
+        request_video = requests.get(result_url_video)
+        if request_video.status_code == 200:
+            with open(source_video_file_name, 'wb') as outfile:
+                outfile.write(request_video.content)
+        # Save video file to the GCP
+        destination_blob_name_video = unique_id + '.mp4'
+        # Configure bucket
+        blob = bucket.blob(destination_blob_name_video)
+        try:
+            blob.upload_from_filename(source_video_file_name)
+        except Exception as e:
+            print(e)
+        signed_url_video = "None"
+        try:
+            url_expiration_video = timedelta(minutes=15)
+            signed_url_video = blob.generate_signed_url(expiration=url_expiration_video)
+        except Exception as e:
+            print(e)
+    return signed_url_video
+def get_answer(question: str, chatbot: list[tuple[str, str]], history_messages, comp_audio, comp_video, df_table):
     """
     Gets the answer of the chatbot
     """
     if len(chatbot) == 8:
         message_output = 'Un placer haberte ayudado, hasta luego!'
     else:
+        start_get_standalone_question = time.time()
         standalone_msg_q = _get_standalone_question(question, history_messages) # create standalone question or message
+        end_get_standalone_question = time.time()
+        time_get_standalone_question = end_get_standalone_question - start_get_standalone_question
+        start_call_embedding = time.time()
         output_embedding = _call_embedding(standalone_msg_q) # create embedding of standalone question or message
+        end_call_embedding = time.time()
+        time_call_embedding = end_call_embedding - start_call_embedding
+        start_query_pinecone = time.time()
         best_results = _query_pinecone(output_embedding) # get nearest embeddings
+        end_query_pinecone = time.time()
+        time_query_pinecone = end_query_pinecone - start_query_pinecone
+        start_general_prompt = time.time()
         final_context_prompt = _general_prompt(best_results) # create context/general prompt
+        end_general_prompt = time.time()
+        time_general_prompt = end_general_prompt - start_general_prompt
+        start_call_gpt = time.time()
+        message_output = _call_gpt(final_context_prompt, question) # final response (to user)
+        end_call_gpt = time.time()
+        time_call_gpt = end_call_gpt - start_call_gpt
     if "Respuesta:" in message_output:
         message_output.replace("Respuesta:", "")
+    start_create_clean_message = time.time()
+    processed_message = _create_clean_message(message_output) # clean message output
+    end_create_clean_message = time.time()
+    time_create_clean_message = end_create_clean_message - start_create_clean_message
+    start_create_audio = time.time()
+    url_audio, unique_id = _create_audio(processed_message) # create audio with elevenlabs
+    end_create_audio = time.time()
+    time_create_audio = end_create_audio - start_create_audio
+    start_create_video = time.time()
+    url_video = _create_video(url_audio, unique_id) # create video with d-id no streaming
+    end_create_video = time.time()
+    time_create_video = end_create_video - start_create_video
+    final_time = time_get_standalone_question + time_call_embedding + time_query_pinecone + time_general_prompt
+    final_time += (time_call_gpt + time_create_clean_message + time_create_audio + time_create_video)
+    df_table = pd.DataFrame(df_table)
+    df_table.loc[len(df_table.index)] = [question,
+                                         message_output,
+                                         time_get_standalone_question,
+                                         time_call_embedding,
+                                         time_query_pinecone,
+                                         time_general_prompt,
+                                         time_call_gpt,
+                                         time_create_clean_message,
+                                         time_create_audio,
+                                         time_create_video,
+                                         final_time]
+    new_df_table = gr.DataFrame(df_table, interactive=False, visible=True)
     print(history_messages)
+    return _update_elements(question, chatbot, message_output, history_messages, url_audio, url_video, new_df_table)
+def init_greeting(chatbot, history_messages):
+    if len(chatbot) == 0:
+        greeting = ('Hola 👋, soy Roll, tu asistente de recomendación de series y películas animadas en Crunchyroll. ¿En qué puedo ayudarte hoy?')
+        history_messages.append({'role': 'assistant', 'content': greeting})
+        chatbot.append([None, greeting])
+    return chatbot, history_messages
+def export_dataframe(df):
+    final_df = pd.DataFrame(df)
+    final_df = final_df.iloc[1:]
+    final_df.to_csv("./csv_times/csv_times.csv", index=False, encoding='utf-8')

gcp.py ADDED Viewed

	@@ -0,0 +1,28 @@

+import os
+from pathlib import Path
+from datetime import timedelta
+from google.cloud import storage
+from huggingface_hub import hf_hub_download
+from google.cloud.storage import transfer_manager
+from dotenv import load_dotenv
+load_dotenv()
+REPO_HUGGING = os.getenv("REPO_HUGGING")
+HUB_TOKEN = os.getenv("HUB_TOKEN")
+def download_credentials() -> None:
+    """
+    Downloads the GCP credentials from Hugging Face Hub
+    """
+    assets_dir = 'assets'
+    credentials_file = os.path.join(assets_dir, "credentials.json")
+    # Verificar si la carpeta 'assets' existe y crearla si no
+    os.makedirs(assets_dir, exist_ok=True)
+    # Verificar si el archivo 'credentials.json' ya existe en la carpeta 'assets'
+    if not os.path.isfile(credentials_file):
+        hf_hub_download(
+            repo_id=REPO_HUGGING, repo_type='dataset', filename="credentials.json",
+            token=HUB_TOKEN, local_dir=assets_dir
+        )

utils.py CHANGED Viewed

@@ -1,4 +1,5 @@
 import gradio as gr
 def make_invisible():
     """
@@ -12,3 +13,21 @@ def make_visible():
     Makes visibles a rows
     """
     return gr.Row.update(visible=True)

 import gradio as gr
+import os
 def make_invisible():
     """
     Makes visibles a rows
     """
     return gr.Row.update(visible=True)
+def create_folders():
+    """
+    Creates 'audios' and 'videos' directories if they do not exist
+    """
+    audio_dir = 'audios'
+    video_dir = 'videos'
+    times_dir = 'csv_times'
+    if not os.path.exists(audio_dir):
+        os.makedirs(audio_dir)
+    if not os.path.exists(video_dir):
+        os.makedirs(video_dir)
+    if not os.path.exists(times_dir):
+        os.makedirs(times_dir)