Spaces:

imperialwool
/

llama-cpp-api

Sleeping

App Files Files Community

toaster61 commited on Oct 3, 2023

Commit

18aac0c

1 Parent(s): 021692e

oops fixing silly mistakes

Browse files

Files changed (2) hide show

README.md +1 -1
gradio_app.py +0 -35

README.md CHANGED Viewed

@@ -7,4 +7,4 @@ sdk: docker
 pinned: true
 ---
-I build this just for fun. Please clone this space to personal use. Test API you can here.

 pinned: true
 ---
+I build this just for fun. Please clone this space to personal use. Test API you can here.

gradio_app.py CHANGED Viewed

@@ -36,41 +36,6 @@ Or you can once follow steps in Dockerfile and try it on your machine, not in Do
 with open('system.prompt', 'r', encoding='utf-8') as f:
     prompt = f.read()
-# this model was loaded from https://hf.co/models
-model = AutoModelForSeq2SeqLM.from_pretrained("facebook/nllb-200-distilled-600M")
-tokenizer = AutoTokenizer.from_pretrained("facebook/nllb-200-distilled-600M")
-device = 0 if torch.cuda.is_available() else -1
-LANGS = ["ace_Arab", "eng_Latn", "fra_Latn", "spa_Latn"]
-def t1ranslate(text, src_lang, tgt_lang):
-    try:
-        maxTokens = data.get("max_tokens", 64)
-        if isinstance(data.get("system_prompt"), str):
-            userPrompt = data.get("system_prompt") + "\n\nUser: " + data['request'] + "\nAssistant: "
-        else:
-            userPrompt = prompt + "\n\nUser: " + data['request'] + "\nAssistant: "
-    except:
-        return {"error": "Not enough data", "output": "Oops! Error occured! If you're a developer, using this API, check 'error' key."}, 400
-    try:
-        output = llm(userPrompt, max_tokens=maxTokens, stop=["User:", "\n"], echo=False)
-        text = output["choices"][0]["text"]
-        # i allowed only certain languages:
-        # russian (ru), ukranian (uk), chinese (zh)
-        if isinstance(data.get("target_lang"), str) and data.get("target_lang").lower() in ["ru", "uk", "zh"]:
-            encoded_input = translator_tokenizer(output, return_tensors="pt")
-            generated_tokens = translator_model.generate(
-                **encoded_input, forced_bos_token_id=translator_tokenizer.get_lang_id(data.get("target_lang"))
-            )
-            translated_text = translator_tokenizer.batch_decode(
-                generated_tokens, skip_special_tokens=True
-            )[0]
-            return {"output": text, "translated_output": translated_text}
-        return {"output": text}
-    except Exception as e:
-        print(e)
-        return {"error": str(e), "output": "Oops! Internal server error. Check the logs. If you're a developer, using this API, check 'error' key."}, 500
 def translate(request: str, max_tokens: int = 256, language: str = "en", custom_prompt: str = None):
     try:
         maxTokens = max_tokens if 16 <= max_tokens <= 256 else 64

 with open('system.prompt', 'r', encoding='utf-8') as f:
     prompt = f.read()
 def translate(request: str, max_tokens: int = 256, language: str = "en", custom_prompt: str = None):
     try:
         maxTokens = max_tokens if 16 <= max_tokens <= 256 else 64