Spaces:

SkyNetWalker
/

HF-LLMs

Running

SkyNetWalker commited on 19 days ago

Commit

dc9a7b6

verified ·

1 Parent(s): e528476

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -53,22 +53,29 @@ def respond(
     messages.append({"role": "user", "content": message})
     response = ""
     print("Sending request to Hugging Face API.")
-    for chunk in client.chat.completions.create(
         model=model_name,
         messages=messages,
         max_tokens=max_tokens,
         temperature=temperature,
         top_p=top_p,
         stream=True
-    ):
-        # Correctly access the delta content from Hugging Face's response format
-        token = chunk.choices[0].delta.content or ""
-        print(f"Received token: {token}")
-        response += token
-        yield response
     print("Completed response generation.")

     messages.append({"role": "user", "content": message})
     response = ""
     print("Sending request to Hugging Face API.")
+    stream = client.chat.completions.create(
         model=model_name,
         messages=messages,
         max_tokens=max_tokens,
         temperature=temperature,
         top_p=top_p,
         stream=True
+    )
+    for chunk in stream:
+        try:
+            # Handle Hugging Face's streaming format
+            token = chunk.choices[0].delta.content
+            if token:  # Skip empty tokens
+                response += token
+                yield response
+                print(f"Streamed token: {token}")
+        except AttributeError as e:
+            print(f"Error processing chunk: {e}")
+            continue
     print("Completed response generation.")