Spaces:

matthoffner
/

starchat-ggml

Paused

matthoffner commited on May 29, 2023

Commit

86f94f0

•

1 Parent(s): 0d521c3

Update main.py

Files changed (1) hide show

main.py CHANGED Viewed

@@ -34,12 +34,45 @@ async def index():
 class ChatCompletionRequest(BaseModel):
     prompt: str
 @app.post("/v1/chat/completions")
 async def chat(request: ChatCompletionRequest, response_mode=None):
     tokens = llm.tokenize(request.prompt)
     async def server_sent_events(chat_chunks, llm):
         for token in llm.generate(chat_chunks):
             yield llm.detokenize(token)
     return EventSourceResponse(server_sent_events(tokens, llm))

 class ChatCompletionRequest(BaseModel):
     prompt: str
+@app.get("/demo")
+async def demo():
+    html_content = """
+    <!DOCTYPE html>
+    <html>
+        <body>
+            <div id="content"></div>
+            <script>
+              var source = new EventSource("https://matthoffner-starchat-alpha.hf.space/stream");
+              source.onmessage = function(event) {
+                document.getElementById("content").innerHTML += event.data
+              };
+            </script>
+        </body>
+    </html>
+    """
+    return HTMLResponse(content=html_content, status_code=200)
+@app.get("/stream")
+async def chat(prompt = "Write a simple express erver"):
+    tokens = llm.tokenize(prompt)
+    async def server_sent_events(chat_chunks, llm):
+        yield prompt
+        for chat_chunk in llm.generate(chat_chunks):
+            yield llm.detokenize(chat_chunk)
+        yield ""
+    return EventSourceResponse(server_sent_events(tokens, llm))
 @app.post("/v1/chat/completions")
 async def chat(request: ChatCompletionRequest, response_mode=None):
     tokens = llm.tokenize(request.prompt)
     async def server_sent_events(chat_chunks, llm):
         for token in llm.generate(chat_chunks):
             yield llm.detokenize(token)
+        yield ""
     return EventSourceResponse(server_sent_events(tokens, llm))