hf-llm-api

Running

Hansimov commited on Jun 25

Commit

8697de8

•

1 Parent(s): 51ebd18

:boom: [Fix] slow tokenizer issue, and finish by stop_sequences

Files changed (2) hide show

messagers/message_composer.py CHANGED Viewed

@@ -152,7 +152,10 @@ class MessageComposer:
         # https://huggingface.co/openchat/openchat-3.5-0106
         # https://huggingface.co/01-ai/Yi-1.5-34B-Chat
         elif self.model in ["openchat-3.5", "command-r-plus", "gemma-7b", "yi-1.5-34b"]:
-            tokenizer = AutoTokenizer.from_pretrained(self.model_fullname)
             self.merged_str = tokenizer.apply_chat_template(
                 messages, tokenize=False, add_generation_prompt=True
             )

         # https://huggingface.co/openchat/openchat-3.5-0106
         # https://huggingface.co/01-ai/Yi-1.5-34B-Chat
         elif self.model in ["openchat-3.5", "command-r-plus", "gemma-7b", "yi-1.5-34b"]:
+            # https://discuss.huggingface.co/t/error-with-new-tokenizers-urgent/2847/5
+            tokenizer = AutoTokenizer.from_pretrained(
+                self.model_fullname, use_fast=False
+            )
             self.merged_str = tokenizer.apply_chat_template(
                 messages, tokenize=False, add_generation_prompt=True
             )

networks/huggingface_streamer.py CHANGED Viewed

@@ -157,15 +157,15 @@ class HuggingfaceStreamer:
             content = self.parse_line(line)
-            if content.strip() == self.stop_sequences:
-                content_type = "Finished"
-                logger.success("\n[Finished]")
-                is_finished = True
-            else:
-                content_type = "Completions"
-                if line_count == 1:
-                    content = content.lstrip()
-                logger.back(content, end="")
             output = self.message_outputer.output(
                 content=content, content_type=content_type

             content = self.parse_line(line)
+            # if content.strip() == self.stop_sequences:
+            #     content_type = "Finished"
+            #     logger.success("\n[Finished]")
+            #     is_finished = True
+            # else:
+            content_type = "Completions"
+            if line_count == 1:
+                content = content.lstrip()
+            logger.back(content, end="")
             output = self.message_outputer.output(
                 content=content, content_type=content_type