Kanpredict
/

gptj-6b-8bits

Text Generation

Inference Endpoints

Model card Files Files and versions Community

OssamaLafhel commited on Apr 5, 2023

Commit

859f302

·

1 Parent(s): 35d9624

Update handler.py

Files changed (1) hide show

handler.py +0 -26

handler.py CHANGED Viewed

@@ -1,7 +1,5 @@
 import time
 import json
-from fastapi import FastAPI
-from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel
 import transformers
 from transformers import pipeline
@@ -159,30 +157,6 @@ class GPTJForCausalLM(transformers.models.gptj.modeling_gptj.GPTJForCausalLM):
 transformers.models.gptj.modeling_gptj.GPTJBlock = GPTJBlock  # monkey-patch GPT-J
-class Message(BaseModel):
-    input: str = None
-    output: dict = None
-    length: str = None
-    temperature: str = None
-app = FastAPI()
-origins = [
-    "http://localhost:8000",
-    "http://localhost",
-    "http://localhost:3000",
-    "http://127.0.0.1:3000"
-]
-app.add_middleware(
-    CORSMiddleware,
-    allow_origins=origins,
-    allow_credentials=True,
-    allow_methods=["POST"],
-    allow_headers=["*"],
-)
 # -----------------------------------------> API <---------------------------------------
 tokenizer = transformers.AutoTokenizer.from_pretrained("EleutherAI/gpt-j-6B")
 model = GPTJForCausalLM.from_pretrained("Kanpredict/gptj-6b-8bits", low_cpu_mem_usage=True)

 import time
 import json
 from pydantic import BaseModel
 import transformers
 from transformers import pipeline
 transformers.models.gptj.modeling_gptj.GPTJBlock = GPTJBlock  # monkey-patch GPT-J
 # -----------------------------------------> API <---------------------------------------
 tokenizer = transformers.AutoTokenizer.from_pretrained("EleutherAI/gpt-j-6B")
 model = GPTJForCausalLM.from_pretrained("Kanpredict/gptj-6b-8bits", low_cpu_mem_usage=True)