Spaces:

jaymojnidar
/

ml27b

Runtime error

jaymojnidar commited on Sep 15, 2023

Commit

5bfa3aa

•

1 Parent(s): 1cb615a

trying out the sharded vesion

Files changed (1) hide show

model.py CHANGED Viewed

@@ -7,7 +7,8 @@ from transformers import AutoConfig, AutoModelForCausalLM, AutoTokenizer, TextIt
 from huggingface_hub import login
 # model_id = 'meta-llama/Llama-2-13b-chat-hf'
-model_id = 'meta-llama/Llama-2-7b-chat-hf'
 if torch.cuda.is_available():
     tok = os.environ['HF_TOKEN']

 from huggingface_hub import login
 # model_id = 'meta-llama/Llama-2-13b-chat-hf'
+#model_id = 'meta-llama/Llama-2-7b-chat-hf'
+model_id = 'Trelis/Llama-2-7b-chat-hf-sharded-bf16'
 if torch.cuda.is_available():
     tok = os.environ['HF_TOKEN']