Spaces:

Dovakiins
/

qwerrwe

Build error

Tazik Shahjahan

winglian commited on Dec 29, 2023

Commit

3678a6c

•

1 Parent(s): f8ae59b

Fix: bf16 support for inference (#981)

* Fix: bf16 torch dtype

* simplify casting to device and dtype

---------

Co-authored-by: Wing Lian <wing.lian@gmail.com>

Files changed (1) hide show

src/axolotl/cli/__init__.py CHANGED Viewed

@@ -103,7 +103,7 @@ def do_inference(
             importlib.import_module("axolotl.prompters"), prompter
         )
-    model = model.to(cfg.device)
     while True:
         print("=" * 80)
@@ -168,7 +168,7 @@ def do_inference_gradio(
             importlib.import_module("axolotl.prompters"), prompter
         )
-    model = model.to(cfg.device)
     def generate(instruction):
         if not instruction:

             importlib.import_module("axolotl.prompters"), prompter
         )
+    model = model.to(cfg.device, dtype=cfg.torch_dtype)
     while True:
         print("=" * 80)
             importlib.import_module("axolotl.prompters"), prompter
         )
+    model = model.to(cfg.device, dtype=cfg.torch_dtype)
     def generate(instruction):
         if not instruction: