Spaces:

Dovakiins
/

qwerrwe

Build error

Nanobit commited on Oct 29, 2023

Commit

637ed09

unverified ·

1 Parent(s): 827ec3d

fix(config): Set eos/bos to tokenizer if different (#801)

* fix(config): Set eos/bos to tokenizer if different

* chore: fix lint

Files changed (1) hide show

src/axolotl/utils/models.py CHANGED Viewed

@@ -386,6 +386,20 @@ def load_model(
         )
         model.config.max_position_embeddings = cfg.sequence_len
     if model.device.type == "cuda":
         log_gpu_memory_usage(LOG, "after model load", model.device)

         )
         model.config.max_position_embeddings = cfg.sequence_len
+    if (
+        hasattr(model.config, "bos_token_id")
+        and model.config.bos_token_id
+        and model.config.bos_token_id != tokenizer.bos_token_id
+    ):
+        model.config.bos_token_id = tokenizer.bos_token_id
+    if (
+        hasattr(model.config, "eos_token_id")
+        and model.config.eos_token_id
+        and model.config.eos_token_id != tokenizer.eos_token_id
+    ):
+        model.config.eos_token_id = tokenizer.eos_token_id
     if model.device.type == "cuda":
         log_gpu_memory_usage(LOG, "after model load", model.device)