amazingvince
/

diff-llama

Model card Files Files and versions

amazingvince commited on Oct 12, 2024

Commit

4d0ea8d

·

verified ·

1 Parent(s): c6d61ef

Update modeling_diff_llama.py

Files changed (1) hide show

modeling_diff_llama.py +21 -0

modeling_diff_llama.py CHANGED Viewed

@@ -506,5 +506,26 @@ class DiffLLaMAForCausalLM(PreTrainedModel):
             hidden_states=outputs.hidden_states,
             attentions=outputs.attentions,
         )

             hidden_states=outputs.hidden_states,
             attentions=outputs.attentions,
         )
+    def prepare_inputs_for_generation(
+        self, input_ids, past_key_values=None, attention_mask=None, inputs_embeds=None, **kwargs
+    ):
+        if past_key_values:
+            input_ids = input_ids[:, -1:]
+        # if `inputs_embeds` are passed, we only want to use them in the 1st generation step
+        if inputs_embeds is not None and past_key_values is None:
+            model_inputs = {"inputs_embeds": inputs_embeds}
+        else:
+            model_inputs = {"input_ids": input_ids}
+        model_inputs.update(
+            {
+                "past_key_values": past_key_values,
+                "use_cache": kwargs.get("use_cache"),
+                "attention_mask": attention_mask,
+                "cache_position": kwargs.get("cache_position"),
+            }
+        )
+        return model_inputs