tiiuae
/

falcon-rw-7b

Text Generation

text-generation-inference

Model card Files Files and versions Community

Daniel Hesslow commited on May 24, 2023

Commit

7c97a6c

•

1 Parent(s): 995be34

Update modelling_RW.py

Files changed (1) hide show

modelling_RW.py +2 -2

modelling_RW.py CHANGED Viewed

@@ -21,7 +21,7 @@ from transformers.modeling_outputs import (
 )
 from transformers.modeling_utils import PreTrainedModel
 from transformers.utils import logging
-from configuration_RW import RWConfig
 logger = logging.get_logger(__name__)
@@ -303,7 +303,7 @@ class Attention(nn.Module):
                 attention_scores = attention_scores.to(torch.float32)
             # attn_weights = torch.masked_fill(attention_scores, attention_mask, torch.finfo(attention_scores.dtype).min)
             attention_probs = F.softmax(
-                (attention_scores + alibi) * self.inv_norm_factor + attention_mask_float,
                 dim=-1,
                 dtype=hidden_states.dtype,
             )

 )
 from transformers.modeling_utils import PreTrainedModel
 from transformers.utils import logging
+from .configuration_RW import RWConfig
 logger = logging.get_logger(__name__)
                 attention_scores = attention_scores.to(torch.float32)
             # attn_weights = torch.masked_fill(attention_scores, attention_mask, torch.finfo(attention_scores.dtype).min)
             attention_probs = F.softmax(
+                (attention_scores + alibi.view(batch_size, self.num_heads, 1, -1)) * self.inv_norm_factor + attention_mask_float,
                 dim=-1,
                 dtype=hidden_states.dtype,
             )