crumb
/

GLORT2

Text Generation

Model card Files Files and versions Community

crumb commited on Feb 12

Commit

1ee6f60

•

1 Parent(s): e27b807

;)

Files changed (1) hide show

modeling_t2.py +2 -0

modeling_t2.py CHANGED Viewed

@@ -149,6 +149,8 @@ class TransformerAttention(nn.Module):
         super().__init__()
         self.config = config
         self.stage = stage
         self.head_dim = config.hidden_size // config.num_attention_heads
         assert (
             self.head_dim * config.num_attention_heads == config.hidden_size

         super().__init__()
         self.config = config
         self.stage = stage
+        self.max_position_embeddings = config.max_position_embeddings
+        self.rope_theta = config.rope_theta
         self.head_dim = config.hidden_size // config.num_attention_heads
         assert (
             self.head_dim * config.num_attention_heads == config.hidden_size