orionweller
/

test-flex-gpt

Model card Files Files and versions Community

oweller2 commited on 28 days ago

Commit

a05f134

•

1 Parent(s): 84cec5b

switch back

Files changed (2) hide show

config.json +3 -3
modeling_flexbert.py +1 -0

config.json CHANGED Viewed

@@ -69,9 +69,9 @@
   "num_attention_heads": 12,
   "num_hidden_layers": 22,
   "num_initial_layers": 1,
-  "pad_logits": false,
   "pad_token_id": 0,
-  "padding": "padded",
   "pooling_type": "cls",
   "position_embedding_type": "absolute",
   "rotary_emb_base": 10000.0,
@@ -82,7 +82,7 @@
   "sliding_window": 128,
   "transformers_version": "4.44.1",
   "type_vocab_size": 2,
-  "unpad_embeddings": false,
   "use_cache": true,
   "use_fa2": true,
   "use_sdpa_attn_mask": false,

   "num_attention_heads": 12,
   "num_hidden_layers": 22,
   "num_initial_layers": 1,
+  "pad_logits": true,
   "pad_token_id": 0,
+  "padding": "unpadded",
   "pooling_type": "cls",
   "position_embedding_type": "absolute",
   "rotary_emb_base": 10000.0,
   "sliding_window": 128,
   "transformers_version": "4.44.1",
   "type_vocab_size": 2,
+  "unpad_embeddings": true,
   "use_cache": true,
   "use_fa2": true,
   "use_sdpa_attn_mask": false,

modeling_flexbert.py CHANGED Viewed

@@ -1650,6 +1650,7 @@ class FlexBertForCausalLM(FlexBertPreTrainedModel):
                 input_ids, attention_mask, position_ids, labels
             )
         hidden_states = self.bert(
             input_ids,
             attention_mask=None,

                 input_ids, attention_mask, position_ids, labels
             )
         hidden_states = self.bert(
             input_ids,
             attention_mask=None,