LongSafari
/

hyenadna-tiny-16k-seqlen-d128-hf

Text Generation

Model card Files Files and versions Community

matt commited on Jan 18

Commit

66223de

•

1 Parent(s): e83c7ca

Update tokenizer + config

Files changed (2) hide show

config.json +1 -0
tokenization_hyena.py +1 -1

config.json CHANGED Viewed

@@ -24,6 +24,7 @@
   "model_type": "hyenadna",
   "n_layer": 2,
   "num_inner_mlps": 2,
   "pad_vocab_size_multiple": 8,
   "short_filter_order": 3,
   "tie_word_embeddings": false,

   "model_type": "hyenadna",
   "n_layer": 2,
   "num_inner_mlps": 2,
+  "pad_token_id": 4,
   "pad_vocab_size_multiple": 8,
   "short_filter_order": 3,
   "tie_word_embeddings": false,

tokenization_hyena.py CHANGED Viewed

@@ -6,7 +6,7 @@ import os
 class HyenaDNATokenizer(PreTrainedTokenizer):
-    model_input_names = ["input_ids", "attention_mask"]
     def __init__(self,
                  model_max_length: int,

 class HyenaDNATokenizer(PreTrainedTokenizer):
+    model_input_names = ["input_ids"]
     def __init__(self,
                  model_max_length: int,