pszemraj
/

nanoT5-base-65kBPE-v2

Text2Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

pszemraj commited on Jul 29

Commit

6308cc3

•

1 Parent(s): a92e613

Update README.md

Files changed (1) hide show

README.md +4 -0

README.md CHANGED Viewed

@@ -8,6 +8,10 @@ language:
 # nanoT5-base-65kBPE-v2
 - SiLU/gated-SiLU activation
 - 25% mask rate during pretrain
 - 65k vocab size, [adapted claude3 tokenizer](https://hf.co/BEE-spoke-data/claude-tokenizer-forT5)

 # nanoT5-base-65kBPE-v2
+> [!NOTE]
+> This is a "raw" pretrained model intended to be fine-tuned on downstream tasks
 - SiLU/gated-SiLU activation
 - 25% mask rate during pretrain
 - 65k vocab size, [adapted claude3 tokenizer](https://hf.co/BEE-spoke-data/claude-tokenizer-forT5)