Transformer-foundational - a David-ipynb Collection

David-ipynb 's Collections

Transformer-foundational

Transformer-foundational

updated Dec 21, 2023

SwitchHead: Accelerating Transformers with Mixture-of-Experts Attention

Paper • 2312.07987 • Published Dec 13, 2023 • 40
LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 258