darren's picture

2 9 76

darren

computerdarren

·

https://darren.computer

AI & ML interests

biotech, healthcare, poetry

Organizations

upvoted a collection almost 2 years ago

OpenCulture

A multilingual dataset of public domain books and newspapers. • 27 items • Updated Nov 6, 2024 • 132

upvoted 2 papers almost 2 years ago

Grandmaster-Level Chess Without Search

Paper • 2402.04494 • Published Feb 7, 2024 • 69

Scavenging Hyena: Distilling Transformers into Long Convolution Models

Paper • 2401.17574 • Published Jan 31, 2024 • 17

upvoted 3 papers about 2 years ago

Weight subcloning: direct initialization of transformers using larger pretrained ones

Paper • 2312.09299 • Published Dec 14, 2023 • 18

Sparse Finetuning for Inference Acceleration of Large Language Models

Paper • 2310.06927 • Published Oct 10, 2023 • 15

Frustratingly Simple Memory Efficiency for Pre-trained Language Models via Dynamic Embedding Pruning

Paper • 2309.08708 • Published Sep 15, 2023 • 3

upvoted 2 collections about 2 years ago

Pruning

178 items • Updated Sep 23, 2024 • 10

Performance LLMs - Fine tuned

30 items • Updated 26 days ago • 6

upvoted a paper over 2 years ago

DebateSum: A large-scale argument mining and summarization dataset

Paper • 2011.07251 • Published Nov 14, 2020 • 2