Furu Wei's picture

11 7 3

Furu Wei

thegenerality

·

AI & ML interests

None yet

Recent Activity

upvoted a paper 18 days ago

BitNet a4.8: 4-bit Activations for 1-bit LLMs

authored a paper about 2 months ago

Data Selection via Optimal Control for Language Models

authored a paper about 2 months ago

Self-Boosting Large Language Models with Synthetic Preference Data

View all activity

Organizations

None yet

thegenerality's activity

upvoted a paper 18 days ago

BitNet a4.8: 4-bit Activations for 1-bit LLMs

Paper • 2411.04965 • Published 18 days ago • 63

upvoted a paper about 2 months ago

Differential Transformer

Paper • 2410.05258 • Published Oct 7 • 166

upvoted a paper 4 months ago

Q-Sparse: All Large Language Models can be Fully Sparsely-Activated

Paper • 2407.10969 • Published Jul 15 • 20

upvoted a paper 5 months ago

Direct Preference Knowledge Distillation for Large Language Models

Paper • 2406.19774 • Published Jun 28 • 21

upvoted a paper 9 months ago

Synthetic Data (Almost) from Scratch: Generalized Instruction Tuning for Language Models

Paper • 2402.13064 • Published Feb 20 • 47

upvoted a paper about 1 year ago

BitNet: Scaling 1-bit Transformers for Large Language Models

Paper • 2310.11453 • Published Oct 17, 2023 • 96

upvoted a paper over 1 year ago

Retentive Network: A Successor to Transformer for Large Language Models

Paper • 2307.08621 • Published Jul 17, 2023 • 170