Phú Võ's picture

73 11

Phú Võ

phuvo

·

phuvo

AI & ML interests

None yet

Recent Activity

upvoted a paper about 2 months ago

Addition is All You Need for Energy-efficient Language Models

upvoted a paper about 2 months ago

Ruler: A Model-Agnostic Method to Control Generated Length for Large Language Models

upvoted a paper about 2 months ago

VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models

View all activity

Organizations

None yet

phuvo's activity

upvoted 3 papers about 2 months ago

Addition is All You Need for Energy-efficient Language Models

Paper • 2410.00907 • Published Oct 1 • 144

Ruler: A Model-Agnostic Method to Control Generated Length for Large Language Models

Paper • 2409.18943 • Published Sep 27 • 27

VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models

Paper • 2409.17066 • Published Sep 25 • 27

upvoted 2 papers 2 months ago

MIO: A Foundation Model on Multimodal Tokens

Paper • 2409.17692 • Published Sep 26 • 51

Emu3: Next-Token Prediction is All You Need

Paper • 2409.18869 • Published Sep 27 • 91

upvoted a paper 3 months ago

OLMoE: Open Mixture-of-Experts Language Models

Paper • 2409.02060 • Published Sep 3 • 77

liked a model 3 months ago

Sao10K/L3.1-70B-Euryale-v2.2

Updated Aug 25 • 5.39k • 53

upvoted 7 papers 4 months ago

LongWriter: Unleashing 10,000+ Word Generation from Long Context LLMs

Paper • 2408.07055 • Published Aug 13 • 65

SAM 2: Segment Anything in Images and Videos

Paper • 2408.00714 • Published Aug 1 • 108

The Llama 3 Herd of Models

Paper • 2407.21783 • Published Jul 31 • 107

Scalify: scale propagation for efficient low-precision LLM training

Paper • 2407.17353 • Published Jul 24 • 12

Scaling Granite Code Models to 128K Context

Paper • 2407.13739 • Published Jul 18 • 19

EfficientQAT: Efficient Quantization-Aware Training for Large Language Models

Paper • 2407.11062 • Published Jul 10 • 8

Spectra: A Comprehensive Study of Ternary, Quantized, and FP16 Language Models

Paper • 2407.12327 • Published Jul 17 • 77

upvoted 2 papers 5 months ago

Qwen2 Technical Report

Paper • 2407.10671 • Published Jul 15 • 157

Unveiling Encoder-Free Vision-Language Models

Paper • 2406.11832 • Published Jun 17 • 49

liked a model 5 months ago

Sao10K/Fimbulvetr-11B-v2.1-16K

Text Generation • Updated Jun 29 • 38 • 17

upvoted 2 papers 5 months ago

Leave No Document Behind: Benchmarking Long-Context LLMs with Extended Multi-Doc QA

Paper • 2406.17419 • Published Jun 25 • 16

Language Models are Surprisingly Fragile to Drug Names in Biomedical Benchmarks

Paper • 2406.12066 • Published Jun 17 • 8

liked a dataset 6 months ago

edinburgh-dawg/mmlu-redux

Viewer • Updated Aug 9 • 3k • 1.23k • 26