Quant papers - a lucadordoni Collection

lucadordoni 's Collections

Quant papers

updated Oct 1

VPTQ: Extreme Low-bit Vector Post-Training Quantization for Large Language Models

Paper • 2409.17066 • Published Sep 25 • 27