neuralmagic-ent
/

Llama-3.1-70B-Instruct-quantized.w4a16

Text Generation

4-bit precision

Model card Files Files and versions Community

Llama-3.1-70B-Instruct-quantized.w4a16

1 contributor

History: 2 commits

nm-research's picture

Upload folder using huggingface_hub

b96b4b7 verified 8 days ago