neuralmagic-ent
/

Llama-3.1-70B-Instruct-quantized.w4a16

Text Generation

4-bit precision

Model card Files Files and versions Community

Llama-3.1-70B-Instruct-quantized.w4a16

Commit History

Upload folder using huggingface_hub

b96b4b7
verified

nm-research commited on 8 days ago

initial commit

13e3cb6
verified

nm-research commited on 8 days ago