neuralmagic
/

Llama-2-7b-chat-quantized.w4a16

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

Model card Files Files and versions Community

Llama-2-7b-chat-quantized.w4a16 / config.json

Commit History

Upload config.json with huggingface_hub

64c7af1
verified

abhinavnmagic commited on Jul 11