RedHatAI
/

Meta-Llama-3.1-8B-Instruct-quantized.w4a16

Text Generation

4-bit precision

compressed-tensors

text-generation-inference

4-bit precision

Model card Files Files and versions

Meta-Llama-3.1-8B-Instruct-quantized.w4a16

Ctrl+K

Ctrl+K

5 contributors

History: 24 commits

robgreenberg3's picture

Update README.md

5fea09e verified 9 days ago