neuralmagic
/

Meta-Llama-3.1-8B-quantized.w8a16

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-8B-quantized.w8a16 / README.md

Commit History

Update README.md

302fdc8
verified

alexmarques commited on Aug 13

Update README.md

ddadfa9
verified

alexmarques commited on Jul 31

Update README.md

b5146ed
verified

alexmarques commited on Jul 31

Create README.md

257f5ca
verified

alexmarques commited on Jul 31