neuralmagic
/

Meta-Llama-3.1-8B-quantized.w8a8

Text Generation

8-bit precision

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-8B-quantized.w8a8

Commit History

Update README.md

ee0babf
verified

alexmarques commited on 24 days ago

Update README.md

3244507
verified

alexmarques commited on 24 days ago

Updated compression_config to quantization_config

25b1dc9
verified

mgoin commited on Oct 9

Update README.md

f2a9838
verified

alexmarques commited on Aug 21

Update README.md

043563b
verified

alexmarques commited on Aug 21

Update README.md

82e54a3
verified

alexmarques commited on Aug 21

Update README.md

be254c0
verified

alexmarques commited on Aug 13

Create README.md

1eed01c
verified

alexmarques commited on Jul 31

Upload folder using huggingface_hub

faa056e
verified

alexmarques commited on Jul 31

initial commit

8604987
verified

alexmarques commited on Jul 31