neuralmagic
/

Meta-Llama-3.1-8B-Instruct-quantized.w8a16

Text Generation

text-generation-inference

Inference Endpoints

compressed-tensors

Model card Files Files and versions Community

Meta-Llama-3.1-8B-Instruct-quantized.w8a16

Commit History

Update README.md

38e03ba
verified

alexmarques commited on Oct 23

Update README.md

9233f20
verified

alexmarques commited on Oct 23

Updated compression_config to quantization_config

7fa8878
verified

mgoin commited on Oct 9

Update README.md

dcf5b96
verified

alexmarques commited on Sep 30

Update README.md

6ef48df
verified

alexmarques commited on Sep 30

Upload tokenizer.json with huggingface_hub

c265f0f
verified

alexmarques commited on Sep 30

Update README.md

2eb1501
verified

alexmarques commited on Sep 30

Upload tokenizer_config.json with huggingface_hub

91597e9
verified

alexmarques commited on Sep 27

Update README.md

3237147
verified

alexmarques commited on Aug 13

Update README.md

0586d92
verified

alexmarques commited on Aug 13

Update README.md

895d636
verified

alexmarques commited on Aug 7

Update README.md

d635de5
verified

alexmarques commited on Aug 7

Update README.md

69291a3
verified

alexmarques commited on Jul 30

Update README.md

caf66fe
verified

alexmarques commited on Jul 29

Update README.md

3927ba7
verified

alexmarques commited on Jul 26

Update README.md

0cfcb53
verified

alexmarques commited on Jul 26

Update README.md

7e4ac27
verified

alexmarques commited on Jul 26

Update README.md

44b6153
verified

alexmarques commited on Jul 25

Update README.md

edc122e
verified

alexmarques commited on Jul 24

Create README.md

8b65aea
verified

alexmarques commited on Jul 24

Upload folder using huggingface_hub

b892d70
verified

alexmarques commited on Jul 24

initial commit

c08f05e
verified

alexmarques commited on Jul 24