nm-testing
/

TinyLlama-1.1B-Chat-v1.0-W8A8_tensor_weight_static_per_tensor_act-e2e

Text Generation

text-generation-inference

Inference Endpoints

8-bit precision

compressed-tensors

Model card Files Files and versions Community

TinyLlama-1.1B-Chat-v1.0-W8A8_tensor_weight_static_per_tensor_act-e2e / tokenizer_config.json

Commit History

Upload folder using huggingface_hub

cbed621
verified

nm-autobot commited on 13 days ago

Upload folder using huggingface_hub

70e63a6
verified

nm-autobot commited on 23 days ago

Upload folder using huggingface_hub

4eda40a
verified

nm-autobot commited on 24 days ago

Upload tokenizer

0f5431d
verified

dsikka commited on Aug 28