ChenMnZ
/

Llama-3-8b-EfficientQAT-w2g64

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-3-8b-EfficientQAT-w2g64 / generation_config.json

ChenMnZ's picture

Upload folder using huggingface_hub

b8fb11c verified 6 months ago

143 Bytes

	{
	"_from_model_config": true,
	"bos_token_id": 128000,
	"eos_token_id": 128001,
	"transformers_version": "4.40.1",
	"use_cache": false
	}