ChenMnZ
/

Llama-2-7b-EfficientQAT-w4g128

Text Generation

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

Llama-2-7b-EfficientQAT-w4g128 / generation_config.json

ChenMnZ's picture

Upload folder using huggingface_hub

d261cb2 verified 6 months ago

154 Bytes

	{
	"_from_model_config": true,
	"bos_token_id": 1,
	"eos_token_id": 2,
	"pad_token_id": 0,
	"transformers_version": "4.40.1",
	"use_cache": false
	}