inference-optimization
/

Qwen3-4B-Thinking-2507.w4a16

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions

Qwen3-4B-Thinking-2507.w4a16 / added_tokens.json

Commit History

add models and configs

d060b41

chibu commited on 7 days ago