inference-optimization
/

Qwen3-4B-Thinking-2507.w4a16

Text Generation

text-generation-inference

compressed-tensors

Model card Files Files and versions

Qwen3-4B-Thinking-2507.w4a16

3.45 GB

1 contributor

History: 9 commits

ChibuUkachi's picture

Update README.md

4e6ff2d verified about 19 hours ago