Intel
/

Qwen2-7B-int4-inc

Text Generation

text-generation-inference

Inference Endpoints

4-bit precision

intel/auto-round

Model card Files Files and versions Community

wenhuach commited on 28 days ago

Commit

b608ac9

•

1 Parent(s): 83054fc

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -15,7 +15,7 @@ This model is an int4 auto-round model with group_size 128 of [Qwen/Qwen2-7B](ht
 ### INT4 Inference
 ```python
-##pip install auto-round
 from auto_round import AutoRoundConfig ##must import for auto_round format
 from transformers import AutoModelForCausalLM,AutoTokenizer
 quantized_model_dir = "Intel/Qwen2-7B-int4-inc"

 ### INT4 Inference
 ```python
+##pip install auto-round (cpu needs version > 0.3.1))
 from auto_round import AutoRoundConfig ##must import for auto_round format
 from transformers import AutoModelForCausalLM,AutoTokenizer
 quantized_model_dir = "Intel/Qwen2-7B-int4-inc"