RedHatAI
/

Qwen2.5-VL-72B-Instruct-quantized.w4a16

@@ -12,14 +12,14 @@ base_model: Qwen/Qwen2.5-VL-72B-Instruct
 library_name: transformers
 ---
-# Qwen2.5-VL-72B-Instruct-quantized-w4a16
 ## Model Overview
 - **Model Architecture:** Qwen/Qwen2.5-VL-72B-Instruct
   - **Input:** Vision-Text
   - **Output:** Text
 - **Model Optimizations:**
-  - **Weight quantization:** INT4
   - **Activation quantization:** FP16
 - **Release Date:** 2/24/2025
 - **Version:** 1.0

 library_name: transformers
 ---
+# Qwen2.5-VL-72B-Instruct-quantized-w8a8
 ## Model Overview
 - **Model Architecture:** Qwen/Qwen2.5-VL-72B-Instruct
   - **Input:** Vision-Text
   - **Output:** Text
 - **Model Optimizations:**
+  - **Weight quantization:** INT8
   - **Activation quantization:** FP16
 - **Release Date:** 2/24/2025
 - **Version:** 1.0