Gemma 2 Quantized for ELYZA-tasks-100-TV
このモデルは、LLM講義2024最終課題のために作成された量子化版Gemma 2モデルです。
モデルの説明
- ベースモデル: google/gemma-2b-it
- 適用した変更: 4bit量子化による最適化
- 用途: ELYZA-tasks-100-TVベンチマーク対応
- メモリ使用量: 約8GB VRAM
- 推論時間: 全タスク1時間以内
環境要件
- Python 3.8+
- NVIDIA GPU (VRAM 24GB以上推奨)
- CUDA 11.8+
必要なパッケージ
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121
pip install transformers
pip install accelerate
pip install bitsandbytes
- Downloads last month
- 32
Model tree for Guchyos/gemma-2b-elyza-task
Base model
google/gemma-2b-it