Edit model card
YAML Metadata Warning: empty or missing yaml metadata in repo card (https://huggingface.co/docs/hub/model-cards#model-card-metadata)

c4ai-command-r-08-2024 GPTQ量子化モデル

モデル概要

  • モデル名: nejumi/c4ai-command-r-08-2024-GPTQ-Int8-calib-ja-1k および nejumi/c4ai-command-r-08-2024-GPTQ-Int4-calib-ja-1k
  • ベースモデル: CohereForAI/c4ai-command-r-08-2024
  • モデルサイズ: 32,296,476,672 パラメータ
  • カテゴリ: 30B≤

量子化の詳細

  • Calibration データ: nejumi/wikipedia-ja-20230720-4k の先頭1024行
  • 量子化パラメータ:
    • group_size: 128
    • perc_damp: 0.0
    • desc_act: True
    • use_exllama: False
    • model_seqlen: 2048

性能評価(総合)

Nejumi LLMリーダーボード3による評価結果

指標 Int8 Int4 ベースモデル
汎用的言語性能(GLP)平均 0.6020 0.6072 0.6125
アラインメント(ALT)平均 0.6924 0.6893 0.6943
総合平均 0.6472 0.6482 0.6534

image/png 青: Original 緑: GPTQ 4bit 赤: GPTQ 8bit

詳細評価(詳細)

汎用的言語性能(GLP)

サブカテゴリ Int8 Int4 ベースモデル
表現 0.8517 0.8450 0.8450
翻訳 0.8450 0.8440 0.8465
情報検索 0.8070 0.8062 0.8179
推論 0.4500 0.4800 0.4850
数学的推論 0.3900 0.4017 0.4033
抽出 0.2501 0.2560 0.2671
知識・質問応答 0.6416 0.6431 0.6549
英語 0.6842 0.6807 0.6877
意味解析 0.6420 0.6540 0.6430
構文解析 0.4585 0.4613 0.4744

アラインメント(ALT)

サブカテゴリ Int8 Int4 ベースモデル
制御性 0.8530 0.8503 0.8539
倫理・道徳 0.8900 0.9200 0.8800
毒性 0.6454 0.6481 0.6588
バイアス 0.7700 0.7700 0.7600
堅牢性 0.4566 0.4283 0.4736
真実性 0.5395 0.5189 0.5395

ベンチマークごとのスコア

ベンチマーク Int8 Int4 ベースモデル
JASTER (0-shot) 0.5314 0.5217 0.5367
JASTER (2-shot) 0.6126 0.6269 0.6224
MT-Bench 6.6625 6.6750 6.7813
LCTG 0.7720 0.7640 0.7720

注意事項

  • この量子化モデルは、オリジナルのCohereForAI/c4ai-command-r-08-2024モデルをGPTQ手法を用いて圧縮したものです。
  • Int8とInt4の2つのバリエーションがあり、それぞれ異なる精度と効率のトレードオフを提供します。
  • 性能指標は、オリジナルモデルと比較してわずかな違いがありますが、多くの指標で大きな性能低下を伴わない結果を示しています。
  • 量子化プロセスには、日本語Wikipediaデータの一部が使用されており、日本語タスクに最適化されている可能性があります。

使用上の注意

  • このモデルは2048トークンのコンテキスト長で訓練されていると想定されます。より長いコンテキストでの使用は、性能に影響を与える可能性があります。
  • 量子化により、モデルのサイズが大幅に削減されていますが、一部のタスクでわずかな精度の低下が見られる場合があります。
  • Int8版とInt4版で異なる特性を持つ可能性があるため、用途に応じて適切なバージョンを選択してください。
  • 特定のタスク(例:堅牢性)では、量子化モデルがベースモデルと比較して若干の性能低下を示していますので、これらのタスクに重点を置く場合は注意が必要です。

ライセンス

このモデルは、ベースモデルのライセンスを継承しています。詳細については、原モデルのライセンスを参照してください。

Downloads last month
2
Safetensors
Model size
12B params
Tensor type
I32
·
BF16
·
Inference API
Unable to determine this model's library. Check the docs .