zenz-v2.5-small

zenz-v2 model spec

zenz-v2.5はかな漢字変換タスクに特化したGPT-2アーキテクチャの条件付き言語モデルです。ニューラルかな漢字変換システム「Zenzai」で利用することを想定しています。

  • 文字単位+バイト単位BPEトークナイザー
  • かな漢字変換タスクにおいて高い性能
  • 文脈を考慮した変換で高い性能を発揮

zenz-v2.5は3種類のモデルサイズで公開しています。

Model Details

Model Description

CC-BY-SA 4.0で提供されているku-nlp/gpt2-small-japanese-charを基盤モデルとして利用しています。

本モデルはCC-BY-SA 4.0で提供します。

Model Sources

本モデルはZenzai(AzooKeyKanaKanjiConverter)と共に利用することを想定して構築しています。

Data Sources

本モデルはzenz-v2.5-datasetを利用して構築しました。

Acknowledgements

本モデルの構築にあたり、さくらインターネット株式会社様より計算資源の支援をいただきました。感謝申し上げます。

また、以下のライブラリやツール、言語資源を活用して本モデルを構築しました。

Downloads last month
6
Safetensors
Model size
90.5M params
Tensor type
BF16
·
Inference Examples
Unable to determine this model's library. Check the docs .

Model tree for Miwa-Keita/zenz-v2.5-small

Finetuned
(2)
this model

Dataset used to train Miwa-Keita/zenz-v2.5-small

Collection including Miwa-Keita/zenz-v2.5-small