keisuke-kiryu commited on
Commit
ba95365
1 Parent(s): 0fc73c6

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +15 -11
README.md CHANGED
@@ -3,28 +3,32 @@ license: cc-by-sa-4.0
3
  language:
4
  - ja
5
  widget:
6
- - text: "これは日本語のタイポを検出する真相学習モデルです。"
7
  ---
8
 
9
  # モデルの概要
10
  - 日本語の文章を入力すると各文字ごとに誤植である確率を出力します
11
- - 各クラスのラベルは以下に従います
12
- 0: xx
13
- 1: xx
14
- 2: xx
15
- 3: xx
16
- 4: xx
17
- 5: xx
18
- 6: xx
19
- 7: xx
20
- 8: xx
21
  - 本モデルは日本語の文章が入力されることを前提としています
 
 
 
 
 
 
 
 
 
 
 
22
 
23
  # モデルの使い方
24
  ```python
25
  import transformers
26
  ```
27
 
 
 
 
28
  # ライセンス
29
  - 本モデルは京都大学大学院情報学研究科知能情報学コース言語メディア研究室 (https://nlp.ist.i.kyoto-u.ac.jp/ )が公開しているRoBERTaの事前学習モデル(ku-nlp/roberta-base-japanese-char-wwm)をFine-Tuningしたものです。
30
  - 本モデルは事前学習モデルのライセンス"CC-BY-SA 4.0"を継承します。
 
3
  language:
4
  - ja
5
  widget:
6
+ - text: "これは日本語の誤植を検出する真相学習モデルです。"
7
  ---
8
 
9
  # モデルの概要
10
  - 日本語の文章を入力すると各文字ごとに誤植である確率を出力します
 
 
 
 
 
 
 
 
 
 
11
  - 本モデルは日本語の文章が入力されることを前提としています
12
+ - 各ラベルの意味は以下の通りです
13
+ 0 : OK
14
+ 1 : deletion
15
+ 2 : insertion_a
16
+ 3 : insertion_b
17
+ 4 : kanji-conversion_a
18
+ 5 : kanji-conversion_b
19
+ 6 : substitution
20
+ 7 : transposition
21
+ 8 : others
22
+
23
 
24
  # モデルの使い方
25
  ```python
26
  import transformers
27
  ```
28
 
29
+ # 学習データ
30
+ - 京都大学大学院情報学研究科知能情報学コース言語メディア研究室 (https://nlp.ist.i.kyoto-u.ac.jp/ )が公開している[日本語Wikipedia入力誤りデータセット (v2)](https://nlp.ist.i.kyoto-u.ac.jp/?%E6%97%A5%E6%9C%AC%E8%AA%9EWikipedia%E5%85%A5%E5%8A%9B%E8%AA%A4%E3%82%8A%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88)のtrainセットを利用しています
31
+
32
  # ライセンス
33
  - 本モデルは京都大学大学院情報学研究科知能情報学コース言語メディア研究室 (https://nlp.ist.i.kyoto-u.ac.jp/ )が公開しているRoBERTaの事前学習モデル(ku-nlp/roberta-base-japanese-char-wwm)をFine-Tuningしたものです。
34
  - 本モデルは事前学習モデルのライセンス"CC-BY-SA 4.0"を継承します。