keisuke-kiryu
commited on
Commit
•
ba95365
1
Parent(s):
0fc73c6
Update README.md
Browse files
README.md
CHANGED
@@ -3,28 +3,32 @@ license: cc-by-sa-4.0
|
|
3 |
language:
|
4 |
- ja
|
5 |
widget:
|
6 |
-
- text: "
|
7 |
---
|
8 |
|
9 |
# モデルの概要
|
10 |
- 日本語の文章を入力すると各文字ごとに誤植である確率を出力します
|
11 |
-
- 各クラスのラベルは以下に従います
|
12 |
-
0: xx
|
13 |
-
1: xx
|
14 |
-
2: xx
|
15 |
-
3: xx
|
16 |
-
4: xx
|
17 |
-
5: xx
|
18 |
-
6: xx
|
19 |
-
7: xx
|
20 |
-
8: xx
|
21 |
- 本モデルは日本語の文章が入力されることを前提としています
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
22 |
|
23 |
# モデルの使い方
|
24 |
```python
|
25 |
import transformers
|
26 |
```
|
27 |
|
|
|
|
|
|
|
28 |
# ライセンス
|
29 |
- 本モデルは京都大学大学院情報学研究科知能情報学コース言語メディア研究室 (https://nlp.ist.i.kyoto-u.ac.jp/ )が公開しているRoBERTaの事前学習モデル(ku-nlp/roberta-base-japanese-char-wwm)をFine-Tuningしたものです。
|
30 |
- 本モデルは事前学習モデルのライセンス"CC-BY-SA 4.0"を継承します。
|
|
|
3 |
language:
|
4 |
- ja
|
5 |
widget:
|
6 |
+
- text: "これは日本語の誤植を検出する真相学習モデルです。"
|
7 |
---
|
8 |
|
9 |
# モデルの概要
|
10 |
- 日本語の文章を入力すると各文字ごとに誤植である確率を出力します
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
11 |
- 本モデルは日本語の文章が入力されることを前提としています
|
12 |
+
- 各ラベルの意味は以下の通りです
|
13 |
+
0 : OK
|
14 |
+
1 : deletion
|
15 |
+
2 : insertion_a
|
16 |
+
3 : insertion_b
|
17 |
+
4 : kanji-conversion_a
|
18 |
+
5 : kanji-conversion_b
|
19 |
+
6 : substitution
|
20 |
+
7 : transposition
|
21 |
+
8 : others
|
22 |
+
|
23 |
|
24 |
# モデルの使い方
|
25 |
```python
|
26 |
import transformers
|
27 |
```
|
28 |
|
29 |
+
# 学習データ
|
30 |
+
- 京都大学大学院情報学研究科知能情報学コース言語メディア研究室 (https://nlp.ist.i.kyoto-u.ac.jp/ )が公開している[日本語Wikipedia入力誤りデータセット (v2)](https://nlp.ist.i.kyoto-u.ac.jp/?%E6%97%A5%E6%9C%AC%E8%AA%9EWikipedia%E5%85%A5%E5%8A%9B%E8%AA%A4%E3%82%8A%E3%83%87%E3%83%BC%E3%82%BF%E3%82%BB%E3%83%83%E3%83%88)のtrainセットを利用しています
|
31 |
+
|
32 |
# ライセンス
|
33 |
- 本モデルは京都大学大学院情報学研究科知能情報学コース言語メディア研究室 (https://nlp.ist.i.kyoto-u.ac.jp/ )が公開しているRoBERTaの事前学習モデル(ku-nlp/roberta-base-japanese-char-wwm)をFine-Tuningしたものです。
|
34 |
- 本モデルは事前学習モデルのライセンス"CC-BY-SA 4.0"を継承します。
|