kkuramitsu commited on
Commit
50f35d0
1 Parent(s): 34ba262

first commit

Browse files
.gitattributes CHANGED
@@ -25,3 +25,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
25
  *.zip filter=lfs diff=lfs merge=lfs -text
26
  *.zstandard filter=lfs diff=lfs merge=lfs -text
27
  *tfevents* filter=lfs diff=lfs merge=lfs -text
 
 
25
  *.zip filter=lfs diff=lfs merge=lfs -text
26
  *.zstandard filter=lfs diff=lfs merge=lfs -text
27
  *tfevents* filter=lfs diff=lfs merge=lfs -text
28
+ *.json filter=lfs diff=lfs merge=lfs -text
added_tokens.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:a4b025dec6916309468bc0c986a84f1994b260cfc6bb5212566aea2aa9cfd1c9
3
+ size 128
config.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:6819f40ff0d15ba7ca881a8b0459f46dd0a277f5c729327b0241efc8701f6337
3
+ size 677
log_kogi-mt5.txt ADDED
@@ -0,0 +1,199 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ 2022-05-31 02:06:04,923@ root [INFO] _setup_logger: PyTorch: 1.11.0+cu113
2
+ 2022-05-31 02:06:04,927@ root [INFO] _setup_logger: hparams: Namespace(adam_epsilon=1e-08, additional_tokens='<nl> <tab> <b> </b> <e0> <e1> <e2> <e3>', batch_size=16, bos_token='', column=0, da_choice=0.4, da_shuffle=0.3, early_stop_callback=True, encoding='utf_8', files=['data/kogi6_train.tsv', 'data/kogi6_test.tsv'], fp_16=False, gradient_accumulation_steps=1, kfold=5, learning_rate=0.0003, limit_batches=-1, masking=False, masking_ratio=0.35, masking_style='denoising', max_epochs=30, max_grad_norm=1.0, max_length=128, max_seq_length=128, model_name_or_path='google/mt5-small', n_gpu=1, num_workers=4, opt_level='O2', output_dir='./kogi-mt5', progress_bar=False, project='kogi-mt5', save_checkpoint=False, seed=42, target_column=1, target_max_length=128, target_max_seq_length=128, tokenizer_name_or_path='google/mt5-small', warmup_steps=0, weight_decay=0.0)
3
+ 2022-05-31 02:06:04,934@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
4
+ 2022-05-31 02:06:05,704@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
5
+ 2022-05-31 02:06:05,711@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
6
+ 2022-05-31 02:06:06,387@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
7
+ 2022-05-31 02:06:06,393@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
8
+ 2022-05-31 02:06:07,151@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
9
+ 2022-05-31 02:06:07,155@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
10
+ 2022-05-31 02:06:07,859@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/spiece.model HTTP/1.1" 200 0
11
+ 2022-05-31 02:06:07,866@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
12
+ 2022-05-31 02:06:08,546@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer.json HTTP/1.1" 404 0
13
+ 2022-05-31 02:06:08,549@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
14
+ 2022-05-31 02:06:09,307@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/added_tokens.json HTTP/1.1" 404 0
15
+ 2022-05-31 02:06:09,310@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
16
+ 2022-05-31 02:06:09,986@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/special_tokens_map.json HTTP/1.1" 200 0
17
+ 2022-05-31 02:06:09,990@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
18
+ 2022-05-31 02:06:10,671@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
19
+ 2022-05-31 02:06:10,674@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
20
+ 2022-05-31 02:06:11,363@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
21
+ 2022-05-31 02:06:12,047@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
22
+ 2022-05-31 02:06:12,735@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
23
+ 2022-05-31 02:06:13,600@ root [INFO] parse_hparams: vocab_size: 250100 250108
24
+ 2022-05-31 02:06:13,613@ root [INFO] _main: Base model: google/mt5-small ['data/kogi6_train.tsv', 'data/kogi6_test.tsv']
25
+ 2022-05-31 02:06:13,649@ torch.distributed.nn.jit.instantiator [INFO] <module>: Created a temporary directory at /tmp/9981679.1.gpu/tmpebyfoxhy
26
+ 2022-05-31 02:06:13,650@ torch.distributed.nn.jit.instantiator [INFO] _write: Writing /tmp/9981679.1.gpu/tmpebyfoxhy/_remote_module_non_sriptable.py
27
+ 2022-05-31 02:06:14,274@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
28
+ 2022-05-31 02:06:14,950@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
29
+ 2022-05-31 02:06:18,268@ root [INFO] _loading_dataset: loading data/kogi6_train.tsv
30
+ 2022-05-31 02:06:18,296@ root [INFO] _append_data: 折れ線の線幅をnに設定する -> plt.plot(xdata, ydata, linewidth=n)
31
+ 2022-05-31 02:06:18,297@ root [INFO] _append_data: 実数のサインを求める -> math.sin(x)
32
+ 2022-05-31 02:06:18,298@ root [INFO] _append_data: データ列を100の位で丸める -> ds.round(-2)
33
+ 2022-05-31 02:06:18,298@ root [INFO] _append_data: カデットブルーにヒストグラムの色をセットする -> plt.hist(データ列, color='cadetblue')
34
+ 2022-05-31 02:06:18,299@ root [INFO] _append_data: nが負の数か -> n < 0
35
+ 2022-05-31 02:06:22,695@ root [INFO] _loading_dataset: loaded 14372 dataset
36
+ 2022-05-31 02:06:22,696@ root [INFO] _loading_dataset: loading data/kogi6_test.tsv
37
+ 2022-05-31 02:06:22,697@ root [INFO] _append_data: グラフの色テーマを色差別なくする -> sns.set(pallete='colorblind')
38
+ 2022-05-31 02:06:22,698@ root [INFO] _append_data: 縦方向に3つのデータフレームを連結する -> pd.concat([df, df2, df3], axis=0)
39
+ 2022-05-31 02:06:22,699@ root [INFO] _append_data: 折れ線グラフに四角印を加える -> plt.plot(データ列, データ列2, marker='s')
40
+ 2022-05-31 02:06:22,699@ root [INFO] _append_data: 折れ線グラフを実線に設定する -> plt.plot(データ列, データ列2, linestyle='solid')
41
+ 2022-05-31 02:06:22,700@ root [INFO] _append_data: 折れ線グラフの色をライトサーモンに指定する -> plt.plot(データ列, データ列2, color='lightsalmon')
42
+ 2022-05-31 02:06:23,613@ root [INFO] _loading_dataset: loaded 2725 dataset
43
+ 2022-05-31 08:05:40,786@ root [INFO] _setup_logger: PyTorch: 1.11.0+cu113
44
+ 2022-05-31 08:05:40,788@ root [INFO] _setup_logger: hparams: Namespace(adam_epsilon=1e-08, additional_tokens='<nl> <tab> <b> </b> <e0> <e1> <e2> <e3>', batch_size=16, bos_token='', column=0, da_choice=0.4, da_shuffle=0.3, early_stop_callback=True, encoding='utf_8', files=['data/kogi6_train.tsv', 'data/kogi6_test.tsv'], fp_16=False, gradient_accumulation_steps=1, kfold=5, learning_rate=0.0003, limit_batches=-1, masking=False, masking_ratio=0.35, masking_style='denoising', max_epochs=30, max_grad_norm=1.0, max_length=128, max_seq_length=128, model_name_or_path='google/mt5-small', n_gpu=1, num_workers=4, opt_level='O2', output_dir='./kogi-mt5', progress_bar=False, project='kogi-mt5', save_checkpoint=False, seed=42, target_column=1, target_max_length=128, target_max_seq_length=128, tokenizer_name_or_path='google/mt5-small', warmup_steps=0, weight_decay=0.0)
45
+ 2022-05-31 08:05:40,794@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
46
+ 2022-05-31 08:05:41,478@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
47
+ 2022-05-31 08:05:41,483@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
48
+ 2022-05-31 08:05:42,231@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
49
+ 2022-05-31 08:05:42,237@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
50
+ 2022-05-31 08:05:42,913@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
51
+ 2022-05-31 08:05:42,917@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
52
+ 2022-05-31 08:05:43,620@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/spiece.model HTTP/1.1" 200 0
53
+ 2022-05-31 08:05:43,625@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
54
+ 2022-05-31 08:05:44,309@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer.json HTTP/1.1" 404 0
55
+ 2022-05-31 08:05:44,311@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
56
+ 2022-05-31 08:05:44,988@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/added_tokens.json HTTP/1.1" 404 0
57
+ 2022-05-31 08:05:44,991@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
58
+ 2022-05-31 08:05:45,675@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/special_tokens_map.json HTTP/1.1" 200 0
59
+ 2022-05-31 08:05:45,678@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
60
+ 2022-05-31 08:05:46,360@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
61
+ 2022-05-31 08:05:46,363@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
62
+ 2022-05-31 08:05:47,053@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
63
+ 2022-05-31 08:05:47,638@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
64
+ 2022-05-31 08:05:48,323@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
65
+ 2022-05-31 08:05:49,140@ root [INFO] parse_hparams: vocab_size: 250100 250108
66
+ 2022-05-31 08:05:49,153@ root [INFO] _main: Base model: google/mt5-small ['data/kogi6_train.tsv', 'data/kogi6_test.tsv']
67
+ 2022-05-31 08:05:49,196@ torch.distributed.nn.jit.instantiator [INFO] <module>: Created a temporary directory at /tmp/9982441.1.gpu/tmpufibkjs3
68
+ 2022-05-31 08:05:49,196@ torch.distributed.nn.jit.instantiator [INFO] _write: Writing /tmp/9982441.1.gpu/tmpufibkjs3/_remote_module_non_sriptable.py
69
+ 2022-05-31 08:05:49,750@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
70
+ 2022-05-31 08:05:50,505@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
71
+ 2022-05-31 08:05:53,655@ root [INFO] _loading_dataset: loading data/kogi6_train.tsv
72
+ 2022-05-31 08:05:53,681@ root [INFO] _append_data: 折れ線の線幅をnに設定する -> plt.plot(xdata, ydata, linewidth=n)
73
+ 2022-05-31 08:05:53,682@ root [INFO] _append_data: 実数のサインを求める -> math.sin(x)
74
+ 2022-05-31 08:05:53,682@ root [INFO] _append_data: データ列を100の位で丸める -> ds.round(-2)
75
+ 2022-05-31 08:05:53,683@ root [INFO] _append_data: カデットブルーにヒストグラムの色をセットする -> plt.hist(データ列, color='cadetblue')
76
+ 2022-05-31 08:05:53,683@ root [INFO] _append_data: nが負の数か -> n < 0
77
+ 2022-05-31 08:05:57,529@ root [INFO] _loading_dataset: loaded 14372 dataset
78
+ 2022-05-31 08:05:57,530@ root [INFO] _loading_dataset: loading data/kogi6_test.tsv
79
+ 2022-05-31 08:05:57,531@ root [INFO] _append_data: グラフの色テーマを色差別なくする -> sns.set(pallete='colorblind')
80
+ 2022-05-31 08:05:57,532@ root [INFO] _append_data: 縦方向に3つのデータフレームを連結する -> pd.concat([df, df2, df3], axis=0)
81
+ 2022-05-31 08:05:57,532@ root [INFO] _append_data: 折れ線グラフに四角印を加える -> plt.plot(データ列, データ列2, marker='s')
82
+ 2022-05-31 08:05:57,533@ root [INFO] _append_data: 折れ線グラフを実線に設定する -> plt.plot(データ列, データ列2, linestyle='solid')
83
+ 2022-05-31 08:05:57,533@ root [INFO] _append_data: 折れ線グラフの色をライトサーモンに指定する -> plt.plot(データ列, データ列2, color='lightsalmon')
84
+ 2022-05-31 08:05:58,251@ root [INFO] _loading_dataset: loaded 2725 dataset
85
+ 2022-05-31 10:10:45,749@ root [INFO] _loading_dataset: loading data/kogi6_train.tsv
86
+ 2022-05-31 10:10:45,752@ root [INFO] _append_data: 折れ線の線幅をnに設定する -> plt.plot(xdata, ydata, linewidth=n)
87
+ 2022-05-31 10:10:45,752@ root [INFO] _append_data: 実数のサインを求める -> math.sin(x)
88
+ 2022-05-31 10:10:45,752@ root [INFO] _append_data: データ列を100の位で丸める -> ds.round(-2)
89
+ 2022-05-31 10:10:45,752@ root [INFO] _append_data: カデットブルーにヒストグラムの色をセットする -> plt.hist(データ列, color='cadetblue')
90
+ 2022-05-31 10:10:45,752@ root [INFO] _append_data: nが負の数か -> n < 0
91
+ 2022-05-31 10:10:45,787@ root [INFO] _loading_dataset: loaded 14372 dataset
92
+ 2022-05-31 10:10:45,787@ root [INFO] _loading_dataset: loading data/kogi6_test.tsv
93
+ 2022-05-31 10:10:45,789@ root [INFO] _append_data: グラフの色テーマを色差別なくする -> sns.set(pallete='colorblind')
94
+ 2022-05-31 10:10:45,789@ root [INFO] _append_data: 縦方向に3つのデータフレームを連結する -> pd.concat([df, df2, df3], axis=0)
95
+ 2022-05-31 10:10:45,789@ root [INFO] _append_data: 折れ線グラフに四角印を加える -> plt.plot(データ列, データ列2, marker='s')
96
+ 2022-05-31 10:10:45,789@ root [INFO] _append_data: 折れ線グラフを実線に設定する -> plt.plot(データ列, データ列2, linestyle='solid')
97
+ 2022-05-31 10:10:45,789@ root [INFO] _append_data: 折れ線グラフの色をライトサーモンに指定する -> plt.plot(データ列, データ列2, color='lightsalmon')
98
+ 2022-05-31 10:10:45,795@ root [INFO] _loading_dataset: loaded 2725 dataset
99
+ 2022-05-31 10:10:45,952@ root [INFO] test_and_save: データフレームのカラムが正規分布からどの程度、歪んでいるか調べる df[col].skew() df[col].kurt()
100
+ 2022-05-31 10:10:47,287@ root [INFO] test_and_save: データフレームのリストカラムの中の欠損値の数を数える df[aList].isna().sum() df[aList].isna().sum()
101
+ 2022-05-31 10:10:49,123@ root [INFO] test_and_save: 配列とリストについての散布図にカラーコードのポイントマーカーをプロットする plt.plot(xdata, ydata, marker='.', c=rgb) plt.plot(xdata, ydata, marker='.', c=rgb)
102
+ 2022-05-31 10:10:50,276@ root [INFO] test_and_save: データフレームのカラムを丸めて整数型にする df[col].round().astype(int) df[col].round().astype(int)
103
+ 2022-05-31 10:10:51,545@ root [INFO] test_and_save: <オプション>色をトマトにセットする color = 'tomato' color = 'tomato'
104
+ 2022-05-31 10:10:52,904@ root [INFO] test_and_save: <オプション>パレットトルコイズを使用する color = 'paleturquoise' color = 'paleturquoise'
105
+ 2022-05-31 10:10:54,166@ root [INFO] test_and_save: 折れ線グラフを描画して、その色をダークターコイズに指定する plt.plot(データ列, データ列2, color='darkturquoise') plt.plot(データ列, データ列2, color='darkturquoise')
106
+ 2022-05-31 10:10:55,926@ root [INFO] test_and_save: リストの値を並べる sorted(aList) sorted(aList)
107
+ 2022-05-31 10:10:57,186@ root [INFO] test_and_save: マップのキーとその値をペアとして取り出す aDict.items() aDict.items()
108
+ 2022-05-31 10:10:58,574@ root [INFO] test_and_save: <オプション>ラベンダーブラッシュにグラフの色をセットする color = 'lavenderblush' color = 'lavenderblush'
109
+ 2022-05-31 10:11:00,031@ root [INFO] test_and_save: グラフに水平方向の破線を付ける plt.axhline(y=0, linestyle='dashed') plt.axhline(y=0, linestyle='dashed')
110
+ 2022-05-31 10:11:01,382@ root [INFO] test_and_save: 日付データの曜日を使う aDate.weekday() aDate.weekday()
111
+ 2022-05-31 10:11:03,187@ root [INFO] test_and_save: リストとリストの散布図を描画し、マーカーを星に変更する plt.plot(xdata, ydata, marker='*') plt.plot(xdata, ydata, marker='*')
112
+ 2022-05-31 10:11:04,763@ root [INFO] test_and_save: 折れ線グラフを描画してその色をライトスレイグレーに設定する plt.plot(データ列, データ列2, color='lightslategray') plt.plot(データ列, データ列2, color='lightslategray')
113
+ 2022-05-31 10:11:06,457@ root [INFO] test_and_save: 箱ヒゲ図を2つ並べる plt.boxplot([データ列, データ列2]) plt.boxplot([データ列, データ列2])
114
+ 2022-05-31 10:11:07,917@ root [INFO] test_and_save: パステル調のの色をカラーコードに設定する plt.plot(xdata, ydata, linestyle='pastel', color=rgb) plt.plot(xdata, ydata, linestyle='pastel', color=rgb)
115
+ 2022-05-31 10:11:09,479@ root [INFO] test_and_save: リストとリストについての散布図にカラーコードの丸マーカーをプロットする plt.plot(xdata, ydata, marker='o', c=rgb) plt.plot(xdata, ydata, marker='o', c=rgb)
116
+ 2022-05-31 10:11:10,939@ root [INFO] test_and_save: 赤い四角マーカーで散布図をプロットする plt.plot(xdata, ydata, marker='s', c='r') plt.plot(xdata, ydata, marker='s', c='r')
117
+ 2022-05-31 10:11:12,559@ root [INFO] test_and_save: マルーンにヒストグラムの色を設定する plt.hist(データ列, color='maroon') plt.hist(データ列, color='maroon')
118
+ 2022-05-31 10:11:14,354@ root [INFO] test_and_save: データフレームのリストカラムの25パーセンタイルを計算する df[aList].quantile(percent/100) df[aList].quantile(0.25)
119
+ 2022-05-31 10:11:15,656@ root [INFO] test_and_save: 文字列を区切りで区切って、文字列リストに変換する s.split(sep) s.split(sep)
120
+ 2022-05-31 10:11:17,072@ root [INFO] test_and_save: Pandasでdatetime64型のデータフレームのカラムをインデックスにする df.index = pd.DatetimeIndex(df[col]) df.index = pd.DatetimeIndex(df[col])
121
+ 2022-05-31 10:11:18,332@ root [INFO] test_and_save: 二つの整数最小公倍数 math.lcm(n, n2) math.lcm(n, n2)
122
+ 2022-05-31 10:11:19,723@ root [INFO] test_and_save: 空白で文字列を区切って数列に変換する map(int, s.split()) map(int, s.split())
123
+ 2022-05-31 10:11:21,033@ root [INFO] test_and_save: データフレームの列をヒストグラムとして可視化する plt.hist(df[column]) plt.hist(df[column])
124
+ 2022-05-31 10:11:22,799@ root [INFO] test_and_save: 線グラフを描画して、その色をミディアムパープルに設定する plt.plot(データ列, データ列2, color='mediumpurple') plt.plot(データ列, データ列2, color='mediumpurple')
125
+ 2022-05-31 10:11:24,391@ root [INFO] test_and_save: リストと数列について散布図をプロットする plt.scatter(xdata, ydata) plt.scatter(xdata, ydata)
126
+ 2022-05-31 10:11:25,686@ root [INFO] test_and_save: カラムのNaNを最小値に設定する ds.fillna(ds.min()) ds.fillna(ds.min())
127
+ 2022-05-31 10:11:27,228@ root [INFO] test_and_save: 配列の度数分布図をプロットする plt.hist(データ列, bins=n) plt.hist(aArray)
128
+ 2022-05-31 10:11:28,917@ root [INFO] test_and_save: データフレームの中で、列と列の重複を消す df.drop_duplicates(subset=[column, column2]) df.drop_duplicates(subset=[column, column2])
129
+ 2022-05-31 10:11:30,503@ root [INFO] test_and_save: ダークターコイズにヒストグラムの色を指定する plt.hist(データ列, color='darkturquoise') plt.hist(データ列, color='darkturquoise')
130
+ 2022-05-31 10:11:32,112@ root [INFO] test_and_save: ヒストグラムの色をダークオリーブグリーンに変更する plt.hist(データ列, color='darkolivegreen') plt.hist(データ列, color='darkolivegreen')
131
+ 2022-05-31 10:11:33,653@ root [INFO] test_and_save: 両端キューをdequeue deq.count(element) deq.popleft()
132
+ 2022-05-31 10:11:35,286@ root [INFO] test_and_save: データフレームのリストカラムを100の位で丸めて整数型にする df[aList].round(-2).astype(int) df[aList].round(-2).astype(int)
133
+ 2022-05-31 10:11:36,824@ root [INFO] test_and_save: 文字列はタイトル大文字小文字かどうか調べる s.istitle() s.istitle()
134
+ 2022-05-31 10:11:38,258@ root [INFO] test_and_save: ファイルパスの拡張子付きのファイル名を使う os.path.abspath(filepath) os.path.basename(filepath)
135
+ 2022-05-31 10:11:39,723@ root [INFO] test_and_save: データフレームの列がxである行を取り出す df[df[column] == x] df[df[column] == x]
136
+ 2022-05-31 10:11:41,180@ root [INFO] test_and_save: オブジェクトのバイトサイズを知る sys.getsizeof(obj) sys.getsizeof(obj)
137
+ 2022-05-31 10:11:43,101@ root [INFO] test_and_save: xにヒストグラムのアルファ値を設定する plt.hist(データ列, alpha=x) plt.hist(データ列, alpha=x)
138
+ 2022-05-31 10:11:44,837@ root [INFO] test_and_save: ヒストグラムの色を濃いシアンに変更する plt.hist(データ列, color='darkcyan') plt.hist(データ列, color='darkcyan')
139
+ 2022-05-31 10:11:46,147@ root [INFO] test_and_save: データフレームのカラムの75パーセンタイル df[col].quantile(percent/100) df[col].quantile(0.75)
140
+ 2022-05-31 10:11:47,636@ root [INFO] test_and_save: データフレームが重複している df.duplicated() df.duplicated()
141
+ 2022-05-31 10:11:49,187@ root [INFO] test_and_save: リストの末尾の要素を求める aList[i], aList[-1] aList[-1]
142
+ 2022-05-31 10:11:50,810@ root [INFO] test_and_save: イテラブルから集合を使う set(iterable) set(iterable)
143
+ 2022-05-31 10:11:52,064@ root [INFO] test_and_save: TSVをデータフレームとして読み込む pd.read_csv(filename, sep='\t', encoding='utf-8') pd.read_csv(filename, sep='\t')
144
+ 2022-05-31 10:11:53,636@ root [INFO] test_and_save: 文字列の開始位置以降に部分文字列が含まれない s.find(sub, start)!= -1 s.find(sub, start) == -1
145
+ 2022-05-31 10:11:55,143@ root [INFO] test_and_save: 黒い色差別ないグラフをプロットする plt.plot(xdata, ydata, linestyle='colorblind', color='k') plt.plot(xdata, ydata, linestyle='colorblind', color='k')
146
+ 2022-05-31 10:11:56,755@ root [INFO] test_and_save: 組をソートする sorted(aTuple) sorted(aTuple)
147
+ 2022-05-31 10:11:58,241@ root [INFO] test_and_save: ヒストグラムを描画して、その色をダークオレンジにする plt.hist(データ列, color='darkorange') plt.hist(データ列, color='darkorange')
148
+ 2022-05-31 10:11:59,644@ root [INFO] test_and_save: <オプション>色をスラグレーに変更する color ='slategray' color = 'slategrey'
149
+ 2022-05-31 10:12:01,381@ root [INFO] test_and_save: リストと配列について破線グラフを描画し、、その色を淡いに設定する plt.plot(xdata, ydata, linestyle='dash', color='muted') plt.plot(xdata, ydata, linestyle='dash', color='muted')
150
+ 2022-05-31 10:12:02,948@ root [INFO] test_and_save: 配列とイテラブルの散布図に黒い三角マーカーを描画する plt.plot(xdata, ydata, marker='^', c='k') plt.plot(xdata, ydata, marker='^', c='k')
151
+ 2022-05-31 10:12:04,337@ root [INFO] test_and_save: まとめてValueMapでデータ列の値を置き換える ds.replace(ValueMap) ds.replace(ValueMap)
152
+ 2022-05-31 10:12:06,086@ root [INFO] test_and_save: 文字列の最初からタブを取り除く s.rstrip('\t') s.lstrip('\t')
153
+ 2022-05-31 10:12:07,328@ root [INFO] test_and_save: グラフの描画を綺麗にする import seaborn as sns import seaborn as sns
154
+ 2022-05-31 10:12:08,538@ root [INFO] test_and_save: 文字列が小文字かどうか調べる s.islower() s.islower()
155
+ 2022-05-31 10:12:10,308@ root [INFO] test_and_save: CSVTSVファイルをn番目のカラムを行として読み込む pd.read_csv(filename, index_col=n) pd.read_csv(filename, index_col=n)
156
+ 2022-05-31 10:12:11,683@ root [INFO] test_and_save: 一方に含まれ、他方に含まれない集合を計算する aSet.difference(aSet2) aSet.difference(aSet2)
157
+ 2022-05-31 10:12:13,412@ root [INFO] test_and_save: 配列の要素ごとの最大公約数 np.gcd(aArray, aArray2) np.gcd(aArray, aArray2)
158
+ 2022-05-31 10:12:14,835@ root [INFO] test_and_save: TSV形式のファイルからデータフレームを読む pd.read_csv(filename, sep='\t', encoding='utf-8') pd.read_csv(filename, sep='\t', encoding='utf-8')
159
+ 2022-05-31 10:12:16,168@ root [INFO] test_and_save: イテラブルとリストの折れ線グラフをカラーコードで描画する plt.plot(xdata, ydata, color=rgb) plt.plot(xdata, ydata, color=rgb)
160
+ 2022-05-31 10:12:17,905@ root [INFO] test_and_save: データフレームのカラムのNaNを直後の値で埋める df[col].fillna(method='bfill') df[col].fillna(method='bfill')
161
+ 2022-05-31 10:12:19,481@ root [INFO] test_and_save: ヒストグラムを描画して、その色をダークカーキにする plt.hist(データ列, color='darkkhaki') plt.hist(データ列, color='darkkhaki')
162
+ 2022-05-31 10:12:21,023@ root [INFO] test_and_save: リストとリストを加える aList + aList2 aList + aList2
163
+ 2022-05-31 10:12:22,654@ root [INFO] test_and_save: リストとリストについて散布図を描画してポイントマーカーの色をカラーコードに設定する plt.plot(xdata, ydata, marker='.', c=rgb) plt.plot(xdata, ydata, marker='.', c=rgb)
164
+ 2022-05-31 10:12:24,619@ root [INFO] test_and_save: データフレームを列で並べて更新する df.sort_values(by=column, inplace=True) df.sort_values(by=column, inplace=True)
165
+ 2022-05-31 10:12:26,456@ root [INFO] test_and_save: グラフのパレットを濃くする sns.set(pallete='deep') sns.set(pallete='deep')
166
+ 2022-05-31 10:12:28,332@ root [INFO] test_and_save: 二つの列を並べて箱ひげ図にする plt.boxplot([データ列, データ列2], color=['b', 'r']) plt.boxplot([df[column], df[column2]])
167
+ 2022-05-31 10:12:30,230@ root [INFO] test_and_save: 日付データと日付データの時間差を秒で求める (aDate - aDate2).total_seconds()//60 (aDate - aDate2).total_seconds()//60
168
+ 2022-05-31 10:12:31,772@ root [INFO] test_and_save: データフレームのn行目を破壊的に消す df.drop(n, axis=0, inplace=True) df.drop(n, axis=0, inplace=True)
169
+ 2022-05-31 10:12:33,347@ root [INFO] test_and_save: 黒色のポイントマーカーで散布図を描画する plt.plot(xdata, ydata, marker='.', c='k') plt.plot(xdata, ydata, marker='.', c='k')
170
+ 2022-05-31 10:12:34,815@ root [INFO] test_and_save: 最後の部分文字列によって文字列を二分割する s.rpartition(sub) s.rpartition(sub)
171
+ 2022-05-31 10:12:36,391@ root [INFO] test_and_save: Pandasでエポック秒のデータ列からPandasの日付型に変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True)
172
+ 2022-05-31 10:12:38,030@ root [INFO] test_and_save: データフレームのリスト列のヒートマップをグラフ化する sns.heatmap(df[aList].corr()) sns.heatmap(df[aList].corr())
173
+ 2022-05-31 10:12:39,620@ root [INFO] test_and_save: シャルトリューズにヒストグラムの色を指定する plt.hist(データ列, color='chartreuse') plt.hist(データ列, color='chartreuse')
174
+ 2022-05-31 10:12:41,248@ root [INFO] test_and_save: リストにリストを加える aList.extend(aList2) aList.extend(aList2)
175
+ 2022-05-31 10:12:43,056@ root [INFO] test_and_save: ▲マーカーを散布図に使う plt.plot(xdata, ydata, marker='^') plt.plot(xdata, ydata, marker='^')
176
+ 2022-05-31 10:12:44,634@ root [INFO] test_and_save: ファイルパスから読み込みストリームを開いて]、fとする f = open(filepath, mode='r') f = open(filepath, mode='r')
177
+ 2022-05-31 10:12:45,815@ root [INFO] test_and_save: 列によってデータフレームをソートして、インデックスを振り直す df.sort_values(columns).reset_index() df.sort_values(columns).reset_index(drop=True)
178
+ 2022-05-31 10:12:47,586@ root [INFO] test_and_save: 黒い淡いグラフを描く plt.plot(xdata, ydata, linestyle='muted', color='k') plt.plot(xdata, ydata, linestyle='muted', color='k')
179
+ 2022-05-31 10:12:48,871@ root [INFO] test_and_save: ファイルに文字列を書く f.write(s) f.write(s)
180
+ 2022-05-31 10:12:50,267@ root [INFO] test_and_save: 折れ線グラフの色をダークシアンにする plt.plot(データ列, データ列2, color='darkcyan') plt.plot(データ列, データ列2, color='darkcyan')
181
+ 2022-05-31 10:12:52,032@ root [INFO] test_and_save: <オプション>プラムにグラフの色を変更する color = 'plum' color = 'plum'
182
+ 2022-05-31 10:12:53,454@ root [INFO] test_and_save: リストとリストを使って明るいの折れ線を描いて、その線幅をnに指定する plt.plot(xdata, ydata, linestyle='bright', color='r') plt.plot(xdata, ydata, linestyle='bright', color='r')
183
+ 2022-05-31 10:12:54,685@ root [INFO] test_and_save: 折れ線グラフを描画してその色を赤に設定する plt.plot(データ列, データ列2, color='red') plt.plot(データ列, データ列2, color='red')
184
+ 2022-05-31 10:12:56,089@ root [INFO] test_and_save: リストとデータ列について色差別ないグラフを描いて、色を黒にする plt.plot(xdata, ydata, linestyle='colorblind', color='k') plt.plot(xdata, ydata, linestyle='colorblind', color='k')
185
+ 2022-05-31 10:12:57,644@ root [INFO] test_and_save: ヒストグラムの色をクリムゾンに指定する plt.hist(データ列, color='crimson') plt.hist(データ列, color='crimson')
186
+ 2022-05-31 10:12:59,326@ root [INFO] test_and_save: カウンタを少ない方からリストとして得る aCounter.most_common()[:-1] aCounter.most_common()[::-1]
187
+ 2022-05-31 10:13:00,467@ root [INFO] test_and_save: 数を整数にする int(x) int(x)
188
+ 2022-05-31 10:13:01,721@ root [INFO] test_and_save: <オプション>グラフの種類を一点鎖線にする linestyle = 'dashbot' linestyle = 'dashbot'
189
+ 2022-05-31 10:13:03,441@ root [INFO] test_and_save: nがn2の倍数かどうか調べる n % n2 == 0 n % n2 == 0
190
+ 2022-05-31 10:13:04,970@ root [INFO] test_and_save: タプルの文字列が最初に見つかる場所 aTuple.index(element) aTuple.index(element)
191
+ 2022-05-31 10:13:06,492@ root [INFO] test_and_save: nの八進数表記 oct(n) oct(n)
192
+ 2022-05-31 10:13:08,082@ root [INFO] test_and_save: ��ストグラムを描画して色をビスクに設定する plt.hist(データ列, color='bisque') plt.hist(データ列, color='bisque')
193
+ 2022-05-31 10:13:09,727@ root [INFO] test_and_save: イテラブルの要素を両端キューの末尾に追加する collections.deque(iterable) deq.extend(iterable)
194
+ 2022-05-31 10:13:10,917@ root [INFO] test_and_save: コマンドの第2引数を知る sys.argv[1] sys.argv[1]
195
+ 2022-05-31 10:13:12,319@ root [INFO] test_and_save: タイムスタンプデータをn時間前に戻す aDatetime - datetime.timedelta(days=n) aDatetime - datetime.timedelta(hours=n)
196
+ 2022-05-31 10:13:13,796@ root [INFO] test_and_save: 数値の積分を行う sympy.diff(e, z) sympy.integrate(e)
197
+ 2022-05-31 10:13:15,417@ root [INFO] test_and_save: 暗いパレットをグラフの描画で使う sns.set(pallete='dark') sns.set(pallete='dark')
198
+ 2022-05-31 10:13:16,955@ root [INFO] test_and_save: カンマで文字列を分割して文字列リストにする s.split(',') s.split(',')
199
+ 2022-05-31 10:13:18,303@ root [INFO] test_and_save: 数を万の位で四捨五入する round(x, -2) round(x, -4)
pytorch_model.bin ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:0f592119402773c7d2c45e2b1781ffd0abe192f1d3eef06bfad2403904b3df97
3
+ size 1200790661
result_test.tsv ADDED
The diff for this file is too large to render. See raw diff
 
special_tokens_map.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:09059cedc26bc46bc09a52f05b92d4922e11917e87f3b92059bb1a63a59ab2c4
3
+ size 65
spiece.model ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:ef78f86560d809067d12bac6c09f19a462cb3af3f54d2b8acbba26e1433125d6
3
+ size 4309802
tokenizer.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:15fc90993f2fb28fdce67d413683eafc37738afb9e8341c62aec5e0725b06522
3
+ size 16332082
tokenizer_config.json ADDED
@@ -0,0 +1,3 @@
 
 
 
 
1
+ version https://git-lfs.github.com/spec/v1
2
+ oid sha256:4659bd29506f115bd8db03bf0627c4552626585fca224981e66b8abbca180399
3
+ size 435