kkuramitsu
commited on
Commit
•
50f35d0
1
Parent(s):
34ba262
first commit
Browse files- .gitattributes +1 -0
- added_tokens.json +3 -0
- config.json +3 -0
- log_kogi-mt5.txt +199 -0
- pytorch_model.bin +3 -0
- result_test.tsv +0 -0
- special_tokens_map.json +3 -0
- spiece.model +3 -0
- tokenizer.json +3 -0
- tokenizer_config.json +3 -0
.gitattributes
CHANGED
@@ -25,3 +25,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
|
|
25 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
26 |
*.zstandard filter=lfs diff=lfs merge=lfs -text
|
27 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
|
|
|
25 |
*.zip filter=lfs diff=lfs merge=lfs -text
|
26 |
*.zstandard filter=lfs diff=lfs merge=lfs -text
|
27 |
*tfevents* filter=lfs diff=lfs merge=lfs -text
|
28 |
+
*.json filter=lfs diff=lfs merge=lfs -text
|
added_tokens.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:a4b025dec6916309468bc0c986a84f1994b260cfc6bb5212566aea2aa9cfd1c9
|
3 |
+
size 128
|
config.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:6819f40ff0d15ba7ca881a8b0459f46dd0a277f5c729327b0241efc8701f6337
|
3 |
+
size 677
|
log_kogi-mt5.txt
ADDED
@@ -0,0 +1,199 @@
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
1 |
+
2022-05-31 02:06:04,923@ root [INFO] _setup_logger: PyTorch: 1.11.0+cu113
|
2 |
+
2022-05-31 02:06:04,927@ root [INFO] _setup_logger: hparams: Namespace(adam_epsilon=1e-08, additional_tokens='<nl> <tab> <b> </b> <e0> <e1> <e2> <e3>', batch_size=16, bos_token='', column=0, da_choice=0.4, da_shuffle=0.3, early_stop_callback=True, encoding='utf_8', files=['data/kogi6_train.tsv', 'data/kogi6_test.tsv'], fp_16=False, gradient_accumulation_steps=1, kfold=5, learning_rate=0.0003, limit_batches=-1, masking=False, masking_ratio=0.35, masking_style='denoising', max_epochs=30, max_grad_norm=1.0, max_length=128, max_seq_length=128, model_name_or_path='google/mt5-small', n_gpu=1, num_workers=4, opt_level='O2', output_dir='./kogi-mt5', progress_bar=False, project='kogi-mt5', save_checkpoint=False, seed=42, target_column=1, target_max_length=128, target_max_seq_length=128, tokenizer_name_or_path='google/mt5-small', warmup_steps=0, weight_decay=0.0)
|
3 |
+
2022-05-31 02:06:04,934@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
4 |
+
2022-05-31 02:06:05,704@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
|
5 |
+
2022-05-31 02:06:05,711@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
6 |
+
2022-05-31 02:06:06,387@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
|
7 |
+
2022-05-31 02:06:06,393@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
8 |
+
2022-05-31 02:06:07,151@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
|
9 |
+
2022-05-31 02:06:07,155@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
10 |
+
2022-05-31 02:06:07,859@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/spiece.model HTTP/1.1" 200 0
|
11 |
+
2022-05-31 02:06:07,866@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
12 |
+
2022-05-31 02:06:08,546@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer.json HTTP/1.1" 404 0
|
13 |
+
2022-05-31 02:06:08,549@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
14 |
+
2022-05-31 02:06:09,307@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/added_tokens.json HTTP/1.1" 404 0
|
15 |
+
2022-05-31 02:06:09,310@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
16 |
+
2022-05-31 02:06:09,986@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/special_tokens_map.json HTTP/1.1" 200 0
|
17 |
+
2022-05-31 02:06:09,990@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
18 |
+
2022-05-31 02:06:10,671@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
|
19 |
+
2022-05-31 02:06:10,674@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
20 |
+
2022-05-31 02:06:11,363@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
|
21 |
+
2022-05-31 02:06:12,047@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
22 |
+
2022-05-31 02:06:12,735@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
|
23 |
+
2022-05-31 02:06:13,600@ root [INFO] parse_hparams: vocab_size: 250100 250108
|
24 |
+
2022-05-31 02:06:13,613@ root [INFO] _main: Base model: google/mt5-small ['data/kogi6_train.tsv', 'data/kogi6_test.tsv']
|
25 |
+
2022-05-31 02:06:13,649@ torch.distributed.nn.jit.instantiator [INFO] <module>: Created a temporary directory at /tmp/9981679.1.gpu/tmpebyfoxhy
|
26 |
+
2022-05-31 02:06:13,650@ torch.distributed.nn.jit.instantiator [INFO] _write: Writing /tmp/9981679.1.gpu/tmpebyfoxhy/_remote_module_non_sriptable.py
|
27 |
+
2022-05-31 02:06:14,274@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
28 |
+
2022-05-31 02:06:14,950@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
|
29 |
+
2022-05-31 02:06:18,268@ root [INFO] _loading_dataset: loading data/kogi6_train.tsv
|
30 |
+
2022-05-31 02:06:18,296@ root [INFO] _append_data: 折れ線の線幅をnに設定する -> plt.plot(xdata, ydata, linewidth=n)
|
31 |
+
2022-05-31 02:06:18,297@ root [INFO] _append_data: 実数のサインを求める -> math.sin(x)
|
32 |
+
2022-05-31 02:06:18,298@ root [INFO] _append_data: データ列を100の位で丸める -> ds.round(-2)
|
33 |
+
2022-05-31 02:06:18,298@ root [INFO] _append_data: カデットブルーにヒストグラムの色をセットする -> plt.hist(データ列, color='cadetblue')
|
34 |
+
2022-05-31 02:06:18,299@ root [INFO] _append_data: nが負の数か -> n < 0
|
35 |
+
2022-05-31 02:06:22,695@ root [INFO] _loading_dataset: loaded 14372 dataset
|
36 |
+
2022-05-31 02:06:22,696@ root [INFO] _loading_dataset: loading data/kogi6_test.tsv
|
37 |
+
2022-05-31 02:06:22,697@ root [INFO] _append_data: グラフの色テーマを色差別なくする -> sns.set(pallete='colorblind')
|
38 |
+
2022-05-31 02:06:22,698@ root [INFO] _append_data: 縦方向に3つのデータフレームを連結する -> pd.concat([df, df2, df3], axis=0)
|
39 |
+
2022-05-31 02:06:22,699@ root [INFO] _append_data: 折れ線グラフに四角印を加える -> plt.plot(データ列, データ列2, marker='s')
|
40 |
+
2022-05-31 02:06:22,699@ root [INFO] _append_data: 折れ線グラフを実線に設定する -> plt.plot(データ列, データ列2, linestyle='solid')
|
41 |
+
2022-05-31 02:06:22,700@ root [INFO] _append_data: 折れ線グラフの色をライトサーモンに指定する -> plt.plot(データ列, データ列2, color='lightsalmon')
|
42 |
+
2022-05-31 02:06:23,613@ root [INFO] _loading_dataset: loaded 2725 dataset
|
43 |
+
2022-05-31 08:05:40,786@ root [INFO] _setup_logger: PyTorch: 1.11.0+cu113
|
44 |
+
2022-05-31 08:05:40,788@ root [INFO] _setup_logger: hparams: Namespace(adam_epsilon=1e-08, additional_tokens='<nl> <tab> <b> </b> <e0> <e1> <e2> <e3>', batch_size=16, bos_token='', column=0, da_choice=0.4, da_shuffle=0.3, early_stop_callback=True, encoding='utf_8', files=['data/kogi6_train.tsv', 'data/kogi6_test.tsv'], fp_16=False, gradient_accumulation_steps=1, kfold=5, learning_rate=0.0003, limit_batches=-1, masking=False, masking_ratio=0.35, masking_style='denoising', max_epochs=30, max_grad_norm=1.0, max_length=128, max_seq_length=128, model_name_or_path='google/mt5-small', n_gpu=1, num_workers=4, opt_level='O2', output_dir='./kogi-mt5', progress_bar=False, project='kogi-mt5', save_checkpoint=False, seed=42, target_column=1, target_max_length=128, target_max_seq_length=128, tokenizer_name_or_path='google/mt5-small', warmup_steps=0, weight_decay=0.0)
|
45 |
+
2022-05-31 08:05:40,794@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
46 |
+
2022-05-31 08:05:41,478@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
|
47 |
+
2022-05-31 08:05:41,483@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
48 |
+
2022-05-31 08:05:42,231@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
|
49 |
+
2022-05-31 08:05:42,237@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
50 |
+
2022-05-31 08:05:42,913@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
|
51 |
+
2022-05-31 08:05:42,917@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
52 |
+
2022-05-31 08:05:43,620@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/spiece.model HTTP/1.1" 200 0
|
53 |
+
2022-05-31 08:05:43,625@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
54 |
+
2022-05-31 08:05:44,309@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer.json HTTP/1.1" 404 0
|
55 |
+
2022-05-31 08:05:44,311@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
56 |
+
2022-05-31 08:05:44,988@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/added_tokens.json HTTP/1.1" 404 0
|
57 |
+
2022-05-31 08:05:44,991@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
58 |
+
2022-05-31 08:05:45,675@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/special_tokens_map.json HTTP/1.1" 200 0
|
59 |
+
2022-05-31 08:05:45,678@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
60 |
+
2022-05-31 08:05:46,360@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/tokenizer_config.json HTTP/1.1" 200 0
|
61 |
+
2022-05-31 08:05:46,363@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
62 |
+
2022-05-31 08:05:47,053@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
|
63 |
+
2022-05-31 08:05:47,638@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
64 |
+
2022-05-31 08:05:48,323@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
|
65 |
+
2022-05-31 08:05:49,140@ root [INFO] parse_hparams: vocab_size: 250100 250108
|
66 |
+
2022-05-31 08:05:49,153@ root [INFO] _main: Base model: google/mt5-small ['data/kogi6_train.tsv', 'data/kogi6_test.tsv']
|
67 |
+
2022-05-31 08:05:49,196@ torch.distributed.nn.jit.instantiator [INFO] <module>: Created a temporary directory at /tmp/9982441.1.gpu/tmpufibkjs3
|
68 |
+
2022-05-31 08:05:49,196@ torch.distributed.nn.jit.instantiator [INFO] _write: Writing /tmp/9982441.1.gpu/tmpufibkjs3/_remote_module_non_sriptable.py
|
69 |
+
2022-05-31 08:05:49,750@ urllib3.connectionpool [DEBUG] _new_conn: Starting new HTTPS connection (1): huggingface.co:443
|
70 |
+
2022-05-31 08:05:50,505@ urllib3.connectionpool [DEBUG] _make_request: https://huggingface.co:443 "HEAD /google/mt5-small/resolve/main/config.json HTTP/1.1" 200 0
|
71 |
+
2022-05-31 08:05:53,655@ root [INFO] _loading_dataset: loading data/kogi6_train.tsv
|
72 |
+
2022-05-31 08:05:53,681@ root [INFO] _append_data: 折れ線の線幅をnに設定する -> plt.plot(xdata, ydata, linewidth=n)
|
73 |
+
2022-05-31 08:05:53,682@ root [INFO] _append_data: 実数のサインを求める -> math.sin(x)
|
74 |
+
2022-05-31 08:05:53,682@ root [INFO] _append_data: データ列を100の位で丸める -> ds.round(-2)
|
75 |
+
2022-05-31 08:05:53,683@ root [INFO] _append_data: カデットブルーにヒストグラムの色をセットする -> plt.hist(データ列, color='cadetblue')
|
76 |
+
2022-05-31 08:05:53,683@ root [INFO] _append_data: nが負の数か -> n < 0
|
77 |
+
2022-05-31 08:05:57,529@ root [INFO] _loading_dataset: loaded 14372 dataset
|
78 |
+
2022-05-31 08:05:57,530@ root [INFO] _loading_dataset: loading data/kogi6_test.tsv
|
79 |
+
2022-05-31 08:05:57,531@ root [INFO] _append_data: グラフの色テーマを色差別なくする -> sns.set(pallete='colorblind')
|
80 |
+
2022-05-31 08:05:57,532@ root [INFO] _append_data: 縦方向に3つのデータフレームを連結する -> pd.concat([df, df2, df3], axis=0)
|
81 |
+
2022-05-31 08:05:57,532@ root [INFO] _append_data: 折れ線グラフに四角印を加える -> plt.plot(データ列, データ列2, marker='s')
|
82 |
+
2022-05-31 08:05:57,533@ root [INFO] _append_data: 折れ線グラフを実線に設定する -> plt.plot(データ列, データ列2, linestyle='solid')
|
83 |
+
2022-05-31 08:05:57,533@ root [INFO] _append_data: 折れ線グラフの色をライトサーモンに指定する -> plt.plot(データ列, データ列2, color='lightsalmon')
|
84 |
+
2022-05-31 08:05:58,251@ root [INFO] _loading_dataset: loaded 2725 dataset
|
85 |
+
2022-05-31 10:10:45,749@ root [INFO] _loading_dataset: loading data/kogi6_train.tsv
|
86 |
+
2022-05-31 10:10:45,752@ root [INFO] _append_data: 折れ線の線幅をnに設定する -> plt.plot(xdata, ydata, linewidth=n)
|
87 |
+
2022-05-31 10:10:45,752@ root [INFO] _append_data: 実数のサインを求める -> math.sin(x)
|
88 |
+
2022-05-31 10:10:45,752@ root [INFO] _append_data: データ列を100の位で丸める -> ds.round(-2)
|
89 |
+
2022-05-31 10:10:45,752@ root [INFO] _append_data: カデットブルーにヒストグラムの色をセットする -> plt.hist(データ列, color='cadetblue')
|
90 |
+
2022-05-31 10:10:45,752@ root [INFO] _append_data: nが負の数か -> n < 0
|
91 |
+
2022-05-31 10:10:45,787@ root [INFO] _loading_dataset: loaded 14372 dataset
|
92 |
+
2022-05-31 10:10:45,787@ root [INFO] _loading_dataset: loading data/kogi6_test.tsv
|
93 |
+
2022-05-31 10:10:45,789@ root [INFO] _append_data: グラフの色テーマを色差別なくする -> sns.set(pallete='colorblind')
|
94 |
+
2022-05-31 10:10:45,789@ root [INFO] _append_data: 縦方向に3つのデータフレームを連結する -> pd.concat([df, df2, df3], axis=0)
|
95 |
+
2022-05-31 10:10:45,789@ root [INFO] _append_data: 折れ線グラフに四角印を加える -> plt.plot(データ列, データ列2, marker='s')
|
96 |
+
2022-05-31 10:10:45,789@ root [INFO] _append_data: 折れ線グラフを実線に設定する -> plt.plot(データ列, データ列2, linestyle='solid')
|
97 |
+
2022-05-31 10:10:45,789@ root [INFO] _append_data: 折れ線グラフの色をライトサーモンに指定する -> plt.plot(データ列, データ列2, color='lightsalmon')
|
98 |
+
2022-05-31 10:10:45,795@ root [INFO] _loading_dataset: loaded 2725 dataset
|
99 |
+
2022-05-31 10:10:45,952@ root [INFO] test_and_save: データフレームのカラムが正規分布からどの程度、歪んでいるか調べる df[col].skew() df[col].kurt()
|
100 |
+
2022-05-31 10:10:47,287@ root [INFO] test_and_save: データフレームのリストカラムの中の欠損値の数を数える df[aList].isna().sum() df[aList].isna().sum()
|
101 |
+
2022-05-31 10:10:49,123@ root [INFO] test_and_save: 配列とリストについての散布図にカラーコードのポイントマーカーをプロットする plt.plot(xdata, ydata, marker='.', c=rgb) plt.plot(xdata, ydata, marker='.', c=rgb)
|
102 |
+
2022-05-31 10:10:50,276@ root [INFO] test_and_save: データフレームのカラムを丸めて整数型にする df[col].round().astype(int) df[col].round().astype(int)
|
103 |
+
2022-05-31 10:10:51,545@ root [INFO] test_and_save: <オプション>色をトマトにセットする color = 'tomato' color = 'tomato'
|
104 |
+
2022-05-31 10:10:52,904@ root [INFO] test_and_save: <オプション>パレットトルコイズを使用する color = 'paleturquoise' color = 'paleturquoise'
|
105 |
+
2022-05-31 10:10:54,166@ root [INFO] test_and_save: 折れ線グラフを描画して、その色をダークターコイズに指定する plt.plot(データ列, データ列2, color='darkturquoise') plt.plot(データ列, データ列2, color='darkturquoise')
|
106 |
+
2022-05-31 10:10:55,926@ root [INFO] test_and_save: リストの値を並べる sorted(aList) sorted(aList)
|
107 |
+
2022-05-31 10:10:57,186@ root [INFO] test_and_save: マップのキーとその値をペアとして取り出す aDict.items() aDict.items()
|
108 |
+
2022-05-31 10:10:58,574@ root [INFO] test_and_save: <オプション>ラベンダーブラッシュにグラフの色をセットする color = 'lavenderblush' color = 'lavenderblush'
|
109 |
+
2022-05-31 10:11:00,031@ root [INFO] test_and_save: グラフに水平方向の破線を付ける plt.axhline(y=0, linestyle='dashed') plt.axhline(y=0, linestyle='dashed')
|
110 |
+
2022-05-31 10:11:01,382@ root [INFO] test_and_save: 日付データの曜日を使う aDate.weekday() aDate.weekday()
|
111 |
+
2022-05-31 10:11:03,187@ root [INFO] test_and_save: リストとリストの散布図を描画し、マーカーを星に変更する plt.plot(xdata, ydata, marker='*') plt.plot(xdata, ydata, marker='*')
|
112 |
+
2022-05-31 10:11:04,763@ root [INFO] test_and_save: 折れ線グラフを描画してその色をライトスレイグレーに設定する plt.plot(データ列, データ列2, color='lightslategray') plt.plot(データ列, データ列2, color='lightslategray')
|
113 |
+
2022-05-31 10:11:06,457@ root [INFO] test_and_save: 箱ヒゲ図を2つ並べる plt.boxplot([データ列, データ列2]) plt.boxplot([データ列, データ列2])
|
114 |
+
2022-05-31 10:11:07,917@ root [INFO] test_and_save: パステル調のの色をカラーコードに設定する plt.plot(xdata, ydata, linestyle='pastel', color=rgb) plt.plot(xdata, ydata, linestyle='pastel', color=rgb)
|
115 |
+
2022-05-31 10:11:09,479@ root [INFO] test_and_save: リストとリストについての散布図にカラーコードの丸マーカーをプロットする plt.plot(xdata, ydata, marker='o', c=rgb) plt.plot(xdata, ydata, marker='o', c=rgb)
|
116 |
+
2022-05-31 10:11:10,939@ root [INFO] test_and_save: 赤い四角マーカーで散布図をプロットする plt.plot(xdata, ydata, marker='s', c='r') plt.plot(xdata, ydata, marker='s', c='r')
|
117 |
+
2022-05-31 10:11:12,559@ root [INFO] test_and_save: マルーンにヒストグラムの色を設定する plt.hist(データ列, color='maroon') plt.hist(データ列, color='maroon')
|
118 |
+
2022-05-31 10:11:14,354@ root [INFO] test_and_save: データフレームのリストカラムの25パーセンタイルを計算する df[aList].quantile(percent/100) df[aList].quantile(0.25)
|
119 |
+
2022-05-31 10:11:15,656@ root [INFO] test_and_save: 文字列を区切りで区切って、文字列リストに変換する s.split(sep) s.split(sep)
|
120 |
+
2022-05-31 10:11:17,072@ root [INFO] test_and_save: Pandasでdatetime64型のデータフレームのカラムをインデックスにする df.index = pd.DatetimeIndex(df[col]) df.index = pd.DatetimeIndex(df[col])
|
121 |
+
2022-05-31 10:11:18,332@ root [INFO] test_and_save: 二つの整数最小公倍数 math.lcm(n, n2) math.lcm(n, n2)
|
122 |
+
2022-05-31 10:11:19,723@ root [INFO] test_and_save: 空白で文字列を区切って数列に変換する map(int, s.split()) map(int, s.split())
|
123 |
+
2022-05-31 10:11:21,033@ root [INFO] test_and_save: データフレームの列をヒストグラムとして可視化する plt.hist(df[column]) plt.hist(df[column])
|
124 |
+
2022-05-31 10:11:22,799@ root [INFO] test_and_save: 線グラフを描画して、その色をミディアムパープルに設定する plt.plot(データ列, データ列2, color='mediumpurple') plt.plot(データ列, データ列2, color='mediumpurple')
|
125 |
+
2022-05-31 10:11:24,391@ root [INFO] test_and_save: リストと数列について散布図をプロットする plt.scatter(xdata, ydata) plt.scatter(xdata, ydata)
|
126 |
+
2022-05-31 10:11:25,686@ root [INFO] test_and_save: カラムのNaNを最小値に設定する ds.fillna(ds.min()) ds.fillna(ds.min())
|
127 |
+
2022-05-31 10:11:27,228@ root [INFO] test_and_save: 配列の度数分布図をプロットする plt.hist(データ列, bins=n) plt.hist(aArray)
|
128 |
+
2022-05-31 10:11:28,917@ root [INFO] test_and_save: データフレームの中で、列と列の重複を消す df.drop_duplicates(subset=[column, column2]) df.drop_duplicates(subset=[column, column2])
|
129 |
+
2022-05-31 10:11:30,503@ root [INFO] test_and_save: ダークターコイズにヒストグラムの色を指定する plt.hist(データ列, color='darkturquoise') plt.hist(データ列, color='darkturquoise')
|
130 |
+
2022-05-31 10:11:32,112@ root [INFO] test_and_save: ヒストグラムの色をダークオリーブグリーンに変更する plt.hist(データ列, color='darkolivegreen') plt.hist(データ列, color='darkolivegreen')
|
131 |
+
2022-05-31 10:11:33,653@ root [INFO] test_and_save: 両端キューをdequeue deq.count(element) deq.popleft()
|
132 |
+
2022-05-31 10:11:35,286@ root [INFO] test_and_save: データフレームのリストカラムを100の位で丸めて整数型にする df[aList].round(-2).astype(int) df[aList].round(-2).astype(int)
|
133 |
+
2022-05-31 10:11:36,824@ root [INFO] test_and_save: 文字列はタイトル大文字小文字かどうか調べる s.istitle() s.istitle()
|
134 |
+
2022-05-31 10:11:38,258@ root [INFO] test_and_save: ファイルパスの拡張子付きのファイル名を使う os.path.abspath(filepath) os.path.basename(filepath)
|
135 |
+
2022-05-31 10:11:39,723@ root [INFO] test_and_save: データフレームの列がxである行を取り出す df[df[column] == x] df[df[column] == x]
|
136 |
+
2022-05-31 10:11:41,180@ root [INFO] test_and_save: オブジェクトのバイトサイズを知る sys.getsizeof(obj) sys.getsizeof(obj)
|
137 |
+
2022-05-31 10:11:43,101@ root [INFO] test_and_save: xにヒストグラムのアルファ値を設定する plt.hist(データ列, alpha=x) plt.hist(データ列, alpha=x)
|
138 |
+
2022-05-31 10:11:44,837@ root [INFO] test_and_save: ヒストグラムの色を濃いシアンに変更する plt.hist(データ列, color='darkcyan') plt.hist(データ列, color='darkcyan')
|
139 |
+
2022-05-31 10:11:46,147@ root [INFO] test_and_save: データフレームのカラムの75パーセンタイル df[col].quantile(percent/100) df[col].quantile(0.75)
|
140 |
+
2022-05-31 10:11:47,636@ root [INFO] test_and_save: データフレームが重複している df.duplicated() df.duplicated()
|
141 |
+
2022-05-31 10:11:49,187@ root [INFO] test_and_save: リストの末尾の要素を求める aList[i], aList[-1] aList[-1]
|
142 |
+
2022-05-31 10:11:50,810@ root [INFO] test_and_save: イテラブルから集合を使う set(iterable) set(iterable)
|
143 |
+
2022-05-31 10:11:52,064@ root [INFO] test_and_save: TSVをデータフレームとして読み込む pd.read_csv(filename, sep='\t', encoding='utf-8') pd.read_csv(filename, sep='\t')
|
144 |
+
2022-05-31 10:11:53,636@ root [INFO] test_and_save: 文字列の開始位置以降に部分文字列が含まれない s.find(sub, start)!= -1 s.find(sub, start) == -1
|
145 |
+
2022-05-31 10:11:55,143@ root [INFO] test_and_save: 黒い色差別ないグラフをプロットする plt.plot(xdata, ydata, linestyle='colorblind', color='k') plt.plot(xdata, ydata, linestyle='colorblind', color='k')
|
146 |
+
2022-05-31 10:11:56,755@ root [INFO] test_and_save: 組をソートする sorted(aTuple) sorted(aTuple)
|
147 |
+
2022-05-31 10:11:58,241@ root [INFO] test_and_save: ヒストグラムを描画して、その色をダークオレンジにする plt.hist(データ列, color='darkorange') plt.hist(データ列, color='darkorange')
|
148 |
+
2022-05-31 10:11:59,644@ root [INFO] test_and_save: <オプション>色をスラグレーに変更する color ='slategray' color = 'slategrey'
|
149 |
+
2022-05-31 10:12:01,381@ root [INFO] test_and_save: リストと配列について破線グラフを描画し、、その色を淡いに設定する plt.plot(xdata, ydata, linestyle='dash', color='muted') plt.plot(xdata, ydata, linestyle='dash', color='muted')
|
150 |
+
2022-05-31 10:12:02,948@ root [INFO] test_and_save: 配列とイテラブルの散布図に黒い三角マーカーを描画する plt.plot(xdata, ydata, marker='^', c='k') plt.plot(xdata, ydata, marker='^', c='k')
|
151 |
+
2022-05-31 10:12:04,337@ root [INFO] test_and_save: まとめてValueMapでデータ列の値を置き換える ds.replace(ValueMap) ds.replace(ValueMap)
|
152 |
+
2022-05-31 10:12:06,086@ root [INFO] test_and_save: 文字列の最初からタブを取り除く s.rstrip('\t') s.lstrip('\t')
|
153 |
+
2022-05-31 10:12:07,328@ root [INFO] test_and_save: グラフの描画を綺麗にする import seaborn as sns import seaborn as sns
|
154 |
+
2022-05-31 10:12:08,538@ root [INFO] test_and_save: 文字列が小文字かどうか調べる s.islower() s.islower()
|
155 |
+
2022-05-31 10:12:10,308@ root [INFO] test_and_save: CSVTSVファイルをn番目のカラムを行として読み込む pd.read_csv(filename, index_col=n) pd.read_csv(filename, index_col=n)
|
156 |
+
2022-05-31 10:12:11,683@ root [INFO] test_and_save: 一方に含まれ、他方に含まれない集合を計算する aSet.difference(aSet2) aSet.difference(aSet2)
|
157 |
+
2022-05-31 10:12:13,412@ root [INFO] test_and_save: 配列の要素ごとの最大公約数 np.gcd(aArray, aArray2) np.gcd(aArray, aArray2)
|
158 |
+
2022-05-31 10:12:14,835@ root [INFO] test_and_save: TSV形式のファイルからデータフレームを読む pd.read_csv(filename, sep='\t', encoding='utf-8') pd.read_csv(filename, sep='\t', encoding='utf-8')
|
159 |
+
2022-05-31 10:12:16,168@ root [INFO] test_and_save: イテラブルとリストの折れ線グラフをカラーコードで描画する plt.plot(xdata, ydata, color=rgb) plt.plot(xdata, ydata, color=rgb)
|
160 |
+
2022-05-31 10:12:17,905@ root [INFO] test_and_save: データフレームのカラムのNaNを直後の値で埋める df[col].fillna(method='bfill') df[col].fillna(method='bfill')
|
161 |
+
2022-05-31 10:12:19,481@ root [INFO] test_and_save: ヒストグラムを描画して、その色をダークカーキにする plt.hist(データ列, color='darkkhaki') plt.hist(データ列, color='darkkhaki')
|
162 |
+
2022-05-31 10:12:21,023@ root [INFO] test_and_save: リストとリストを加える aList + aList2 aList + aList2
|
163 |
+
2022-05-31 10:12:22,654@ root [INFO] test_and_save: リストとリストについて散布図を描画してポイントマーカーの色をカラーコードに設定する plt.plot(xdata, ydata, marker='.', c=rgb) plt.plot(xdata, ydata, marker='.', c=rgb)
|
164 |
+
2022-05-31 10:12:24,619@ root [INFO] test_and_save: データフレームを列で並べて更新する df.sort_values(by=column, inplace=True) df.sort_values(by=column, inplace=True)
|
165 |
+
2022-05-31 10:12:26,456@ root [INFO] test_and_save: グラフのパレットを濃くする sns.set(pallete='deep') sns.set(pallete='deep')
|
166 |
+
2022-05-31 10:12:28,332@ root [INFO] test_and_save: 二つの列を並べて箱ひげ図にする plt.boxplot([データ列, データ列2], color=['b', 'r']) plt.boxplot([df[column], df[column2]])
|
167 |
+
2022-05-31 10:12:30,230@ root [INFO] test_and_save: 日付データと日付データの時間差を秒で求める (aDate - aDate2).total_seconds()//60 (aDate - aDate2).total_seconds()//60
|
168 |
+
2022-05-31 10:12:31,772@ root [INFO] test_and_save: データフレームのn行目を破壊的に消す df.drop(n, axis=0, inplace=True) df.drop(n, axis=0, inplace=True)
|
169 |
+
2022-05-31 10:12:33,347@ root [INFO] test_and_save: 黒色のポイントマーカーで散布図を描画する plt.plot(xdata, ydata, marker='.', c='k') plt.plot(xdata, ydata, marker='.', c='k')
|
170 |
+
2022-05-31 10:12:34,815@ root [INFO] test_and_save: 最後の部分文字列によって文字列を二分割する s.rpartition(sub) s.rpartition(sub)
|
171 |
+
2022-05-31 10:12:36,391@ root [INFO] test_and_save: Pandasでエポック秒のデータ列からPandasの日付型に変換する pd.to_datetime(ds, unit='s', utc=True) pd.to_datetime(ds, unit='s', utc=True)
|
172 |
+
2022-05-31 10:12:38,030@ root [INFO] test_and_save: データフレームのリスト列のヒートマップをグラフ化する sns.heatmap(df[aList].corr()) sns.heatmap(df[aList].corr())
|
173 |
+
2022-05-31 10:12:39,620@ root [INFO] test_and_save: シャルトリューズにヒストグラムの色を指定する plt.hist(データ列, color='chartreuse') plt.hist(データ列, color='chartreuse')
|
174 |
+
2022-05-31 10:12:41,248@ root [INFO] test_and_save: リストにリストを加える aList.extend(aList2) aList.extend(aList2)
|
175 |
+
2022-05-31 10:12:43,056@ root [INFO] test_and_save: ▲マーカーを散布図に使う plt.plot(xdata, ydata, marker='^') plt.plot(xdata, ydata, marker='^')
|
176 |
+
2022-05-31 10:12:44,634@ root [INFO] test_and_save: ファイルパスから読み込みストリームを開いて]、fとする f = open(filepath, mode='r') f = open(filepath, mode='r')
|
177 |
+
2022-05-31 10:12:45,815@ root [INFO] test_and_save: 列によってデータフレームをソートして、インデックスを振り直す df.sort_values(columns).reset_index() df.sort_values(columns).reset_index(drop=True)
|
178 |
+
2022-05-31 10:12:47,586@ root [INFO] test_and_save: 黒い淡いグラフを描く plt.plot(xdata, ydata, linestyle='muted', color='k') plt.plot(xdata, ydata, linestyle='muted', color='k')
|
179 |
+
2022-05-31 10:12:48,871@ root [INFO] test_and_save: ファイルに文字列を書く f.write(s) f.write(s)
|
180 |
+
2022-05-31 10:12:50,267@ root [INFO] test_and_save: 折れ線グラフの色をダークシアンにする plt.plot(データ列, データ列2, color='darkcyan') plt.plot(データ列, データ列2, color='darkcyan')
|
181 |
+
2022-05-31 10:12:52,032@ root [INFO] test_and_save: <オプション>プラムにグラフの色を変更する color = 'plum' color = 'plum'
|
182 |
+
2022-05-31 10:12:53,454@ root [INFO] test_and_save: リストとリストを使って明るいの折れ線を描いて、その線幅をnに指定する plt.plot(xdata, ydata, linestyle='bright', color='r') plt.plot(xdata, ydata, linestyle='bright', color='r')
|
183 |
+
2022-05-31 10:12:54,685@ root [INFO] test_and_save: 折れ線グラフを描画してその色を赤に設定する plt.plot(データ列, データ列2, color='red') plt.plot(データ列, データ列2, color='red')
|
184 |
+
2022-05-31 10:12:56,089@ root [INFO] test_and_save: リストとデータ列について色差別ないグラフを描いて、色を黒にする plt.plot(xdata, ydata, linestyle='colorblind', color='k') plt.plot(xdata, ydata, linestyle='colorblind', color='k')
|
185 |
+
2022-05-31 10:12:57,644@ root [INFO] test_and_save: ヒストグラムの色をクリムゾンに指定する plt.hist(データ列, color='crimson') plt.hist(データ列, color='crimson')
|
186 |
+
2022-05-31 10:12:59,326@ root [INFO] test_and_save: カウンタを少ない方からリストとして得る aCounter.most_common()[:-1] aCounter.most_common()[::-1]
|
187 |
+
2022-05-31 10:13:00,467@ root [INFO] test_and_save: 数を整数にする int(x) int(x)
|
188 |
+
2022-05-31 10:13:01,721@ root [INFO] test_and_save: <オプション>グラフの種類を一点鎖線にする linestyle = 'dashbot' linestyle = 'dashbot'
|
189 |
+
2022-05-31 10:13:03,441@ root [INFO] test_and_save: nがn2の倍数かどうか調べる n % n2 == 0 n % n2 == 0
|
190 |
+
2022-05-31 10:13:04,970@ root [INFO] test_and_save: タプルの文字列が最初に見つかる場所 aTuple.index(element) aTuple.index(element)
|
191 |
+
2022-05-31 10:13:06,492@ root [INFO] test_and_save: nの八進数表記 oct(n) oct(n)
|
192 |
+
2022-05-31 10:13:08,082@ root [INFO] test_and_save: ��ストグラムを描画して色をビスクに設定する plt.hist(データ列, color='bisque') plt.hist(データ列, color='bisque')
|
193 |
+
2022-05-31 10:13:09,727@ root [INFO] test_and_save: イテラブルの要素を両端キューの末尾に追加する collections.deque(iterable) deq.extend(iterable)
|
194 |
+
2022-05-31 10:13:10,917@ root [INFO] test_and_save: コマンドの第2引数を知る sys.argv[1] sys.argv[1]
|
195 |
+
2022-05-31 10:13:12,319@ root [INFO] test_and_save: タイムスタンプデータをn時間前に戻す aDatetime - datetime.timedelta(days=n) aDatetime - datetime.timedelta(hours=n)
|
196 |
+
2022-05-31 10:13:13,796@ root [INFO] test_and_save: 数値の積分を行う sympy.diff(e, z) sympy.integrate(e)
|
197 |
+
2022-05-31 10:13:15,417@ root [INFO] test_and_save: 暗いパレットをグラフの描画で使う sns.set(pallete='dark') sns.set(pallete='dark')
|
198 |
+
2022-05-31 10:13:16,955@ root [INFO] test_and_save: カンマで文字列を分割して文字列リストにする s.split(',') s.split(',')
|
199 |
+
2022-05-31 10:13:18,303@ root [INFO] test_and_save: 数を万の位で四捨五入する round(x, -2) round(x, -4)
|
pytorch_model.bin
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:0f592119402773c7d2c45e2b1781ffd0abe192f1d3eef06bfad2403904b3df97
|
3 |
+
size 1200790661
|
result_test.tsv
ADDED
The diff for this file is too large to render.
See raw diff
|
|
special_tokens_map.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:09059cedc26bc46bc09a52f05b92d4922e11917e87f3b92059bb1a63a59ab2c4
|
3 |
+
size 65
|
spiece.model
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:ef78f86560d809067d12bac6c09f19a462cb3af3f54d2b8acbba26e1433125d6
|
3 |
+
size 4309802
|
tokenizer.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:15fc90993f2fb28fdce67d413683eafc37738afb9e8341c62aec5e0725b06522
|
3 |
+
size 16332082
|
tokenizer_config.json
ADDED
@@ -0,0 +1,3 @@
|
|
|
|
|
|
|
|
|
1 |
+
version https://git-lfs.github.com/spec/v1
|
2 |
+
oid sha256:4659bd29506f115bd8db03bf0627c4552626585fca224981e66b8abbca180399
|
3 |
+
size 435
|