Upload 5 files

Browse files

Files changed (5) hide show

config.json +302 -0
special_tokens_map.json +7 -0
tokenizer.json +0 -0
tokenizer_config.json +15 -0
vocab.txt +0 -0

config.json ADDED Viewed

	@@ -0,0 +1,302 @@

+{
+  "_name_or_path": "ethanyt/guwenbert-base",
+  "architectures": [
+    "RobertaForTokenClassification"
+  ],
+  "attention_probs_dropout_prob": 0.1,
+  "bos_token_id": 0,
+  "classifier_dropout": null,
+  "eos_token_id": 2,
+  "hidden_act": "gelu",
+  "hidden_dropout_prob": 0.1,
+  "hidden_size": 768,
+  "id2label": {
+    "0": "O",
+    "1": "B-人生-出生",
+    "2": "I-人生-出生",
+    "3": "B-人生-结婚",
+    "4": "I-人生-结婚",
+    "5": "B-人生-生病",
+    "6": "I-人生-生病",
+    "7": "B-人生-受伤",
+    "8": "I-人生-受伤",
+    "9": "B-人生-死亡",
+    "10": "I-人生-死亡",
+    "11": "B-人生-安葬",
+    "12": "I-人生-安葬",
+    "13": "B-人生-分封",
+    "14": "I-人生-分封",
+    "15": "B-人生-立谥",
+    "16": "I-人生-立谥",
+    "17": "B-职位-帝位-确立",
+    "18": "I-职位-帝位-确立",
+    "19": "B-职位-帝位-即位",
+    "20": "I-职位-帝位-即位",
+    "21": "B-职位-帝位-继位",
+    "22": "I-职位-帝位-继位",
+    "23": "B-职位-官位-任职",
+    "24": "I-职位-官位-任职",
+    "25": "B-职位-官位-免职",
+    "26": "I-职位-官位-免职",
+    "27": "B-职位-官位-升职",
+    "28": "I-职位-官位-升职",
+    "29": "B-职位-官位-降职",
+    "30": "I-职位-官位-降职",
+    "31": "B-职位-官位-赏赐",
+    "32": "I-职位-官位-赏赐",
+    "33": "B-交流-国家交流-出使",
+    "34": "I-交流-国家交流-出使",
+    "35": "B-交流-国家交流-盟约",
+    "36": "I-交流-国家交流-盟约",
+    "37": "B-交流-国家交流-朝贡",
+    "38": "I-交流-国家交流-朝贡",
+    "39": "B-交流-个人交流-见面",
+    "40": "I-交流-个人交流-见面",
+    "41": "B-交流-个人交流-商议",
+    "42": "I-交流-个人交流-商议",
+    "43": "B-交流-个人交流-询问",
+    "44": "I-交流-个人交流-询问",
+    "45": "B-交流-个人交流-诏令-命令",
+    "46": "I-交流-个人交流-诏令-命令",
+    "47": "B-交流-个人交流-诏令-下诏",
+    "48": "I-交流-个人交流-诏令-下诏",
+    "49": "B-交流-个人交流-进言",
+    "50": "I-交流-个人交流-进言",
+    "51": "B-交流-个人交流-派遣",
+    "52": "I-交流-个人交流-派遣",
+    "53": "B-祭祀-祭天神",
+    "54": "I-祭祀-祭天神",
+    "55": "B-祭祀-祭地祇",
+    "56": "I-祭祀-祭地祇",
+    "57": "B-祭祀-祭人鬼",
+    "58": "I-祭祀-祭人鬼",
+    "59": "B-移动-到达",
+    "60": "I-移动-到达",
+    "61": "B-移动-停留",
+    "62": "I-移动-停留",
+    "63": "B-移动-离开",
+    "64": "I-移动-离开",
+    "65": "B-军事-备战-出兵",
+    "66": "I-军事-备战-出兵",
+    "67": "B-军事-备战-驻扎",
+    "68": "I-军事-备战-驻扎",
+    "69": "B-军事-作战-攻击-征伐",
+    "70": "I-军事-作战-攻击-征伐",
+    "71": "B-军事-作战-攻击-侵袭",
+    "72": "I-军事-作战-攻击-侵袭",
+    "73": "B-军事-作战-防守",
+    "74": "I-军事-作战-防守",
+    "75": "B-军事-作战-谋反",
+    "76": "I-军事-作战-谋反",
+    "77": "B-军事-作战-杀害",
+    "78": "I-军事-作战-杀害",
+    "79": "B-军事-作战-救援",
+    "80": "I-军事-作战-救援",
+    "81": "B-军事-作战-撤退",
+    "82": "I-军事-作战-撤退",
+    "83": "B-军事-作战-俘虏",
+    "84": "I-军事-作战-俘虏",
+    "85": "B-军事-停战-战胜",
+    "86": "I-军事-停战-战胜",
+    "87": "B-军事-停战-战败",
+    "88": "I-军事-停战-战败",
+    "89": "B-军事-停战-投降",
+    "90": "I-军事-停战-投降",
+    "91": "B-经济-赋税-征税",
+    "92": "I-经济-赋税-征税",
+    "93": "B-经济-赋税-减税",
+    "94": "I-经济-赋税-减税",
+    "95": "B-经济-赋税-免税",
+    "96": "I-经济-赋税-免税",
+    "97": "B-经济-买卖-买入",
+    "98": "I-经济-买卖-买入",
+    "99": "B-经济-买卖-卖出",
+    "100": "I-经济-买卖-卖出",
+    "101": "B-经济-生产-耕种",
+    "102": "I-经济-生产-耕种",
+    "103": "B-经济-生产-打猎",
+    "104": "I-经济-生产-打猎",
+    "105": "B-经济-生产-建造",
+    "106": "I-经济-生产-建造",
+    "107": "B-法律-制法",
+    "108": "I-法律-制法",
+    "109": "B-法律-废法",
+    "110": "I-法律-废法",
+    "111": "B-法律-犯罪",
+    "112": "I-法律-犯罪",
+    "113": "B-法律-逮捕",
+    "114": "I-法律-逮捕",
+    "115": "B-法律-赦免",
+    "116": "I-法律-赦免",
+    "117": "B-法律-处死",
+    "118": "I-法律-处死",
+    "119": "B-法律-流放",
+    "120": "I-法律-流放",
+    "121": "B-自然-灾害-饥荒",
+    "122": "I-自然-灾害-饥荒",
+    "123": "B-自然-灾害-地震",
+    "124": "I-自然-灾害-地震",
+    "125": "B-自然-灾害-水灾",
+    "126": "I-自然-灾害-水灾",
+    "127": "B-自然-灾害-蝗灾",
+    "128": "I-自然-灾害-蝗灾",
+    "129": "B-自然-天象-日食",
+    "130": "I-自然-天象-日食",
+    "131": "B-自然-天象-���星",
+    "132": "I-自然-天象-流星",
+    "133": "B-自然-天气",
+    "134": "I-自然-天气"
+  },
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "label2id": {
+    "O": 0,
+    "B-人生-出生": 1,
+    "I-人生-死亡": 10,
+    "I-经济-买卖-卖出": 100,
+    "B-经济-生产-耕种": 101,
+    "I-经济-生产-耕种": 102,
+    "B-经济-生产-打猎": 103,
+    "I-经济-生产-打猎": 104,
+    "B-经济-生产-建造": 105,
+    "I-经济-生产-建造": 106,
+    "B-法律-制法": 107,
+    "I-法律-制法": 108,
+    "B-法律-废法": 109,
+    "B-人生-安葬": 11,
+    "I-法律-废法": 110,
+    "B-法律-犯罪": 111,
+    "I-法律-犯罪": 112,
+    "B-法律-逮捕": 113,
+    "I-法律-逮捕": 114,
+    "B-法律-赦免": 115,
+    "I-法律-赦免": 116,
+    "B-法律-处死": 117,
+    "I-法律-处死": 118,
+    "B-法律-流放": 119,
+    "I-人生-安葬": 12,
+    "I-法律-流放": 120,
+    "B-自然-灾害-饥荒": 121,
+    "I-自然-灾害-饥荒": 122,
+    "B-自然-灾害-地震": 123,
+    "I-自然-灾害-地震": 124,
+    "B-自然-灾害-水灾": 125,
+    "I-自然-灾害-水灾": 126,
+    "B-自然-灾害-蝗灾": 127,
+    "I-自然-灾害-蝗灾": 128,
+    "B-自然-天象-日食": 129,
+    "B-人生-分封": 13,
+    "I-自然-天象-日食": 130,
+    "B-自然-天象-流星": 131,
+    "I-自然-天象-流星": 132,
+    "B-自然-天气": 133,
+    "I-自然-天气": 134,
+    "I-人生-分封": 14,
+    "B-人生-立谥": 15,
+    "I-人生-立谥": 16,
+    "B-职位-帝位-确立": 17,
+    "I-职位-帝位-确立": 18,
+    "B-职位-帝位-即位": 19,
+    "I-人生-出生": 2,
+    "I-职位-帝位-即位": 20,
+    "B-职位-帝位-继位": 21,
+    "I-职位-帝位-继位": 22,
+    "B-职位-官位-任职": 23,
+    "I-职位-官位-任职": 24,
+    "B-职位-官位-免职": 25,
+    "I-职位-官位-免职": 26,
+    "B-职位-官位-升职": 27,
+    "I-职位-官位-升职": 28,
+    "B-职位-官位-降职": 29,
+    "B-人生-结婚": 3,
+    "I-职位-官位-降职": 30,
+    "B-职位-官位-赏赐": 31,
+    "I-职位-官位-赏赐": 32,
+    "B-交流-国家交流-出使": 33,
+    "I-交流-国家交流-出使": 34,
+    "B-交流-国家交流-盟约": 35,
+    "I-交流-国家交流-盟约": 36,
+    "B-交流-国家交流-朝贡": 37,
+    "I-交流-国家交流-朝贡": 38,
+    "B-交流-个人交流-见面": 39,
+    "I-人生-结婚": 4,
+    "I-交流-个人交流-见面": 40,
+    "B-交流-个人交流-商议": 41,
+    "I-交流-个人交流-商议": 42,
+    "B-交流-个人交流-询问": 43,
+    "I-交流-个人交流-询问": 44,
+    "B-交流-个人交流-诏令-命令": 45,
+    "I-交流-个人交流-诏令-命令": 46,
+    "B-交流-个人交流-诏令-下诏": 47,
+    "I-交流-个人交流-诏令-下诏": 48,
+    "B-交流-个人交流-进言": 49,
+    "B-人生-生病": 5,
+    "I-交流-个人交流-进言": 50,
+    "B-交流-个人交流-派遣": 51,
+    "I-交流-个人交流-派遣": 52,
+    "B-祭祀-祭天神": 53,
+    "I-祭祀-祭天神": 54,
+    "B-祭祀-祭地祇": 55,
+    "I-祭祀-祭地祇": 56,
+    "B-祭祀-祭人鬼": 57,
+    "I-祭祀-祭人鬼": 58,
+    "B-移动-到达": 59,
+    "I-人生-生病": 6,
+    "I-移动-到达": 60,
+    "B-移动-停留": 61,
+    "I-移动-停留": 62,
+    "B-移动-离开": 63,
+    "I-移动-离开": 64,
+    "B-军事-备战-出兵": 65,
+    "I-军事-备战-出兵": 66,
+    "B-军事-备战-驻扎": 67,
+    "I-军事-备战-驻扎": 68,
+    "B-军事-作战-攻击-征伐": 69,
+    "B-人生-受伤": 7,
+    "I-军事-作战-攻击-征伐": 70,
+    "B-军事-作战-攻击-侵袭": 71,
+    "I-军事-作战-攻击-侵袭": 72,
+    "B-军事-作战-防守": 73,
+    "I-军事-作战-防守": 74,
+    "B-军事-作战-谋反": 75,
+    "I-军事-作战-谋反": 76,
+    "B-军事-作战-杀害": 77,
+    "I-军事-作战-杀害": 78,
+    "B-军事-作战-救援": 79,
+    "I-人生-受伤": 8,
+    "I-军事-作战-救援": 80,
+    "B-军事-作战-撤退": 81,
+    "I-军事-作战-撤退": 82,
+    "B-军事-作战-俘虏": 83,
+    "I-军事-作战-俘虏": 84,
+    "B-军事-停战-战胜": 85,
+    "I-军事-停战-战胜": 86,
+    "B-军事-停战-战败": 87,
+    "I-军事-停战-战败": 88,
+    "B-军事-停战-投降": 89,
+    "B-人生-死亡": 9,
+    "I-军事-停战-投降": 90,
+    "B-经济-赋税-征税": 91,
+    "I-经济-赋税-征税": 92,
+    "B-经济-赋税-减税": 93,
+    "I-经济-赋税-减税": 94,
+    "B-经济-赋税-免税": 95,
+    "I-经济-赋税-免税": 96,
+    "B-经济-买卖-买入": 97,
+    "I-经济-买卖-买入": 98,
+    "B-经济-买卖-卖出": 99
+  },
+  "layer_norm_eps": 1e-05,
+  "max_position_embeddings": 514,
+  "model_type": "roberta",
+  "num_attention_heads": 12,
+  "num_hidden_layers": 12,
+  "pad_token_id": 1,
+  "position_embedding_type": "absolute",
+  "tokenizer_class": "BertTokenizer",
+  "torch_dtype": "float32",
+  "transformers_version": "4.31.0",
+  "type_vocab_size": 1,
+  "use_cache": true,
+  "vocab_size": 23292
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,7 @@

+{
+  "cls_token": "[CLS]",
+  "mask_token": "[MASK]",
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "unk_token": "[UNK]"
+}

tokenizer.json ADDED Viewed

The diff for this file is too large to render. See raw diff

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "clean_up_tokenization_spaces": true,
+  "cls_token": "[CLS]",
+  "do_basic_tokenize": true,
+  "do_lower_case": true,
+  "mask_token": "[MASK]",
+  "model_max_length": 1000000000000000019884624838656,
+  "never_split": null,
+  "pad_token": "[PAD]",
+  "sep_token": "[SEP]",
+  "strip_accents": null,
+  "tokenize_chinese_chars": true,
+  "tokenizer_class": "BertTokenizer",
+  "unk_token": "[UNK]"
+}

vocab.txt ADDED Viewed

The diff for this file is too large to render. See raw diff