mms-lid-512 / config.json
patrickvonplaten's picture
make style
e537f7f
{
"_name_or_path": "mms-lid-512",
"activation_dropout": 0.05,
"adapter_attn_dim": 16,
"adapter_kernel_size": 3,
"adapter_stride": 2,
"add_adapter": false,
"apply_spec_augment": true,
"architectures": [
"Wav2Vec2ForSequenceClassification"
],
"attention_dropout": 0.05,
"bos_token_id": 1,
"classifier_proj_size": 1024,
"codevector_dim": 1024,
"contrastive_logits_temperature": 0.1,
"conv_bias": true,
"conv_dim": [
512,
512,
512,
512,
512,
512,
512
],
"conv_kernel": [
10,
3,
3,
3,
3,
2,
2
],
"conv_stride": [
5,
2,
2,
2,
2,
2,
2
],
"ctc_loss_reduction": "mean",
"ctc_zero_infinity": false,
"diversity_loss_weight": 0.1,
"do_stable_layer_norm": true,
"eos_token_id": 2,
"feat_extract_activation": "gelu",
"feat_extract_dropout": 0.0,
"feat_extract_norm": "layer",
"feat_proj_dropout": 0.05,
"feat_quantizer_dropout": 0.0,
"final_dropout": 0.05,
"hidden_act": "gelu",
"hidden_dropout": 0.05,
"hidden_size": 1280,
"id2label": {
"0": "ara",
"1": "cmn",
"2": "eng",
"3": "spa",
"4": "fra",
"5": "mlg",
"6": "swe",
"7": "por",
"8": "vie",
"9": "ful",
"10": "sun",
"11": "asm",
"12": "ben",
"13": "zlm",
"14": "kor",
"15": "ind",
"16": "hin",
"17": "tuk",
"18": "urd",
"19": "aze",
"20": "slv",
"21": "mon",
"22": "hau",
"23": "tel",
"24": "swh",
"25": "bod",
"26": "rus",
"27": "tur",
"28": "heb",
"29": "mar",
"30": "som",
"31": "tgl",
"32": "tat",
"33": "tha",
"34": "cat",
"35": "ron",
"36": "mal",
"37": "bel",
"38": "pol",
"39": "yor",
"40": "nld",
"41": "bul",
"42": "hat",
"43": "afr",
"44": "isl",
"45": "amh",
"46": "tam",
"47": "hun",
"48": "hrv",
"49": "lit",
"50": "cym",
"51": "fas",
"52": "mkd",
"53": "ell",
"54": "bos",
"55": "deu",
"56": "sqi",
"57": "jav",
"58": "kmr",
"59": "nob",
"60": "uzb",
"61": "snd",
"62": "lat",
"63": "nya",
"64": "grn",
"65": "mya",
"66": "orm",
"67": "lin",
"68": "hye",
"69": "yue",
"70": "pan",
"71": "jpn",
"72": "kaz",
"73": "npi",
"74": "kik",
"75": "kat",
"76": "guj",
"77": "kan",
"78": "tgk",
"79": "ukr",
"80": "ces",
"81": "lav",
"82": "bak",
"83": "khm",
"84": "cak",
"85": "fao",
"86": "glg",
"87": "ltz",
"88": "xog",
"89": "lao",
"90": "mlt",
"91": "sin",
"92": "aka",
"93": "sna",
"94": "che",
"95": "mam",
"96": "ita",
"97": "quc",
"98": "srp",
"99": "mri",
"100": "tuv",
"101": "nno",
"102": "pus",
"103": "eus",
"104": "kbp",
"105": "ory",
"106": "lug",
"107": "bre",
"108": "luo",
"109": "nhx",
"110": "slk",
"111": "ewe",
"112": "fin",
"113": "rif",
"114": "dan",
"115": "yid",
"116": "yao",
"117": "mos",
"118": "quh",
"119": "hne",
"120": "xon",
"121": "new",
"122": "quy",
"123": "est",
"124": "dyu",
"125": "ttq",
"126": "bam",
"127": "pse",
"128": "uig",
"129": "sck",
"130": "ngl",
"131": "tso",
"132": "mup",
"133": "dga",
"134": "seh",
"135": "lis",
"136": "wal",
"137": "ctg",
"138": "bfz",
"139": "bxk",
"140": "ceb",
"141": "kru",
"142": "war",
"143": "khg",
"144": "bbc",
"145": "thl",
"146": "vmw",
"147": "zne",
"148": "sid",
"149": "tpi",
"150": "nym",
"151": "bgq",
"152": "bfy",
"153": "hlb",
"154": "teo",
"155": "fon",
"156": "kfx",
"157": "bfa",
"158": "mag",
"159": "ayr",
"160": "any",
"161": "mnk",
"162": "adx",
"163": "ava",
"164": "hyw",
"165": "san",
"166": "kek",
"167": "chv",
"168": "kri",
"169": "btx",
"170": "nhy",
"171": "dnj",
"172": "lon",
"173": "men",
"174": "ium",
"175": "nga",
"176": "nsu",
"177": "prk",
"178": "kir",
"179": "bom",
"180": "run",
"181": "hwc",
"182": "mnw",
"183": "ubl",
"184": "kin",
"185": "rkt",
"186": "xmm",
"187": "iba",
"188": "gux",
"189": "ses",
"190": "wsg",
"191": "tir",
"192": "gbm",
"193": "mai",
"194": "nyy",
"195": "nan",
"196": "nyn",
"197": "gog",
"198": "ngu",
"199": "hoc",
"200": "nyf",
"201": "sus",
"202": "bcc",
"203": "hak",
"204": "grt",
"205": "suk",
"206": "nij",
"207": "kaa",
"208": "bem",
"209": "rmy",
"210": "nus",
"211": "ach",
"212": "awa",
"213": "dip",
"214": "rim",
"215": "nhe",
"216": "pcm",
"217": "kde",
"218": "tem",
"219": "quz",
"220": "bba",
"221": "kbr",
"222": "taj",
"223": "dik",
"224": "dgo",
"225": "bgc",
"226": "xnr",
"227": "kac",
"228": "laj",
"229": "dag",
"230": "ktb",
"231": "mgh",
"232": "shn",
"233": "oci",
"234": "zyb",
"235": "alz",
"236": "wol",
"237": "guw",
"238": "nia",
"239": "bci",
"240": "sba",
"241": "kab",
"242": "nnb",
"243": "ilo",
"244": "mfe",
"245": "xpe",
"246": "bcl",
"247": "haw",
"248": "mad",
"249": "ljp",
"250": "gmv",
"251": "nyo",
"252": "kxm",
"253": "nod",
"254": "sag",
"255": "sas",
"256": "myx",
"257": "sgw",
"258": "mak",
"259": "kfy",
"260": "jam",
"261": "lgg",
"262": "nhi",
"263": "mey",
"264": "sgj",
"265": "hay",
"266": "pam",
"267": "heh",
"268": "nhw",
"269": "yua",
"270": "shi",
"271": "mrw",
"272": "hil",
"273": "pag",
"274": "cce",
"275": "npl",
"276": "ace",
"277": "kam",
"278": "min",
"279": "pko",
"280": "toi",
"281": "ncj",
"282": "umb",
"283": "hno",
"284": "ban",
"285": "syl",
"286": "bxg",
"287": "nse",
"288": "xho",
"289": "mkw",
"290": "nch",
"291": "mas",
"292": "bum",
"293": "mww",
"294": "epo",
"295": "tzm",
"296": "zul",
"297": "lrc",
"298": "ibo",
"299": "abk",
"300": "azz",
"301": "guz",
"302": "ksw",
"303": "lus",
"304": "ckb",
"305": "mer",
"306": "pov",
"307": "rhg",
"308": "knc",
"309": "tum",
"310": "nso",
"311": "bho",
"312": "ndc",
"313": "ijc",
"314": "qug",
"315": "lub",
"316": "srr",
"317": "mni",
"318": "zza",
"319": "dje",
"320": "tiv",
"321": "gle",
"322": "lua",
"323": "swk",
"324": "ada",
"325": "lic",
"326": "skr",
"327": "mfa",
"328": "bto",
"329": "unr",
"330": "hdy",
"331": "kea",
"332": "glk",
"333": "ast",
"334": "nup",
"335": "sat",
"336": "ktu",
"337": "bhb",
"338": "sgc",
"339": "dks",
"340": "ncl",
"341": "emk",
"342": "urh",
"343": "tsc",
"344": "idu",
"345": "igb",
"346": "its",
"347": "kng",
"348": "kmb",
"349": "tsn",
"350": "bin",
"351": "gom",
"352": "ven",
"353": "sef",
"354": "sco",
"355": "trp",
"356": "glv",
"357": "haq",
"358": "kha",
"359": "rmn",
"360": "sot",
"361": "sou",
"362": "gno",
"363": "igl",
"364": "efi",
"365": "nde",
"366": "rki",
"367": "kjg",
"368": "fan",
"369": "wci",
"370": "bjn",
"371": "pmy",
"372": "bqi",
"373": "ina",
"374": "hni",
"375": "the",
"376": "nuz",
"377": "ajg",
"378": "ymm",
"379": "fmu",
"380": "nyk",
"381": "snk",
"382": "esg",
"383": "thq",
"384": "pht",
"385": "wes",
"386": "pnb",
"387": "phr",
"388": "mui",
"389": "tkt",
"390": "bug",
"391": "mrr",
"392": "kas",
"393": "zgb",
"394": "lir",
"395": "vah",
"396": "ssw",
"397": "iii",
"398": "brx",
"399": "rwr",
"400": "kmc",
"401": "dib",
"402": "pcc",
"403": "zyn",
"404": "hea",
"405": "hms",
"406": "thr",
"407": "wbr",
"408": "bfb",
"409": "wtm",
"410": "blk",
"411": "dhd",
"412": "swv",
"413": "zzj",
"414": "niq",
"415": "mtr",
"416": "gju",
"417": "kjp",
"418": "haz",
"419": "shy",
"420": "nbl",
"421": "aii",
"422": "sjp",
"423": "bns",
"424": "brh",
"425": "msi",
"426": "tsg",
"427": "tcy",
"428": "kbl",
"429": "noe",
"430": "tyz",
"431": "ahr",
"432": "aar",
"433": "wuu",
"434": "kbd",
"435": "bca",
"436": "pwr",
"437": "hsn",
"438": "kua",
"439": "tdd",
"440": "bgp",
"441": "abs",
"442": "zlj",
"443": "ebo",
"444": "bra",
"445": "nhp",
"446": "tts",
"447": "zyj",
"448": "lmn",
"449": "cqd",
"450": "dcc",
"451": "cjk",
"452": "bfr",
"453": "bew",
"454": "arg",
"455": "drs",
"456": "chw",
"457": "bej",
"458": "bjj",
"459": "ibb",
"460": "tig",
"461": "nut",
"462": "jax",
"463": "tdg",
"464": "nlv",
"465": "pch",
"466": "fvr",
"467": "mlq",
"468": "kfr",
"469": "nhn",
"470": "tji",
"471": "hoj",
"472": "cpx",
"473": "cdo",
"474": "bgn",
"475": "btm",
"476": "trf",
"477": "daq",
"478": "max",
"479": "nba",
"480": "mut",
"481": "hnd",
"482": "ryu",
"483": "abr",
"484": "sop",
"485": "odk",
"486": "nap",
"487": "gbr",
"488": "czh",
"489": "vls",
"490": "gdx",
"491": "yaf",
"492": "sdh",
"493": "anw",
"494": "ttj",
"495": "nhg",
"496": "cgg",
"497": "ifm",
"498": "mdh",
"499": "scn",
"500": "lki",
"501": "luz",
"502": "stv",
"503": "kmz",
"504": "nds",
"505": "mtq",
"506": "knn",
"507": "mnp",
"508": "bar",
"509": "mzn",
"510": "gsw",
"511": "fry"
},
"initializer_range": 0.02,
"intermediate_size": 5120,
"label2id": null,
"layer_norm_eps": 1e-05,
"layerdrop": 0.05,
"mask_feature_length": 10,
"mask_feature_min_masks": 0,
"mask_feature_prob": 0.0,
"mask_time_length": 10,
"mask_time_min_masks": 2,
"mask_time_prob": 0.05,
"model_type": "wav2vec2",
"num_adapter_layers": 3,
"num_attention_heads": 16,
"num_codevector_groups": 2,
"num_codevectors_per_group": 320,
"num_conv_pos_embedding_groups": 16,
"num_conv_pos_embeddings": 128,
"num_feat_extract_layers": 7,
"num_hidden_layers": 48,
"num_negatives": 100,
"output_hidden_size": 1280,
"pad_token_id": 0,
"proj_codevector_dim": 1024,
"tdnn_dilation": [
1,
2,
3,
1,
1
],
"tdnn_dim": [
512,
512,
512,
512,
1500
],
"tdnn_kernel": [
5,
3,
3,
1,
1
],
"torch_dtype": "float32",
"transformers_version": "4.31.0.dev0",
"use_weighted_layer_sum": false,
"vocab_size": 154,
"xvector_output_dim": 512
}