{ "_name_or_path": "mms-lid-512", "activation_dropout": 0.05, "adapter_attn_dim": 16, "adapter_kernel_size": 3, "adapter_stride": 2, "add_adapter": false, "apply_spec_augment": true, "architectures": [ "Wav2Vec2ForSequenceClassification" ], "attention_dropout": 0.05, "bos_token_id": 1, "classifier_proj_size": 1024, "codevector_dim": 1024, "contrastive_logits_temperature": 0.1, "conv_bias": true, "conv_dim": [ 512, 512, 512, 512, 512, 512, 512 ], "conv_kernel": [ 10, 3, 3, 3, 3, 2, 2 ], "conv_stride": [ 5, 2, 2, 2, 2, 2, 2 ], "ctc_loss_reduction": "mean", "ctc_zero_infinity": false, "diversity_loss_weight": 0.1, "do_stable_layer_norm": true, "eos_token_id": 2, "feat_extract_activation": "gelu", "feat_extract_dropout": 0.0, "feat_extract_norm": "layer", "feat_proj_dropout": 0.05, "feat_quantizer_dropout": 0.0, "final_dropout": 0.05, "hidden_act": "gelu", "hidden_dropout": 0.05, "hidden_size": 1280, "id2label": { "0": "ara", "1": "cmn", "2": "eng", "3": "spa", "4": "fra", "5": "mlg", "6": "swe", "7": "por", "8": "vie", "9": "ful", "10": "sun", "11": "asm", "12": "ben", "13": "zlm", "14": "kor", "15": "ind", "16": "hin", "17": "tuk", "18": "urd", "19": "aze", "20": "slv", "21": "mon", "22": "hau", "23": "tel", "24": "swh", "25": "bod", "26": "rus", "27": "tur", "28": "heb", "29": "mar", "30": "som", "31": "tgl", "32": "tat", "33": "tha", "34": "cat", "35": "ron", "36": "mal", "37": "bel", "38": "pol", "39": "yor", "40": "nld", "41": "bul", "42": "hat", "43": "afr", "44": "isl", "45": "amh", "46": "tam", "47": "hun", "48": "hrv", "49": "lit", "50": "cym", "51": "fas", "52": "mkd", "53": "ell", "54": "bos", "55": "deu", "56": "sqi", "57": "jav", "58": "kmr", "59": "nob", "60": "uzb", "61": "snd", "62": "lat", "63": "nya", "64": "grn", "65": "mya", "66": "orm", "67": "lin", "68": "hye", "69": "yue", "70": "pan", "71": "jpn", "72": "kaz", "73": "npi", "74": "kik", "75": "kat", "76": "guj", "77": "kan", "78": "tgk", "79": "ukr", "80": "ces", "81": "lav", "82": "bak", "83": "khm", "84": "cak", "85": "fao", "86": "glg", "87": "ltz", "88": "xog", "89": "lao", "90": "mlt", "91": "sin", "92": "aka", "93": "sna", "94": "che", "95": "mam", "96": "ita", "97": "quc", "98": "srp", "99": "mri", "100": "tuv", "101": "nno", "102": "pus", "103": "eus", "104": "kbp", "105": "ory", "106": "lug", "107": "bre", "108": "luo", "109": "nhx", "110": "slk", "111": "ewe", "112": "fin", "113": "rif", "114": "dan", "115": "yid", "116": "yao", "117": "mos", "118": "quh", "119": "hne", "120": "xon", "121": "new", "122": "quy", "123": "est", "124": "dyu", "125": "ttq", "126": "bam", "127": "pse", "128": "uig", "129": "sck", "130": "ngl", "131": "tso", "132": "mup", "133": "dga", "134": "seh", "135": "lis", "136": "wal", "137": "ctg", "138": "bfz", "139": "bxk", "140": "ceb", "141": "kru", "142": "war", "143": "khg", "144": "bbc", "145": "thl", "146": "vmw", "147": "zne", "148": "sid", "149": "tpi", "150": "nym", "151": "bgq", "152": "bfy", "153": "hlb", "154": "teo", "155": "fon", "156": "kfx", "157": "bfa", "158": "mag", "159": "ayr", "160": "any", "161": "mnk", "162": "adx", "163": "ava", "164": "hyw", "165": "san", "166": "kek", "167": "chv", "168": "kri", "169": "btx", "170": "nhy", "171": "dnj", "172": "lon", "173": "men", "174": "ium", "175": "nga", "176": "nsu", "177": "prk", "178": "kir", "179": "bom", "180": "run", "181": "hwc", "182": "mnw", "183": "ubl", "184": "kin", "185": "rkt", "186": "xmm", "187": "iba", "188": "gux", "189": "ses", "190": "wsg", "191": "tir", "192": "gbm", "193": "mai", "194": "nyy", "195": "nan", "196": "nyn", "197": "gog", "198": "ngu", "199": "hoc", "200": "nyf", "201": "sus", "202": "bcc", "203": "hak", "204": "grt", "205": "suk", "206": "nij", "207": "kaa", "208": "bem", "209": "rmy", "210": "nus", "211": "ach", "212": "awa", "213": "dip", "214": "rim", "215": "nhe", "216": "pcm", "217": "kde", "218": "tem", "219": "quz", "220": "bba", "221": "kbr", "222": "taj", "223": "dik", "224": "dgo", "225": "bgc", "226": "xnr", "227": "kac", "228": "laj", "229": "dag", "230": "ktb", "231": "mgh", "232": "shn", "233": "oci", "234": "zyb", "235": "alz", "236": "wol", "237": "guw", "238": "nia", "239": "bci", "240": "sba", "241": "kab", "242": "nnb", "243": "ilo", "244": "mfe", "245": "xpe", "246": "bcl", "247": "haw", "248": "mad", "249": "ljp", "250": "gmv", "251": "nyo", "252": "kxm", "253": "nod", "254": "sag", "255": "sas", "256": "myx", "257": "sgw", "258": "mak", "259": "kfy", "260": "jam", "261": "lgg", "262": "nhi", "263": "mey", "264": "sgj", "265": "hay", "266": "pam", "267": "heh", "268": "nhw", "269": "yua", "270": "shi", "271": "mrw", "272": "hil", "273": "pag", "274": "cce", "275": "npl", "276": "ace", "277": "kam", "278": "min", "279": "pko", "280": "toi", "281": "ncj", "282": "umb", "283": "hno", "284": "ban", "285": "syl", "286": "bxg", "287": "nse", "288": "xho", "289": "mkw", "290": "nch", "291": "mas", "292": "bum", "293": "mww", "294": "epo", "295": "tzm", "296": "zul", "297": "lrc", "298": "ibo", "299": "abk", "300": "azz", "301": "guz", "302": "ksw", "303": "lus", "304": "ckb", "305": "mer", "306": "pov", "307": "rhg", "308": "knc", "309": "tum", "310": "nso", "311": "bho", "312": "ndc", "313": "ijc", "314": "qug", "315": "lub", "316": "srr", "317": "mni", "318": "zza", "319": "dje", "320": "tiv", "321": "gle", "322": "lua", "323": "swk", "324": "ada", "325": "lic", "326": "skr", "327": "mfa", "328": "bto", "329": "unr", "330": "hdy", "331": "kea", "332": "glk", "333": "ast", "334": "nup", "335": "sat", "336": "ktu", "337": "bhb", "338": "sgc", "339": "dks", "340": "ncl", "341": "emk", "342": "urh", "343": "tsc", "344": "idu", "345": "igb", "346": "its", "347": "kng", "348": "kmb", "349": "tsn", "350": "bin", "351": "gom", "352": "ven", "353": "sef", "354": "sco", "355": "trp", "356": "glv", "357": "haq", "358": "kha", "359": "rmn", "360": "sot", "361": "sou", "362": "gno", "363": "igl", "364": "efi", "365": "nde", "366": "rki", "367": "kjg", "368": "fan", "369": "wci", "370": "bjn", "371": "pmy", "372": "bqi", "373": "ina", "374": "hni", "375": "the", "376": "nuz", "377": "ajg", "378": "ymm", "379": "fmu", "380": "nyk", "381": "snk", "382": "esg", "383": "thq", "384": "pht", "385": "wes", "386": "pnb", "387": "phr", "388": "mui", "389": "tkt", "390": "bug", "391": "mrr", "392": "kas", "393": "zgb", "394": "lir", "395": "vah", "396": "ssw", "397": "iii", "398": "brx", "399": "rwr", "400": "kmc", "401": "dib", "402": "pcc", "403": "zyn", "404": "hea", "405": "hms", "406": "thr", "407": "wbr", "408": "bfb", "409": "wtm", "410": "blk", "411": "dhd", "412": "swv", "413": "zzj", "414": "niq", "415": "mtr", "416": "gju", "417": "kjp", "418": "haz", "419": "shy", "420": "nbl", "421": "aii", "422": "sjp", "423": "bns", "424": "brh", "425": "msi", "426": "tsg", "427": "tcy", "428": "kbl", "429": "noe", "430": "tyz", "431": "ahr", "432": "aar", "433": "wuu", "434": "kbd", "435": "bca", "436": "pwr", "437": "hsn", "438": "kua", "439": "tdd", "440": "bgp", "441": "abs", "442": "zlj", "443": "ebo", "444": "bra", "445": "nhp", "446": "tts", "447": "zyj", "448": "lmn", "449": "cqd", "450": "dcc", "451": "cjk", "452": "bfr", "453": "bew", "454": "arg", "455": "drs", "456": "chw", "457": "bej", "458": "bjj", "459": "ibb", "460": "tig", "461": "nut", "462": "jax", "463": "tdg", "464": "nlv", "465": "pch", "466": "fvr", "467": "mlq", "468": "kfr", "469": "nhn", "470": "tji", "471": "hoj", "472": "cpx", "473": "cdo", "474": "bgn", "475": "btm", "476": "trf", "477": "daq", "478": "max", "479": "nba", "480": "mut", "481": "hnd", "482": "ryu", "483": "abr", "484": "sop", "485": "odk", "486": "nap", "487": "gbr", "488": "czh", "489": "vls", "490": "gdx", "491": "yaf", "492": "sdh", "493": "anw", "494": "ttj", "495": "nhg", "496": "cgg", "497": "ifm", "498": "mdh", "499": "scn", "500": "lki", "501": "luz", "502": "stv", "503": "kmz", "504": "nds", "505": "mtq", "506": "knn", "507": "mnp", "508": "bar", "509": "mzn", "510": "gsw", "511": "fry" }, "initializer_range": 0.02, "intermediate_size": 5120, "label2id": null, "layer_norm_eps": 1e-05, "layerdrop": 0.05, "mask_feature_length": 10, "mask_feature_min_masks": 0, "mask_feature_prob": 0.0, "mask_time_length": 10, "mask_time_min_masks": 2, "mask_time_prob": 0.05, "model_type": "wav2vec2", "num_adapter_layers": 3, "num_attention_heads": 16, "num_codevector_groups": 2, "num_codevectors_per_group": 320, "num_conv_pos_embedding_groups": 16, "num_conv_pos_embeddings": 128, "num_feat_extract_layers": 7, "num_hidden_layers": 48, "num_negatives": 100, "output_hidden_size": 1280, "pad_token_id": 0, "proj_codevector_dim": 1024, "tdnn_dilation": [ 1, 2, 3, 1, 1 ], "tdnn_dim": [ 512, 512, 512, 512, 1500 ], "tdnn_kernel": [ 5, 3, 3, 1, 1 ], "torch_dtype": "float32", "transformers_version": "4.31.0.dev0", "use_weighted_layer_sum": false, "vocab_size": 154, "xvector_output_dim": 512 }