|
"""
|
|
FLORES language code mapping to 2 letter ISO language code for compatibility
|
|
with Indic NLP Library (https://github.com/anoopkunchukuttan/indic_nlp_library)
|
|
"""
|
|
flores_codes = {
|
|
"asm_Beng": "as",
|
|
"awa_Deva": "hi",
|
|
"ben_Beng": "bn",
|
|
"bho_Deva": "hi",
|
|
"brx_Deva": "hi",
|
|
"doi_Deva": "hi",
|
|
"eng_Latn": "en",
|
|
"gom_Deva": "kK",
|
|
"guj_Gujr": "gu",
|
|
"hin_Deva": "hi",
|
|
"hne_Deva": "hi",
|
|
"kan_Knda": "kn",
|
|
"kas_Arab": "ur",
|
|
"kas_Deva": "hi",
|
|
"kha_Latn": "en",
|
|
"lus_Latn": "en",
|
|
"mag_Deva": "hi",
|
|
"mai_Deva": "hi",
|
|
"mal_Mlym": "ml",
|
|
"mar_Deva": "mr",
|
|
"mni_Beng": "bn",
|
|
"mni_Mtei": "hi",
|
|
"npi_Deva": "ne",
|
|
"ory_Orya": "or",
|
|
"pan_Guru": "pa",
|
|
"san_Deva": "hi",
|
|
"sat_Olck": "or",
|
|
"snd_Arab": "ur",
|
|
"snd_Deva": "hi",
|
|
"tam_Taml": "ta",
|
|
"tel_Telu": "te",
|
|
"urd_Arab": "ur",
|
|
}
|
|
|
|
|
|
flores_to_iso = {
|
|
"asm_Beng": "as",
|
|
"awa_Deva": "awa",
|
|
"ben_Beng": "bn",
|
|
"bho_Deva": "bho",
|
|
"brx_Deva": "brx",
|
|
"doi_Deva": "doi",
|
|
"eng_Latn": "en",
|
|
"gom_Deva": "gom",
|
|
"guj_Gujr": "gu",
|
|
"hin_Deva": "hi",
|
|
"hne_Deva": "hne",
|
|
"kan_Knda": "kn",
|
|
"kas_Arab": "ksa",
|
|
"kas_Deva": "ksd",
|
|
"kha_Latn": "kha",
|
|
"lus_Latn": "lus",
|
|
"mag_Deva": "mag",
|
|
"mai_Deva": "mai",
|
|
"mal_Mlym": "ml",
|
|
"mar_Deva": "mr",
|
|
"mni_Beng": "mnib",
|
|
"mni_Mtei": "mnim",
|
|
"npi_Deva": "ne",
|
|
"ory_Orya": "or",
|
|
"pan_Guru": "pa",
|
|
"san_Deva": "sa",
|
|
"sat_Olck": "sat",
|
|
"snd_Arab": "sda",
|
|
"snd_Deva": "sdd",
|
|
"tam_Taml": "ta",
|
|
"tel_Telu": "te",
|
|
"urd_Arab": "ur",
|
|
}
|
|
|
|
iso_to_flores = {iso_code: flores_code for flores_code, iso_code in flores_to_iso.items()}
|
|
|
|
iso_to_flores["ks"] = "kas_Arab"
|
|
iso_to_flores["ks_Deva"] = "kas_Deva"
|
|
iso_to_flores["mni"] = "mni_Mtei"
|
|
iso_to_flores["mni_Beng"] = "mni_Beng"
|
|
iso_to_flores["sd"] = "snd_Arab"
|
|
iso_to_flores["sd_Deva"] = "snd_Deva"
|
|
|