Spaces:

intelli-zen
/

language_identification

Running

HoneyTian commited on Apr 28, 2024

Commit

a830902

•

1 Parent(s): 2e23485

update

Files changed (2) hide show

lang_id_examples.json CHANGED Viewed

@@ -8,5 +8,50 @@
     "普段使いとバイクに乗るときのブーツ兼用として購入しました。",
     "ja",
     "langid"
   ]
 ]

     "普段使いとバイクに乗るときのブーツ兼用として購入しました。",
     "ja",
     "langid"
+  ],
+  [
+    "Am Anfang schuf Gott Himmel und Erde.",
+    "de",
+    "langid"
+  ],
+  [
+    "En el principio creó Dios los cielos y la tierra",
+    "es",
+    "langid"
+  ],
+  [
+    "Alussa loi Jumala taivaan ja maan.",
+    "fi",
+    "langid"
+  ],
+  [
+    "Au commencement, Dieu créa les cieux et la terre.",
+    "fr",
+    "langid"
+  ],
+  [
+    "आदि में परमेश्वर ने आकाश और पृथ्वी की सृष्टि की।",
+    "hi",
+    "langid"
+  ],
+  [
+    "hello tum kaise ho? Kya tumne Batman Begins ke bare mein suna hai? Kya great movie hai!",
+    "hi_en",
+    "langid"
+  ],
+  [
+    "I begynnelsen skapte Gud himmelen og jorden.",
+    "no",
+    "langid"
+  ],
+  [
+    "Член ООН с 1991 года, ЕС и НАТО — с 2004 года.",
+    "ru",
+    "langid"
+  ],
+  [
+    "Thina, Bantu baseNingizimu Afrika, Siyakukhumbula ukucekelwa phansi kwamalungelo okwenzeka eminyakeni eyadlula",
+    "zu",
+    "langid"
   ]
 ]

main.py CHANGED Viewed

@@ -45,6 +45,8 @@ def click_lang_id_button(text: str, ground_true: str, model_name: str):
     global lang_id_identifier
     global fasttext_model
     if model_name == "langid":
         label, prob = lang_id_identifier.classify(text)
     elif model_name == "fasttext":

     global lang_id_identifier
     global fasttext_model
+    text = str(text).strip()
     if model_name == "langid":
         label, prob = lang_id_identifier.classify(text)
     elif model_name == "fasttext":