Upload 4 files

Files changed (4) hide show

model.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:fdc499862b9e8e9deb73458976e24efb182e2b57c15ef35f8e55cb1a1dd264f9
+size 81165818

sentencepiece.model ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:6738ed8e5f56b2c3942cc11fd8c4890c9d589dfa806a897a84f67852a4150cdb
+size 847832

shared_vocabulary.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

usage_spm.py ADDED Viewed

+#export  KMP_DUPLICATE_LIB_OK=TRUE
+import ctranslate2
+import sentencepiece as spm
+from translate import Translator
+text="I am calling from tax office"
+text="나는 세금 사무실에서 호출"
+text="میں ٹیکس آفس سے کال کر رہا ہوں۔"
+translator = ctranslate2.Translator("ur_en/")
+sp = spm.SentencePieceProcessor(model_file="ur_en/sentencepiece.model")
+tokens = sp.encode(text, out_type=str)
+translated_tokens = translator.translate_batch([tokens])
+output = sp.decode(translated_tokens[0][0]["tokens"]).replace("▁"," ")
+print( f"{output}")