Spaces:

realambuj
/

English-to-Hindi-Translator

Runtime error

ambujraj2001 commited on Apr 19, 2023

Commit

e291f2f

•

1 Parent(s): 34fff5f

done

Files changed (6) hide show

app.py ADDED Viewed

+import streamlit as st
+import joblib
+from PIL import Image
+with st.sidebar:
+    st.subheader('English to Hindi Translator')
+    st.write('This model is trained on OPUS dataset. This open parallel is the collection of translated texts from the web. It also includes translations of Wikipedia, WikiSource, WikiBooks, WikiNews and WikiQuote web pages.Built using MarianMT model')
+    image = Image.open('image.png')
+    st.image(image, caption='MarianMT model')
+    add_selectbox = st.sidebar.text(
+        "Members: \n"
+        "\tRajat Sharma\n"
+        "\tTanisha Bhargava\n"
+        "\tAyush Chouraisa\n"
+        "\tAyush Chourasia\n"
+        "\tPallavi\n"
+        "\tSmriti\n"
+    )
+st.header("English to Hindi Translator")
+text = st.text_input("Enter text to translate")
+if st.button("Translate"):
+    with st.spinner("Translating..."):
+        model = joblib.load('model.sav')
+        tokenizer = joblib.load('tokenizer.sav')
+        input_ids = tokenizer.encode(text, return_tensors="pt", padding=True)
+        outputs = model.generate(input_ids)
+        decoded_text = tokenizer.decode(outputs[0], skip_special_tokens=True)
+    st.success("Done!")
+    st.write("Hindi Translation: ",decoded_text)

image.png ADDED Viewed

main.py ADDED Viewed

+from transformers import AutoTokenizer, AutoModelForSeq2SeqLM
+import joblib
+tokenizer = AutoTokenizer.from_pretrained("Helsinki-NLP/opus-mt-en-hi")
+model = AutoModelForSeq2SeqLM.from_pretrained("Helsinki-NLP/opus-mt-en-hi")
+joblib.dump(model, 'model.sav')
+loaded_model = joblib.load('model.sav')
+joblib.dump(tokenizer, 'tokenizer.sav')
+loaded_tokenizer = joblib.load('tokenizer.sav')
+def translator(text):
+    # function to translate english text to hindi
+    input_ids = loaded_tokenizer.encode(text, return_tensors="pt", padding=True)
+    outputs = loaded_model.generate(input_ids)
+    decoded_text = loaded_tokenizer.decode(outputs[0], skip_special_tokens=True)
+    return decoded_text
+texts = ["I spend a few hours a day maintaining my website.",
+        "Where do random thoughts come from?",
+        "I can't believe that she is older than my mother.",
+        "My Mum tries to be cool by saying that she likes all the same things that I do",
+        "A song can make or ruin a person’s day if they let it get to them."]
+for text in texts:
+  print("English Text: ", text)
+  print("Hindi Translation: ", translator(text))
+  print("*"*50,"\n")

model.sav ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:9eefa7f19a6d77d5cb59e8e3ba415a5117ec63f4f461ab3f304a075f64487bd5
+size 305880976

requirements,txt ADDED Viewed

tokenizer.sav ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e242deb2f9fc0ed01de2db8fb16d4923bb7dc1b8b6314de24e52a233ee02cc6a
+size 1687217