Karthik Uppuluri commited on
Commit
12c1463
1 Parent(s): fc5ddb4

Telugu Language Model streamlit demo

Browse files
Files changed (1) hide show
  1. language_model_demo.py +52 -0
language_model_demo.py ADDED
@@ -0,0 +1,52 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ """Demo script for showcasing Telugu Language model."""
2
+ import streamlit as st
3
+ from transformers import AutoModelWithLMHead, AutoTokenizer, pipeline
4
+
5
+
6
+ @st.cache(allow_output_mutation=True)
7
+ def load_pipeline():
8
+ """Load custom built Telugu Language model pipeline."""
9
+ tokenizer = AutoTokenizer.from_pretrained("kuppuluri/telugu_bertu",
10
+ clean_text=False,
11
+ handle_chinese_chars=False,
12
+ strip_accents=False,
13
+ wordpieces_prefix='##')
14
+
15
+ model = AutoModelWithLMHead.from_pretrained("kuppuluri/telugu_bertu")
16
+ fill_mask = pipeline("fill-mask", model=model, tokenizer=tokenizer)
17
+ return fill_mask
18
+
19
+
20
+ def main():
21
+ """BERT Telugu Language modeling demo."""
22
+ st.sidebar.title("""
23
+ My Custom Model.
24
+ Example sentences:
25
+ 1. మక్దూంపల్లి పేరుతో చాలా [MASK] ఉన్నాయి.
26
+ 2. నోరూరించే వంకాయ-జీడిపప్పు [MASK] చేయు విధానం
27
+ 3. [MASK] దెబ్బకు హెచ్‌సిఎల్ ఉద్యోగులకు వర్క్ ప్రమ్ హొమ్ అవకాశం
28
+ 4. నిజం చెప్పొద్దూ, [MASK] మొహాలు ఒక్కసారి మతాబాల్లాగ వెలిగిపోయాయి
29
+ 5. ఆశ్రమంలో వాతవరణం అంతా [MASK] వుంది.
30
+ 6. [MASK] లోకి రాగానే సిగరెట్ కాల్చాలని పించింది.
31
+ 7. ఆస్ట్రేలియా [MASK] టెన్నిస్ టోర్నమెంటులో సంచలనం సానియా మీర్జా మూడో రౌండులోకి ప్రవేశించింది.
32
+ 8. ప్రస్తుత [MASK] సంవత్సరానికి గాను మొదటి త్రైమాసికంలో ఏప్రిల్ - జూన్ లో పరోక్ష పన్నులు 13.8 శాతానికి పెరిగి రూ.1.11 లక్షల కోట్లకు చేరంది.
33
+ 9. భారీ [MASK] ఆర్జిస్తూ, నవరత్న హోదా కలిగిన కేంద్ర ప్రభుత్వ రంగ సంస్థ స్టీల్ అథారిటీ ఆఫ్ ఇండియా
34
+ 10. శ్రీగిరిపల్లి, [MASK] రాష్ట్రం, సిద్ధిపేట జిల్లా, గజ్వేల్ మండలంలోని గ్రామం.
35
+ 11. భీమావరం పట్టణంలో ఒక చిన్న [MASK] స్టేషన్
36
+ """)
37
+
38
+ text = st.text_area("Text (టెక్స్ట్)",
39
+ "మక్దూంపల్లి పేరుతో చాలా [MASK] ఉన్నాయి.")
40
+ fill_mask = load_pipeline()
41
+
42
+ if st.button("Fill masks"):
43
+ results = fill_mask(text)
44
+ for result in results:
45
+ score = "{0:.3%}".format(result["score"])
46
+ st.markdown("<p>" + "<span style='color:#808080'>" + score +
47
+ "</span>" + " " + result["sequence"] + "</p>",
48
+ unsafe_allow_html=True)
49
+
50
+
51
+ if __name__ == '__main__':
52
+ main()