File size: 3,497 Bytes
12c1463
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
"""Demo script for showcasing Telugu Language model."""
import streamlit as st
from transformers import AutoModelWithLMHead, AutoTokenizer, pipeline


@st.cache(allow_output_mutation=True)
def load_pipeline():
    """Load custom built Telugu Language model pipeline."""
    tokenizer = AutoTokenizer.from_pretrained("kuppuluri/telugu_bertu",
                                              clean_text=False,
                                              handle_chinese_chars=False,
                                              strip_accents=False,
                                              wordpieces_prefix='##')

    model = AutoModelWithLMHead.from_pretrained("kuppuluri/telugu_bertu")
    fill_mask = pipeline("fill-mask", model=model, tokenizer=tokenizer)
    return fill_mask


def main():
    """BERT Telugu Language modeling demo."""
    st.sidebar.title("""
        My Custom Model.
        Example sentences:
        1. మక్దూంపల్లి పేరుతో చాలా [MASK] ఉన్నాయి.
        2. నోరూరించే వంకాయ-జీడిపప్పు [MASK] చేయు విధానం
        3. [MASK] దెబ్బకు హెచ్‌సిఎల్ ఉద్యోగులకు వర్క్ ప్రమ్ హొమ్ అవకాశం
        4. నిజం చెప్పొద్దూ, [MASK] మొహాలు ఒక్కసారి మతాబాల్లాగ వెలిగిపోయాయి
        5. ఆశ్రమంలో వాతవరణం అంతా [MASK] వుంది.
        6. [MASK] లోకి రాగానే  సిగరెట్ కాల్చాలని పించింది.
        7. ఆస్ట్రేలియా [MASK] టెన్నిస్ టోర్నమెంటులో సంచలనం సానియా మీర్జా మూడో రౌండులోకి ప్రవేశించింది.
        8. ప్రస్తుత [MASK] సంవత్సరానికి గాను మొదటి త్రైమాసికంలో ఏప్రిల్ - జూన్  లో పరోక్ష పన్నులు 13.8 శాతానికి పెరిగి రూ.1.11 లక్షల కోట్లకు చేరంది.
        9. భారీ [MASK] ఆర్జిస్తూ, నవరత్న హోదా కలిగిన కేంద్ర ప్రభుత్వ రంగ సంస్థ స్టీల్  అథారిటీ ఆఫ్ ఇండియా
        10. శ్రీగిరిపల్లి, [MASK] రాష్ట్రం, సిద్ధిపేట జిల్లా, గజ్వేల్ మండలంలోని గ్రామం.
        11. భీమావరం పట్టణంలో ఒక చిన్న [MASK] స్టేషన్
        """)

    text = st.text_area("Text (టెక్స్ట్)",
                        "మక్దూంపల్లి పేరుతో చాలా [MASK] ఉన్నాయి.")
    fill_mask = load_pipeline()

    if st.button("Fill masks"):
        results = fill_mask(text)
        for result in results:
            score = "{0:.3%}".format(result["score"])
            st.markdown("<p>" + "<span style='color:#808080'>" + score +
                        "</span>" + "  " + result["sequence"] + "</p>",
                        unsafe_allow_html=True)


if __name__ == '__main__':
    main()