TaNER / app.py
livinNector's picture
Update app.py
fe82ca9
raw
history blame
2.12 kB
import gradio as gr
import torch
from transformers import AutoTokenizer, AutoModelForTokenClassification
tokenizer = AutoTokenizer.from_pretrained("ai4bharat/IndicNER")
model = AutoModelForTokenClassification.from_pretrained("ai4bharat/IndicNER")
def get_ner(sentence):
tok_sentence = tokenizer(sentence, return_tensors='pt')
with torch.no_grad():
logits = model(**tok_sentence).logits.argmax(-1)
predicted_tokens_classes = [
model.config.id2label[t.item()] for t in logits[0]]
predicted_labels = []
previous_token_id = 0
word_ids = tok_sentence.word_ids()
for word_index in range(len(word_ids)):
if word_ids[word_index] == None:
previous_token_id = word_ids[word_index]
elif word_ids[word_index] == previous_token_id:
previous_token_id = word_ids[word_index]
else:
predicted_labels.append(predicted_tokens_classes[word_index])
previous_token_id = word_ids[word_index]
ner_output = []
for index in range(len(sentence.split(' '))):
ner_output.append(
(sentence.split(' ')[index], predicted_labels[index]))
return ner_output
iface = gr.Interface(get_ner,
gr.Textbox(placeholder="Enter sentence here..."),
["highlight"], description='NER Specialized for Tamil Language.',
examples=["முதல்வர் ஸ்டாலின் பட்டமளிப்பு விழாவிற்காக சிதம்பரத்திலுள்ள அண்ணாமலைப் பல்கலைகழகத்திற்கு வருகை தந்தார்.","வல்லவராயன் வந்தியதேவனும் ஆதித்திய கரிகாலனும் கடம்பூருக்குச் சென்றனர். "], title='TaNER',
article='TaNER is a model developed for NER in Tamil Language'
)
iface.launch(enable_queue=True)