Spaces:

bettystr
/

NerRoB-czech

Sleeping

App Files Files Community

AlzbetaStrompova commited on May 10, 2024

Commit

081d311

•

1 Parent(s): 9d2f4c9

change layout

Browse files

Files changed (3) hide show

app.py +16 -4
flagged/log.csv +8 -0
website_script.py +2 -1

app.py CHANGED Viewed

@@ -15,11 +15,23 @@ examples = [
 def ner(text):
     result = run(tokenizer, model, gazetteers_for_matching, text)
     return {"text": text, "entities": result}
-demo = gr.Interface(ner,
-             gr.Textbox(placeholder="Enter sentence here..."),
-             gr.HighlightedText(),
-             examples=examples)
 if __name__ == "__main__":
     demo.launch()

 def ner(text):
     result = run(tokenizer, model, gazetteers_for_matching, text)
     return {"text": text, "entities": result}
+with gr.Blocks(css="footer{display:none !important}", theme=gr.themes.Default(primary_hue="blue", secondary_hue="sky")) as demo:
+# with gr.Blocks(theme=gr.themes.Soft()) as demo:
+    gr.Interface(ner,
+        gr.Textbox(lines=5, placeholder="Enter sentence here..."),
+        gr.HighlightedText(show_legend=True, color_map={"PER": "red", "ORG": "green", "LOC": "blue"}),
+        examples=examples,
+        title="NerROB-czech",
+        description="This is an implementation of a Named Entity Recognition model for the Czech language using gazetteers.",
+        allow_flagging="never")
+    gr.Interface(ner,
+        gr.File(label="Upload a JSON file"),
+        None,
+        allow_flagging="never",
+        description="Here you can upload your own gazetteers.",
+)
 if __name__ == "__main__":
     demo.launch()

flagged/log.csv ADDED Viewed

	@@ -0,0 +1,8 @@

+text,output,flag,username,timestamp
+Masarykova univerzita se nachází v Brně .,"[{""token"": """", ""class_or_confidence"": null}, {""token"": ""Masarykova univerzita"", ""class_or_confidence"": ""ORG""}, {""token"": "" se nach\u00e1z\u00ed v "", ""class_or_confidence"": null}, {""token"": ""Brn\u011b"", ""class_or_confidence"": ""LOC""}, {""token"": "" ."", ""class_or_confidence"": null}]",,,2024-05-06 02:29:01.157209
+Barack Obama navštívil Prahu minulý týden .,"[{""token"": """", ""class_or_confidence"": null}, {""token"": ""Barack Obama"", ""class_or_confidence"": ""OSV""}, {""token"": "" nav\u0161t\u00edvil "", ""class_or_confidence"": null}, {""token"": ""Prahu"", ""class_or_confidence"": ""LOC""}, {""token"": "" minul\u00fd t\u00fdden ."", ""class_or_confidence"": null}]",,,2024-05-06 02:31:57.950478
+Masarykova univerzita se nachází v Brně .,"[{""token"": """", ""class_or_confidence"": null}, {""token"": ""Masarykova univerzita"", ""class_or_confidence"": ""ORG""}, {""token"": "" se nach\u00e1z\u00ed v "", ""class_or_confidence"": null}, {""token"": ""Brn\u011b"", ""class_or_confidence"": ""LOC""}, {""token"": "" ."", ""class_or_confidence"": null}]",,,2024-05-06 02:51:30.197653
+Barack Obama navštívil Prahu minulý týden .,,,,2024-05-06 10:58:33.085992
+Masarykova univerzita se nachází v Brně .,"[{""token"": """", ""class_or_confidence"": null}, {""token"": ""Masarykova univerzita"", ""class_or_confidence"": ""ORG""}, {""token"": "" se nach\u00e1z\u00ed v "", ""class_or_confidence"": null}, {""token"": ""Brn\u011b"", ""class_or_confidence"": ""LOC""}, {""token"": "" ."", ""class_or_confidence"": null}]",,,2024-05-06 11:00:17.762652
+Masarykova univerzita se nachází v Brně .,"[{""token"": """", ""class_or_confidence"": null}, {""token"": ""Masarykova univerzita"", ""class_or_confidence"": ""ORG""}, {""token"": "" se nach\u00e1z\u00ed v "", ""class_or_confidence"": null}, {""token"": ""Brn\u011b"", ""class_or_confidence"": ""LOC""}, {""token"": "" ."", ""class_or_confidence"": null}]",,,2024-05-06 11:00:20.057269
+,,,,,2024-05-09 22:59:12.114264

website_script.py CHANGED Viewed

@@ -9,10 +9,11 @@ from data_manipulation.preprocess_gazetteers import build_reverse_dictionary
 def load():
     model_name = "ufal/robeczech-base"
     model_path = "bettystr/NerRoB-czech"
     model = ExtendedEmbeddigsRobertaForTokenClassification.from_pretrained(model_path).to("cpu")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model.eval()
-    gazetteers_path = "gazz2.json"
     gazetteers_for_matching = load_gazetteers(gazetteers_path)
     temp = []
     for i in gazetteers_for_matching.keys():

 def load():
     model_name = "ufal/robeczech-base"
     model_path = "bettystr/NerRoB-czech"
+    gazetteers_path = "gazz2.json"
     model = ExtendedEmbeddigsRobertaForTokenClassification.from_pretrained(model_path).to("cpu")
     tokenizer = AutoTokenizer.from_pretrained(model_name)
     model.eval()
     gazetteers_for_matching = load_gazetteers(gazetteers_path)
     temp = []
     for i in gazetteers_for_matching.keys():