metadata

language: bn
datasets:
  - wikiann
examples: null
widget:
  - text: >-
      আমি, সাকিব হোসেন হিমেল, ডাটা সায়েন্সে স্নাতকোত্তর করছি, বর্তমানে
      জার্মানির বার্লিনে থাকি, গত বছর বাংলাদেশ থেকে এসেছি।
    example_title: Sentence_1
  - text: হোর্হেলুইস বোর্হেস
    example_title: Sentence_2
  - text: বাংলাদেশ জাতীয় ক্রিকেট দল
    example_title: Sentence_3
  - text: কুড়িগ্রাম উপজেলা
    example_title: Sentence_4
  - text: লিওনার্দো দা ভিঞ্চি
    example_title: Sentence_5
  - text: রিয়াল মাদ্রিদ ফুটবল ক্লাব
    example_title: Sentence_6

Named Entity Recognition on Bangla Language

Fine Tuning BERT for NER on Bengali Language Tagging using HuggingFace

Correspondence Label ID and Label Name

Label ID	Label Name
0	O
1	B-PER
2	I-PER
3	B-ORG
4	I-ORG
5	B-LOC
6	I-LOC

Evaluation and Validation

Name	Precision	Recall	F1	Accuracy
Train/Val set	0.963899	0.964770	0.964334	0.981252
Test set	0.952855	0.965105	0.958941	0.981349

Transformers AutoModelForTokenClassification

from transformers import AutoTokenizer, AutoModelForTokenClassification
from transformers import pipeline

tokenizer = AutoTokenizer.from_pretrained("engineersakibcse47/NER_on_Bangla_Language")
model_ner = AutoModelForTokenClassification.from_pretrained("engineersakibcse47/NER_on_Bangla_Language")

pipe = pipeline("ner", model=model_ner, tokenizer=tokenizer, aggregation_strategy="simple")

sample = "বসনিয়া ও হার্জেগোভিনা"

result = pipe(sample)
result