--- license: mit language: - uz metrics: - accuracy pipeline_tag: token-classification tags: - ner - uzbek_ner - ner_for_uzbek_language --- ## O'zbek tili uchun Named Entity Recognition (NER) modeli ### Model haqida Ushbu model O'zbek tilidagi matnlarda Named Entity Recognition (NER) ni aniqlash uchun yaratilgan. Model turli xil kategoriyalardagi nomlangan entitetlarni aniqlashga qodir, jumladan shaxslar, joylar, tashkilotlar, sanalar va boshqalar. Ushbu model XLM-RoBERTa large arxitekturasiga asoslangan. ### Diqqat!!! Model NEWS datasetda train qilingan va asosan NEWS textlardagi NER ni aniqlay olish aniqligi baland. ### Kategoriyalar Model quyidagi NER kategoriyalarini aniqlashga qodir: - **LOC (Joy nomlari)** - **ORG (Tashkilot nomlari)** - **PERSON (Shaxs nomlari)** - **DATE (Sana ifodalari)** - **MONEY (Pul miqdorlari)** - **PERCENT (Foiz qiymatlari)** - **QUANTITY (Miqdorlar)** - **TIME (Vaqt ifodalari)** - **PRODUCT (Mahsulot nomlari)** - **EVENT (Voqea nomlari)** - **WORK_OF_ART (San'at asarlari nomlari)** - **LANGUAGE (Til nomlari)** - **CARDINAL (Kardinal raqamlar)** - **ORDINAL (Ordinall raqamlar)** - **NORP (Millatlar yoki diniy/siyosiy guruhlar)** - **FACILITY (Inshoot nomlari)** - **LAW (Qonunlar yoki me'yorlar)** - **GPE (Davlatlar, shaharlar, shtatlar)** ### Misollar Model qanday ishlashini ko'rsatish uchun bir necha misollar: ```python from transformers import pipeline, AutoTokenizer, AutoModelForTokenClassification model_name_or_path = "sizning_model_yolingiz" tokenizer = AutoTokenizer.from_pretrained(model_name_or_path) model = AutoModelForTokenClassification.from_pretrained(model_name_or_path).to("cuda") nlp = pipeline("ner", model=model, tokenizer=tokenizer) text = "Shavkat Mirziyoyev Rossiyada rasmiy safarda bo'ldi." ner = nlp(text) for entity in ner: print(entity) ``` Misol matni: "Shavkat Mirziyoyev Rossiyada rasmiy safarda bo'ldi." Natijalar: ```python [{'entity': 'B-PERSON', 'score': 0.88995147, 'index': 1, 'word': '▁Shavkat', 'start': 0, 'end': 7}, {'entity': 'I-PERSON', 'score': 0.980681, 'index': 2, 'word': '▁Mirziyoyev', 'start': 8, 'end': 18}, {'entity': 'B-GPE', 'score': 0.8208886, 'index': 3, 'word': '▁Rossiya', 'start': 19, 'end': 26}] ``` ### Modelni yuklash va ishlatish Modelni Hugging Face platformasidan yuklab olish va ishlatish uchun quyidagi koddan foydalanishingiz mumkin: ```python from transformers import pipeline, AutoTokenizer, AutoModelForTokenClassification model_name_or_path = "sizning_model_yolingiz" tokenizer = AutoTokenizer.from_pretrained(model_name_or_path) model = AutoModelForTokenClassification.from_pretrained(model_name_or_path).to("cuda") nlp = pipeline("ner", model=model, tokenizer=tokenizer) ``` ### Bog'lanish Agar sizda savollar bo'lsa yoki qo'shimcha ma'lumot kerak bo'lsa, iltimos biz bilan bog'laning: - LinkedIn: [https://www.linkedin.com/in/risqaliyevds/](https://www.linkedin.com/in/risqaliyevds/) ### Litsenziya Ushbu model ochiq manba sifatida taqdim etiladi va barcha foydalanuvchilar uchun bepul foydalanish imkoniyatiga ega. ### Xulosa O'zbek tili uchun NER modeli matnlarda turli xil nomlangan entitetlarni aniqlashda samarali yordam beradi. Modelning yuqori aniqligi va keng qamrovli kategoriyalari uni ilmiy tadqiqotlar, hujjatlarni tahlil qilish va boshqa ko'plab sohalarda qo'llash imkonini beradi.