Spaces:

DanielNRU
/

PollenNER

Sleeping

App Files Files Community

PollenNER / README.md

DanielNRU

Update README.md

c13d33c verified 5 months ago

preview code

raw

history blame contribute delete

3.48 kB

A newer version of the Gradio SDK is available: 5.49.1

Upgrade

metadata

title: PollenNER
emoji: 💊
colorFrom: indigo
colorTo: gray
sdk: gradio
sdk_version: 5.30.0
app_file: app.py
pinned: false
license: apache-2.0
short_description: Определение именованных сущностей в тексте

PollenNER - Анализ медицинских текстов

PollenNER - это система для извлечения именованных сущностей и отношений из медицинских текстов, связанных с аллергией и пыльцой. Система использует современные методы глубокого обучения для распознавания:

Топонимов (места)
Лекарств
Симптомов
Аллергенов
Частей тела
Отношений между ними (например, "глаза has_symptom слезятся")

Развертывание на HuggingFace Spaces

Создайте новый Space на HuggingFace:
- Перейдите на HuggingFace Spaces
- Нажмите "Create new Space"
- Выберите "Gradio" как SDK
- Укажите имя для вашего Space (например, "pollen-ner")
- Выберите "Public" для видимости
Загрузите файлы в Space:
- app.py - основной файл с Gradio интерфейсом
- requirements.txt - файл с зависимостями
- README.md - документация проекта
Убедитесь, что ваши модели загружены на HuggingFace Hub:
- NER модель: pollen-ner-1500
- RE модель: pollen-re-model
Настройте переменные окружения в Space:
- Перейдите в Settings -> Repository Secrets
- Добавьте необходимые токены (если требуется)

Использование

Введите текст в текстовое поле
Нажмите "Submit" или Enter
Получите результаты анализа:
- Список найденных сущностей по категориям
- Отношения между сущностями

Примеры

Входной текст:
"В Московской области у меня началась аллергия на пыльцу березы, потекли глаза, нос, принимаю Зиртек и Назонекс."

Результаты:
Найденные сущности:
TOPONYM:
- Московской области

ALLERGEN:
- пыльцу березы

SYMPTOM:
- потекли глаза
- потекли нос

MEDICINE:
- Зиртек
- Назонекс

Найденные отношения:
- глаза has_symptom потекли
- нос has_symptom течет

Технические детали

Модель NER основана на ruBERT с адаптером LoRA
Модель RE использует классификацию отношений
Интерфейс построен с использованием Gradio
Поддерживается обработка длинных текстов с разбиением на предложения

Требования

Python 3.8+
PyTorch 2.0+
Transformers 4.51.3+
Gradio 4.0+
PEFT 0.7.0+

Лицензия

apache-2.0 License