Trans_for_doctors / USER_GUIDE.md

Mintik24

🎉 Полный рефакторинг проекта Medical Transcriber

e275025 27 days ago

preview code

raw

history blame contribute delete

13.8 kB

Medical Transcriber GUI - Руководство пользователя

🎯 Обзор

Medical Transcriber - это полнофункциональное Windows приложение для быстрого транскрибирования медицинских аудиодиктовок с автоматической коррекцией и созданием отчётов в формате DOCX.

Основные возможности:

✅ Транскрибирование аудио - использует модель Whisper ✅ Автоматическая коррекция - улучшение текста через LLM (GPT-4, Claude, Gemini) ✅ База медицинских терминов - специальная обработка медицинской лексики ✅ Автогенерация отчётов - создание красивых DOCX документов ✅ Сохранение истории - все результаты сохраняются с временными метками ✅ Удобный интерфейс - простой и понятный GUI

🚀 Быстрый старт

Вариант 1: Запуск готового .exe (Рекомендуется)

Скачайте MedicalTranscriber.exe из папки dist/
Двойной клик для запуска
Приложение готово к использованию!

Требования:

Windows 10/11
4+ ГБ оперативной памяти
2+ ГБ свободного места на диске

Вариант 2: Запуск из Python

# Перейти в папку проекта
cd Trans_for_doctors

# Установить зависимости
pip install -r requirements.txt

# Запустить GUI
python run_gui.py

📖 Использование приложения

Шаг 1: Выбор аудиофайла

Откройте вкладку "Транскрибирование"
Нажмите кнопку "Обзор..." в секции "1. Выбор аудиофайла"
Выберите аудиофайл (поддерживаются: WAV, MP3, M4A)
Путь к файлу отобразится в поле ввода

Поддерживаемые форматы:

.wav - рекомендуется (лучшее качество)
.mp3 - обычно качество достаточно
.m4a - работает, но медленнее

Подсказка: Чем выше качество аудио, тем лучше результат!

Шаг 2: Заполнение данных пациента

В секции "2. Данные пациента" нажмите "Заполнить данные пациента..."
В открывшемся диалоге заполните:
- ФИО пациента - обязательно (для отчёта)
- Дата рождения - в формате ДД.MM.YYYY
- Область исследования - например "МРТ головы"
- Номер исследования - идентификатор
- Дата исследования - автоматически установлена на сегодня
- ФИО врача - подпись в отчёте
Нажмите "OK" - данные сохранены

Если включена опция "Автоматически создать отчёт":

Все поля ФИО пациента и врача будут автоматически добавлены в DOCX отчёт
Дата исследования используется для датирования отчёта

Шаг 3: Выбор опций обработки

В секции "3. Опции обработки" доступны:

✅ Использовать LLM-коррекцию - включить улучшение текста через AI (рекомендуется)
✅ Автоматически создать отчёт - генерировать DOCX файл (рекомендуется)
✅ Сохранить оригинальную транскрипцию - сохранять необработанный текст

Шаг 4: Запуск обработки

Убедитесь, что выбран аудиофайл
Если нужен отчёт - заполните данные пациента
Нажмите большую зелёную кнопку "▶ Начать транскрибирование"
Дождитесь завершения (может занять несколько минут)
Результаты будут выведены в окне "5. Результаты"

Примерное время обработки:

30 сек аудио → 2-5 минут (зависит от мощности ПК и размера модели)
С LLM коррекцией → +1-3 минуты

Шаг 5: Сохранённые результаты

После успешной обработки результаты автоматически сохраняются в папках:

Trans_for_doctors/
├── results/
│   ├── result_20260116_120530.json          # Оригинальная транскрипция
│   ├── result_20260116_120530_corrected.json # Скорректированная версия
│   └── reports/
│       └── report_20260116_120530.docx      # Финальный отчёт
└── logs/
    └── transcription_20260116_120530.log    # Логи обработки

⚙️ Вкладка "Настройки"

Модель Whisper

Путь к модели - папка с загруженной моделью Whisper
- По умолчанию: папка проекта
- Скачайте модель если её нет (см. ниже)
Устройство - выбор железа для вычислений
- auto - автоматически выбирает GPU если доступен, иначе CPU
- cuda - использовать NVIDIA GPU (требуется CUDA Toolkit)
- cpu - процессор (медленнее, но всегда работает)
Тип данных - точность вычислений
- float32 - стандарт (медленнее, точнее)
- float16 - половинная точность (быстрее, меньше памяти)
- bfloat16 - BF16 (рекомендуется для новых GPU)

OpenRouter API (для LLM коррекции)

API Ключ - требуется для включения умной коррекции
- Получите на https://openrouter.ai
- Зарегистрируйтесь и создайте ключ
- Вставьте в поле "API Ключ"
Модель LLM - выбор модели для коррекции
- gpt-4o - лучшее качество коррекции, дороже
- claude-3-opus - отличное качество, более дешево
- gemini-pro - хорошее качество, быстро
- gpt-4-turbo - баланс качества и скорости

База медицинских терминов

Путь к файлу терминов - файл со специальной медицинской лексикой
- По умолчанию: medical_terms.txt в папке проекта
- Может быть отредактирован для добавления новых терминов

🔑 Получение API ключа для OpenRouter

Перейдите на https://openrouter.ai
Нажмите "Sign Up" (или "Log In" если уже есть аккаунт)
Заполните форму регистрации
Перейдите в Settings → Keys
Нажмите "Create Key"
Скопируйте ключ
Вставьте в GUI приложение → вкладка "Настройки"

Стоимость:

За запросы платите по использованию (около 5-10 рублей за 1000 слов)
Первый месяц обычно есть бесплатный кредит ($5-10)

🐛 Решение проблем

Проблема: "Модель не найдена"

Решение:

Скачайте модель Whisper:

huggingface-cli download openai/whisper-base-ru --local-dir ./whisper_model

В вкладке "Настройки" укажите путь к папке whisper_model

Проблема: "Чёрный экран при запуске"

Решение:

Приложение может загружаться медленно (особенно при первом запуске)
Подождите 30-60 секунд
Проверьте наличие модели Whisper

Проблема: "API Ключ неверный"

Решение:

Проверьте ключ на https://openrouter.ai/settings/keys
Убедитесь, что скопировали полный ключ
Наличие кредитов на аккаунте (добавьте платёж если нужно)

Проблема: "Недостаточно памяти"

Решение:

Используйте float16 вместо float32 в настройках
Закройте другие приложения
Используйте GPU если есть (установите CUDA)

Проблема: Приложение зависает

Решение:

Обычно это означает, что Whisper загружает модель (может занять несколько минут)
Если зависание длится более 5 минут, перезагрузитесь
Проверьте логи в папке logs/

📄 Формат сохраняемых отчётов

DOCX отчёт

Отчёт содержит следующие секции:

╔════════════════════════════════════════╗
║ Магнитно-резонансная томография       ║
╚════════════════════════════════════════╝

Ф.И.О: Иванов Иван Иванович
Дата рождения: 15.03.1985
Область исследования: МРТ головы
№ исследования: 12345
Дата исследования: 16.01.2026

Протокол обследования:
────────────────────
[Полная скорректированная транскрипция]

Заключение:
──────────
[Итоговое заключение]

Рекомендовано:
──────────────
[Рекомендации врача]

────────────────────────────────────────
Врач - рентгенолог                    Петров П.П.

16.01.2026

Внимание! Данное заключение не является диагнозом...

JSON результаты

Сохраняются оригинальные и скорректированные версии в JSON:

{
  "timestamp": "2026-01-16T12:05:30",
  "audio_file": "path/to/audio.wav",
  "transcription": "оригинальный текст...",
  "corrections": [
    {
      "type": "correction",
      "original": "неверное слово",
      "corrected": "верное слово"
    }
  ]
}

💡 Советы по использованию

Чистое аудио - лучше результат
- Избегайте фонового шума
- Говорите чётко и не слишком быстро
- Используйте хороший микрофон
Правильная область исследования - более точные отчёты
- Укажите конкретное исследование (МРТ, КТ, УЗ и т.д.)
- Указание области помогает коррекции
Используйте LLM коррекцию - качество на 30-50% выше
- Немного дороже, но результат лучше
- Используйте более мощные модели для сложных текстов
Сохраняйте историю - легче найти предыдущие отчёты
- Все результаты автоматически сохраняются
- Используйте номера исследований для организации

📞 Техподдержка

Если возникла проблема, проверьте:

Папка логов (logs/)
- Откройте последний лог-файл
- Ищите сообщения об ошибках
Консоль Python (если запускаете через python run_gui.py)
- Там видны детальные ошибки
Попытайтесь воспроизвести
- Попробуйте с другим аудиофайлом
- Проверьте сетевое подключение (для API)

Версия: 1.0 Дата: Январь 2026 Язык: Русский