A newer version of the Gradio SDK is available:
6.1.0
metadata
title: BOB
emoji: 📈
colorFrom: blue
colorTo: pink
sdk: gradio
sdk_version: 5.49.1
app_file: app.py
pinned: false
license: mit
🎵 BOB Processor - Version Hugging Face
Application de transcription et d'analyse automatique de fichiers audio utilisant Hugging Face Transformers.
🚀 Nouveautés (Mise à jour depuis EXE)
Améliorations intégrées :
- ✅ portable_env.py : Bootstrap environnement portable avec gestion PyInstaller
- ✅ Extraction auteur améliorée : Support des formats "1 DEMARIA Philippe" → "DEMARIA Philippe"
- ✅ Interface GUI avancée : Suppression automatique des fenêtres console
- ✅ Gestion durées audio : Calcul automatique avec pydub + correction auto P+S/SON
- ✅ Variables d'environnement : Lecture dynamique des modèles depuis l'environnement
- ✅ Gestion d'erreurs améliorée : Encodage UTF-8 robuste
- ✅ API factorisée : Callbacks pour log/progress/cancel dans l'analyse
Modèles Hugging Face supportés :
- Qwen/Qwen2-7B-Instruct (recommandé) - Excellent pour l'analyse
- microsoft/DialoGPT-medium (plus léger) - Pour PC avec peu de RAM
- google/flan-t5-base (très léger) - Pour tests rapides
Fonctionnalités
- 🎵 Transcription audio avec Whisper (Small/Medium)
- 🤖 Analyse de contenu avec Hugging Face Transformers
- 📋 Classification automatique des formats :
- P = Papier seul (lecture continue)
- P+S = Papier + Son (avec témoignages/interviews)
- QR = Questions-Réponses (dialogue en direct)
- MT = Micro-Trottoir (opinions publiques)
- 📝 Extraction d'informations : Auteur, Qualification, Titre, Durée
- 🔍 Détection automatique des patterns de contenu
Utilisation
Interface Gradio (Web)
- Téléchargez un fichier audio (MP3, WAV, etc.)
- Cliquez sur "Traiter le fichier"
- Obtenez la transcription et l'analyse automatique
Interface GUI (Desktop)
python bob_gui_hf.py
Script en ligne de commande
python process_bob_hf.py
Installation
pip install -r requirements.txt
Architecture
HUGIN PORTABLE BOB/
├── portable_env.py # 🆕 Bootstrap environnement portable
├── transcribe_audio.py # Transcription Whisper
├── analyze_bob_hf.py # 🆕 Analyse Hugging Face (mis à jour)
├── bob_gui_hf.py # 🆕 Interface graphique (améliorée)
├── process_bob_hf.py # Orchestrateur principal
├── app.py # Interface Gradio pour Hugging Face Spaces
└── requirements.txt # 🆕 Dépendances nettoyées
Configuration
Variables d'environnement supportées :
HF_MODEL: Modèle Hugging Face à utiliserWHISPER_MODEL: Modèle Whisper (small/medium/large)BOB_INPUT_DIR: Dossier d'entrée des fichiers audioBOB_TRANSCRIPTIONS_DIR: Dossier de sortie des transcriptionsBOB_OUTPUT_FILE: Fichier de résumé finalHF_TOKEN: Token Hugging Face pour modèles privés
Développement
Test des améliorations
python test_ameliorations.py
Compatibilité
- ✅ Hugging Face Spaces
- ✅ Environnement portable (PyInstaller)
- ✅ Windows/Linux/macOS
- ✅ CPU et GPU (détection automatique)
Check out the configuration reference at https://huggingface.co/docs/hub/spaces-config-reference