Spaces:
Running
Running
File size: 2,777 Bytes
31d29dc 076d2eb 31d29dc 076d2eb 31d29dc 076d2eb 31d29dc 34b72d4 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 |
---
title: Pdf2audio Fr
emoji: 🔥
colorFrom: indigo
colorTo: purple
sdk: gradio
sdk_version: 4.44.1
app_file: app.py
pinned: false
license: apache-2.0
short_description: version of pdf2audio in french
---
# Convertisseur PDF en Audio
Cette application Gradio convertit des PDF en podcasts, cours, résumés et plus encore. Elle utilise les modèles GPT d'OpenAI pour la génération de texte.
Pour la génération audio elle utilise la bibliothèque python edge-tts.
## Fonctionnalités
- Télécharger plusieurs fichiers PDF
- Choisir parmi différents modèles d'instructions (podcast, cours, résumé, etc.)
- Personnaliser la génération de texte et les modèles audio
- Sélectionner différentes voix pour les intervenants
## Comment utiliser
1. Télécharger un ou plusieurs fichiers PDF
2. Sélectionner le modèle d'instruction souhaité
3. Personnaliser les instructions si nécessaire
4. Cliquez sur "Générer l'audio" pour créer votre contenu audio
## Utilisation dans Colab
[![Ouvrir dans Colab](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/lamm-mit/PDF2Audio/blob/main/PDF2Audio.ipynb)
## Exemple audio
<audio controls>
<source src="https://raw.githubusercontent.com/lamm-mit/PDF2Audio/main/SciAgents%20discovery%20summary%20-%20example.mp3" type="audio/mpeg">
Votre navigateur ne prend pas en charge l'élément audio.
</audio>
## Remarque
Cette application nécessite une clé API OpenAI pour fonctionner.
## Crédits
Ce projet a été inspiré et basé sur le code disponible à [https://github.com/knowsuchagency/pdf-to-podcast](https://github.com/knowsuchagency/pdf-to-podcast) et [https://github.com/knowsuchagency/promptic](https://github.com/knowsuchagency/promptic).
Dépôt original GitHub : [lamm-mit/PDF2Audio](https://github.com/lamm-mit/PDF2Audio)
Dépôt de la version traduite en français: [jobpilot/pdf2audio](https://huggingface.co/spaces/jobpilot/pdf2audio)
```bibtex
@article{ghafarollahi2024sciagentsautomatingscientificdiscovery,
title={SciAgents : Automatisation de la découverte scientifique grâce à la raison graphique intelligente multi-agent},
author={Alireza Ghafarollahi et Markus J. Buehler},
year={2024},
eprint={2409.05556},
archivePrefix={arXiv},
primaryClass={cs.AI},
url={https://arxiv.org/abs/2409.05556},
}
@article{buehler2024graphreasoning,
title={Accélération de la découverte scientifique avec l'extraction de connaissances génératives, la représentation graphique et la raison graphique intelligente multimodale},
author={Markus J. Buehler},
journal={Machine Learning : Science et Technologie},
year={2024},
url={http://iopscience.iop.org/article/10.1088/2632-2153/ad7228},
}
```
|