File size: 1,324 Bytes
d106da6
 
18def1d
d106da6
 
 
 
 
 
 
 
 
 
beacf7a
e4067a1
beacf7a
e4067a1
0a6a56c
e4067a1
0a6a56c
 
 
e4067a1
 
 
0a6a56c
 
 
e4067a1
 
 
 
0a6a56c
e4067a1
 
 
0a6a56c
e4067a1
0a6a56c
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
---
title: Voxsense
emoji: 💻
colorFrom: blue
colorTo: green
sdk: gradio
sdk_version: 4.44.0
app_file: app.py
pinned: false
license: mit
short_description: Um app que transcreve e analisa sentimentos de áudios
---

# Voxsense

É uma aplicação que permite a transcrição de áudios de até 1 hora e realiza a análise de sentimentos da transcrição resultante.

## Como Usar

1. **Faça upload** de um arquivo de áudio (formatos suportados: WAV, MP3, etc.).
2. **Aguarde** enquanto o áudio é transcrito e as emoções são analisadas.
3. **Veja** a transcrição e as emoções detectadas exibidas na tela.

## Tecnologias Utilizadas

- **Gradio** para a interface web.
- **Transformers** da Hugging Face para modelos de NLP.
- **PyTorch** como backend.

## Modelos

- **Transcrição de Áudio:** `openai/whisper-small`
- **Análise de Emoções:** `joeddav/xlm-roberta-large-xnli` utilizando classificação zero-shot.

## Observações

- A precisão depende da qualidade do áudio e da clareza da fala.
- Para melhores resultados, utilize áudios com pouco ruído de fundo.
- O processamento pode levar algum tempo para áudios longos.

## Dependências

Veja o arquivo `requirements.txt` para as dependências necessárias.

## Contato

**LinkedIn:**  [`marioluciofjr`](https://linkedin.com/in/marioluciofjr)