File size: 1,169 Bytes
186f588
b4d3e15
 
 
 
0ef8bf1
b4d3e15
186f588
 
 
 
1160793
 
 
 
 
 
 
 
77c6c52
c6ddef2
 
 
bd0a813
 
 
 
c6ddef2
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
---
title: Denoising
emoji: 🤗
colorFrom: red
colorTo: orange
sdk: gradio
sdk_version: 3.28.1
app_file: app.py
pinned: false
---

# MVP
Сервисом является web interface, в котором пользователь 
сможет записать своей голос в шумных условиях и получить на выход аудиозапись без шума.
Для обработки шумных аудио файлов есть доступ к  API на питоне.

Web interface реализован на gradio. Сама работа пишется в контексте фрейморка pytorch.
В качестве системы контроля экспериментов выбран wandb. Для управления конфигами - hydra.
Архитектура модели базируется на работе "Real Time Speech Enhancement in the Waveform Domain" от facebook.



# Testing
|                 | valentini_PESQ | valentini_STOI |
|:---------------:|:--------------:|:--------------:|
| ideal denoising |     1.9709     |     0.9211     |
|    baseline     |     1.7433     |     0.8844     |