ASR_espnet_model2 / README.md
Dallyana's picture
Upload 9 files
3c576c1 verified
metadata
license: apache-2.0
language:
  - es
library_name: espnet
tags:
  - automatic-speech-recognition
  - speech
  - espnet
  - spanish

reazonspeech-espnet-v1

reazonspeech-espnet-v1 es un modelo de reconocimiento automático del habla (ASR) entrenado con espnet2 para el español ecuatoriano. Este modelo tiene como objetivo reconocer el habla de diferentes regiones y acentos del Ecuador, usando un corpus propio y el corpus de Common Voice. El modelo usa una arquitectura de transformador con codificación por subpalabras (BPE). El modelo alcanza un WER de X% y un MOS de Y en el conjunto de datos de prueba. Para más detalles sobre el modelo, puedes consultar este artículo.