openslr/librispeech_asr
Viewer • Updated • 585k • 102k • 224
How to use Isaacyn/fast-conformer-id-jv-v3 with NeMo:
import nemo.collections.asr as nemo_asr
asr_model = nemo_asr.models.ASRModel.from_pretrained("Isaacyn/fast-conformer-id-jv-v3")
transcriptions = asr_model.transcribe(["file.wav"])Model Fast Conformer fine-tuned untuk Bahasa Indonesia, Bahasa Jawa, dan Bahasa Inggris sebagai komponen ASR pada browser extension CaptionAI untuk aksesibilitas tunarungu.
| Komponen | v2 | v3 |
|---|---|---|
| Layer unfrozen | 8 dari 18 | Semua 18 layer |
| SpecAugment | Tidak aktif | Aktif (freq=2, time=10) |
| Gradient accumulation | 2 | 4 (batch efektif=32) |
| Data Jawa | FLEURS only | FLEURS + SLR35 |
| Balancing | Manual | Opsi B (oversample JV) |
| Bahasa | Sumber | Train samples |
|---|---|---|
| Indonesia | Common Voice 17.0 + FLEURS | 8,000 |
| Jawa | FLEURS + SLR35 (oversampled) | 8,000 |
| English | LibriSpeech train-clean-100 | 8,000 |