Audio Course documentation

测测你对课程内容的理解

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

测测你对课程内容的理解

1. 什么是声码器(vocoder)?

2. Wav2Vec2模型采用了什么结构?

3. CTC算法中的空白标记(blank token)有什么作用?

4. 下列关于CTC模型的选项中哪一项是 错误 的?

5. Whisper模型使用了什么结构?

6. 解决音频分类任务的最简单方法是?

7. 以下陈述是否正确:当我们在时频谱上应用图像分类技巧时,我们可以使用常见的图像数据增强(Image data augmentation)方法,例如图像平移、裁切或改变大小,来提高模型的性能。

< > Update on GitHub