Audio Course documentation

Проверьте свое понимание материала курса

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Проверьте свое понимание материала курса

1. В каких единицах измеряется частота дискретизации?

2. При потоковой передаче большого набора аудиоданных как скоро можно начать его использовать?

3. Что такое спектрограмма?

4. Как проще всего преобразовать сырые аудиоданные в лог-мел спектрограмму, ожидаемую Whisper?

A.

librosa.feature.melspectrogram(audio["array"])

B.

feature_extractor = WhisperFeatureExtractor.from_pretrained("openai/whisper-small")
feature_extractor(audio["array"])

C.

dataset.feature(audio["array"], model="whisper")

5. Как загрузить набор данных из 🤗 Hub?

A.

from datasets import load_dataset

dataset = load_dataset(DATASET_NAME_ON_HUB)

B.

import librosa

dataset = librosa.load(PATH_TO_DATASET)

C.

from transformers import load_dataset

dataset = load_dataset(DATASET_NAME_ON_HUB)

6. Ваш пользовательский набор данных содержит высококачественные аудиозаписи с частотой дискретизации 32 кГц. Вы хотите обучить модель распознавания речи, которая ожидает, что аудиопримеры будут иметь частоту дискретизации 16 кГц. Что нужно сделать?

7. Как преобразовать спектрограмму, сгенерированную моделью машинного обучения, в форму волны?

< > Update on GitHub