코스에 대한 이해도를 체크해보세요
1. 샘플링 속도는 어떤 단위를 사용합니까?
2. 큰 오디오 데이터셋을 스트리밍한다면 어느 시점부터 이를 사용할 수 있습니까?
3. 스펙트로그램이란 무엇인가요?
4. 원시 오디오 데이터를 Whisper에 적합한 로그-멜 스펙트로그램으로 변환하는 가장 쉬운 방법은?
A.
librosa.feature.melspectrogram(audio["array"])
B.
feature_extractor = WhisperFeatureExtractor.from_pretrained("openai/whisper-small")
feature_extractor(audio["array"])
C.
dataset.feature(audio["array"], model="whisper")
5. 🤗 허브에서 데이터셋을 불러오는 방법은?
A.
from datasets import load_dataset
dataset = load_dataset(DATASET_NAME_ON_HUB)
B.
import librosa
dataset = librosa.load(PATH_TO_DATASET)
C.
from transformers import load_dataset
dataset = load_dataset(DATASET_NAME_ON_HUB)