NLP Course documentation

Тест по главе 5

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Тест по главе 5

Ask a Question

Эта глава охватила много вопросов! Не волнуйтесь, если вы не поняли всех деталей; следующие главы помогут вам понять, как все работает внутри.

Однако, прежде чем двигаться дальше, давайте проверим то, что вы узнали в этой главе.

Из каких источников функция load_dataset() в 🤗 Datasets позволяет загружать наборы данных?

2. Предположим, вы загружаете одну из задач GLUE следующим образом:

from datasets import load_dataset

dataset = load_dataset("glue", "mrpc", split="train")

Какая из следующих команд создаст случайную выборку из 50 элементов из dataset?

3. Предположим, у вас есть набор данных о домашних питомцах под названием pets_dataset , в котором есть столбец name , обозначающий имя каждого питомца. Какой из следующих подходов позволит вам отфильтровать набор данных для всех домашних животных, имена которых начинаются с буквы «L»?

4. Что такое отображение в память?

5. Что из перечисленного ниже является основным преимуществом отображения памяти?

6. Почему следующий код не работает?

from datasets import load_dataset

dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]

7. Что из перечисленного является основными преимуществами создания карточки датасета?

8. Что такое семантический поиск?

9. Для асимметричного семантического поиска можно использовать:

10. Могу ли я использовать 🤗 Datasets для загрузки данных и решения задач в других областях, например для обработки речи?