NLP Course documentation

Quiz de fin de chapitre

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Quiz de fin de chapitre

Ask a Question

Ce chapitre a couvert beaucoup de terrain ! Ne vous inquiétez pas si vous n’avez pas saisi tous les détails, les chapitres suivants vous aideront à comprendre comment les choses fonctionnent sous le capot.

Avant de poursuivre, testons ce que vous avez appris dans ce chapitre.

1. La fonction load_dataset() dans 🤗 Datasets vous permet de charger un jeu de données depuis lequel des emplacements suivants ?

2. Supposons que vous chargiez l’une des tâches du jeu de données GLUE comme suit :

from datasets import load_dataset

dataset = load_dataset("glue", "mrpc", split="train")

Laquelle des commandes suivantes produira un échantillon aléatoire de 50 éléments à partir de dataset ?

3. Supposons que vous disposiez d’un jeu de données sur les animaux domestiques appelé pets_dataset qui comporte une colonne name indiquant le nom de chaque animal. Parmi les approches suivantes, laquelle vous permettrait de filtrer le jeu de données pour tous les animaux dont le nom commence par la lettre « L » ?

4. Qu’est-ce que le memory mapping ?

5. Parmi les éléments suivants, lesquels sont les principaux avantages du memory mapping ?

6. Pourquoi le code suivant échoue-t-il ?

from datasets import load_dataset

dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]

7. Parmi les avantages suivants, lesquels sont les principaux pour la création d’une fiche pour les jeux de données ?

8. Qu’est-ce que la recherche sémantique ?

9. Pour la recherche sémantique asymétrique, vous avez généralement :

10. Puis-je utiliser 🤗 Datasets pour charger des données à utiliser dans d’autres domaines, comme le traitement de la parole ?