NLP Course documentation

章末小測試

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

章末小測試

Ask a Question

本章涵蓋了很多方面! 如果你沒有掌握所有細節, 不用擔心; 在下一章將幫助你瞭解內部的事情是如何工作的。

不過, 在繼續下一章之前, 讓我們測試一下你在本章學到的內容。

1.🤗 Datasets中的 load_dataset () 函數允許你從下列哪個位置加載數據集?

2.假設您加載了 GLUE 任務,如下所示:

from datasets import load_dataset

dataset = load_dataset("glue", "mrpc", split="train")

以下哪個命令將從 dataset 中生成50個元素的隨機樣本?

3.假設你有一個叫做寵物數據集的家庭寵物數據集,它有一個名字列表示每個寵物的名字。下列哪種方法可以讓你過濾所有名字以字母”L”開頭的寵物的數據?

4.什麼是內存映射?

5.下列哪一項是內存映射的主要好處?

6.為什麼下面的代碼是錯誤的?

from datasets import load_dataset

dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]

7.創建數據集卡的主要好處是什麼?

8.什麼是語義搜索?

9.對於非對稱語義搜索,通常有:

10.我可以使用數據集加載數據用於其他領域,如語音處理?