NLP Course documentation

Đố vui cuối chương

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Đố vui cuối chương

Cùng kiểm tra xem bạn đã học được những gì trong chương này!

1. Khi nào ta nên huấn luyện 1 tokenizer mới?

2. Ưu điểm của việc sử dụng trình tạo danh sách văn bản so với danh sách các danh sách văn bản khi sử dụng train_new_from_iterator() là gì?

3. Ưu điểm của tokenize “nhanh” là gì?

4. Pipeline token-classification xử lý các thực thể trải dài trên nhiều token như thế nào?

5. Pipeline question-answering xử lý ngữ cảnh dài như thế nào?

6. Chuẩn hoá là gì?

7. Pre-tokenization cho một tokenizer từ phụ là sao?

8. Chọn các câu áp dụng mô hình BPE để tokenize?

9. Chọn các câu áp dụng mô hình WordPiece để tokenize?

10. Chọn các câu áp dụng mô hình Unigram để tokenize?