NLP Course documentation

Đố vui cuối chương

Hugging Face's logo
Join the Hugging Face community

and get access to the augmented documentation experience

to get started

Đố vui cuối chương

Ask a Question

Chương này bao gồm rất nhiều nội dung! Đừng lo lắng nếu bạn không nắm được tất cả các chi tiết; các chương tiếp theo sẽ giúp bạn hiểu mọi thứ hoạt động như thế nào.

Tuy nhiên, trước khi tiếp tục, hãy kiểm tra những gì bạn đã học được trong chương này.

1. Hàm load_dataset() trong 🤗 Datasets cho phép bạn tải tập dữ liệu từ vị trí nào sau đây?

2. Giả sử bạn đã tải một trong số các tác vụ GLUE như sau:

from datasets import load_dataset

dataset = load_dataset("glue", "mrpc", split="train")

Đâu là một trong số những câu lệnh sẽ tạo ra một tập mẫu ngẫu nhiên 50 phần tử từ dataset?

3. Giả sử bạn có một tập dữ liệu về vật nuôi trong nhà được gọi là pets_dataset , có cột name biểu thị tên của từng vật nuôi. Phương pháp tiếp cận nào sau đây sẽ cho phép bạn lọc tập dữ liệu cho tất cả vật nuôi có tên bắt đầu bằng chữ cái “L”?

4. Ánh xạ bộ nhớ là gì?

5. Lợi ích chính của ánh xạ bộ nhớ là gì?

6. Tại sao đoạn mã sau không thành công?

from datasets import load_dataset

dataset = load_dataset("allocine", streaming=True, split="train")
dataset[0]

7. Lợi ích chính của việc tạo thẻ tập dữ liệu là gì?

8. Tìm kiếm ngữ nghĩa là gì?

9. Đối với tìm kiếm ngữ nghĩa phi đối xứng, bạn thường có:

10. Tôi có thể sử dụng 🤗 Datasets để tải dữ liệu sử dụng cho các mảng khác như xử lý âm thanh được không?

< > Update on GitHub