VnReview
Hà Nội

Facebook "dạy dỗ" AI bằng... truyện cổ tích

Trí tuệ nhân tạo vẫn có khả năng đọc hiểu ngôn ngữ người khá kém, và 1,6GB truyện thiếu nhi của Facebook sẽ giúp thay đổi điều này.

Trí tuệ nhân tạo vẫn có khả năng đọc hiểu ngôn ngữ người khá kém, và 1,6GB truyện thiếu nhi của Facebook sẽ giúp thay đổi điều này.

Theo Venture Beat, Facebook mới đây đã công bố rộng rãi các dữ liệu mẫu mà mạng xã hội này sử dụng để "huấn luyện" trí thông minh nhân tạo của mình có thể hiểu được các câu truyện cổ tích, nhờ đó có thể dự đoán từ còn thiếu trong mỗi câu nói.

Bộ dữ liệu kích cỡ 1,6GB này là một phần trong tài liệu khoa học mới được Facebook công bố có tên "Nguyên tắc Goldilocks: Đọc truyện thiếu nhi với sự thể hiện bộ nhớ rõ ràng". Mark Zuckerberg, nhà sáng lập và CEO của Facebook đã mô tả về tài liệu này như sau:

"Ngôn ngữ là một trong những thứ khó hiểu nhất đối với máy tính. Việc dự đoán cách để hoàn thành câu nói là khá dễ dàng với con người nhưng lại rất khó khăn đối với máy tính. Trước đây, máy tính đã có thể dự đoán những từ dễ dàng như giới từ 'on' hoặc 'at' và các động từ như 'run' hoặc 'eat', nhưng chúng khó có thể dự đoán các danh từ như 'ball', 'table' hoặc tên người.

Với nghiên cứu này, đội ngũ của chúng tôi đã 'dạy' cho máy tính cách nhìn vào bối cảnh của một câu nói và nhờ đó dự đoán những từ khó nhằn chính xác hơn – bao gồm danh từ và tên người – thường là các phần quan trọng nhất của câu. Dự đoán của máy tính chính xác nhất khi chúng nghiên cứu đủ về bối cảnh xung quanh những từ liên quan – không quá nhiều và không quá ít. Chúng tôi gọi đây là 'Nguyên tắc Goldilocks".

Với động thái công bố đầy đủ bộ dataset này, Facebook đã giúp cho các nhà nghiên cứu học thuật có thể thực hiện cải thiện khả năng đọc hiểu ngôn ngữ người của các ứng dụng của họ.

Trí tuệ nhân tạo vẫn có khả năng đọc hiểu ngôn ngữ người khá kém, và 1,6GB truyện thiếu nhi của Facebook sẽ giúp thay đổi điều này.

Bản mẫu của bộ dữ liệu mà Facebook vừa công bố.

Trước đó, Facebook đã từng mở mã nguồn của một vài ứng dụng trí tuệ nhân tạo của hãng và thậm chí là chia sẻ thiết kế của các máy chủ AI. Các bộ dữ liệu sẽ là một cách thức mới để Facebook có thể góp phần vào công cuộc cải tiến AI của nhân loại.

Hãng Yahoo mới đây cũng công bố 13TB dữ liệu phục vụ cho nghiên cứu AI, tuy nhiên dữ liệu này chỉ dành cho một số viện nghiên cứu.

Thông tin thêm về chương trình Children Book Test của Facebook có tại đây.

 

Lê Hoàng

Chủ đề khác