Minh Nguyệt
Intern Writer
Chào các bạn, dạo gần đây mình hay trò chuyện với mấy bạn AI như ChatGPT hay Claude, và có một điều khá thú vị mà chúng ta cần biết về các mô hình ngôn ngữ lớn (LLM) này: chúng chỉ có thể tạo ra văn bản dựa trên những gì đã được "học" từ bộ dữ liệu huấn luyện thôi. Các bạn AI này được đào tạo trên kho dữ liệu văn bản khổng lồ, và khi chúng ta hỏi, chúng sẽ tính toán thống kê để đưa ra từ tiếp theo có khả năng nhất, cứ thế từng từ một mà thành câu trả lời.
Điều này dẫn đến một hệ quả là các LLM không thể "sáng tạo" ra những đột phá khoa học chưa từng xảy ra, bởi vì làm gì có tài liệu nào nói về những đột phá đó mà chúng học được, đúng không nào? Cùng lắm thì AI chỉ có thể lặp lại hoặc tổng hợp những dự đoán mà các nhà nghiên cứu đã viết ra mà thôi.
Adam Mastroianni, trong bản tin *Experimental History* của mình, đã diễn tả điều này rất hay. Anh ấy nói rằng, nếu chúng ta "khởi động" một AI siêu thông minh ở Hy Lạp cổ đại, cung cấp cho nó toàn bộ tri thức nhân loại thời đó và hỏi cách hạ cánh lên mặt trăng, thì nó sẽ trả lời: "Bạn không thể hạ cánh lên mặt trăng. Mặt trăng là một vị thần đang trôi nổi trên bầu trời." Nghe có vẻ buồn cười nhưng lại rất đúng với bản chất của AI hiện tại.
Vậy thì, một câu hỏi thú vị đặt ra là: nếu chúng ta cố tình giới hạn dữ liệu huấn luyện thì sao? Liệu có thể tạo ra một hệ thống AI phản hồi như thể nó đến từ một thời kỳ trong quá khứ không? Và điều đó có thể tiết lộ gì về tâm lý hay trải nghiệm hàng ngày của con người từ thời đại đó?
Đây chính xác là ý tưởng mà Hayk Grigorian, một sinh viên tại Đại học Muhlenberg ở Allentown, Pennsylvania, đã ấp ủ khi tạo ra TimeCapsuleLLM. Hệ thống AI thử nghiệm này được huấn luyện hoàn toàn bằng các văn bản từ London thế kỷ 19. Phiên bản hiện tại của nó dựa trên 90 gigabyte tệp văn bản được xuất bản tại thành phố London trong khoảng thời gian từ năm 1800 đến năm 1875.
Phải nói rõ là đây chỉ là một dự án cá nhân thôi nhé. Các văn bản mẫu mà AI này tạo ra trên GitHub không phải lúc nào cũng mạch lạc, nhưng trang *Ars Technica* đã đưa tin rằng nó có thể tìm ra chính xác các tên và sự kiện từ những năm 1800. Chẳng hạn, khi được yêu cầu tiếp tục câu "Đó là năm của Chúa 1834," mô hình đã kể lại một cuộc biểu tình: "các đường phố London tràn ngập biểu tình và kiến nghị," và còn nhắc đến các chính sách của Lord Palmerston, người lúc đó là Bộ trưởng Ngoại giao. Thật đáng kinh ngạc phải không?
Đây là một thử nghiệm rất thú vị, nhưng liệu nó có thực sự hữu ích không? Có thể lắm chứ!
Một bài viết ý kiến được đăng trên *Proceedings of the National Academy of Sciences of the United States of America (PNAS)* của các cộng tác viên, trong đó có Michael E. W. Varnum, giáo sư tâm lý học từ Khoa Tâm lý học tại Đại học bang Arizona, là một tài liệu rất đáng đọc. Bài viết này đề xuất rằng các mô hình như TimeCapsuleLLM có thể là một cách để nghiên cứu tâm lý học ngoài bối cảnh hiện đại. Bài báo gọi những mô hình AI này là Mô hình Ngôn ngữ Lớn Lịch sử, hay HLLM, và cho rằng các nhà nghiên cứu tâm lý học có thể sử dụng chúng để nghiên cứu tư duy của con người trong các nền văn minh quá khứ.
Về nguyên tắc, các phản hồi từ những "cá nhân giả lập" này có thể phản ánh tâm lý của các xã hội trong quá khứ, cho phép một ngành khoa học về bản chất con người mạnh mẽ và liên ngành hơn. Chẳng hạn, các nhà nghiên cứu có thể so sánh xu hướng hợp tác của người Viking, người La Mã cổ đại và người Nhật Bản thời kỳ đầu hiện đại trong các trò chơi kinh tế. Hoặc họ có thể khám phá thái độ về vai trò giới tính điển hình của người Ba Tư cổ đại hay người châu Âu thời Trung cổ.
Đây là một ý tưởng rất hay, mặc dù bài báo cũng thừa nhận rằng điều này có thể khá phức tạp.
Tất cả các LLM đều là sản phẩm của kho dữ liệu huấn luyện, và HLLM phải đối mặt với những thách thức về việc lấy mẫu, vì các văn bản lịch sử còn sót lại có thể không phải là mẫu đại diện cho tất cả những người sống trong một thời kỳ cụ thể. Bài báo thừa nhận rằng các văn bản lịch sử thường được viết bởi giới tinh hoa, chứ không phải người dân thường. Do đó, sẽ rất khó để khái quát hóa từ những mô hình này.
Và còn một điều nữa chúng ta cần lưu ý. Nghiên cứu từ Đại học Ghent ở Bỉ cho thấy rằng tư tưởng của những người phát triển LLM sẽ thể hiện trong văn bản mà các mô hình đó tạo ra. Có mọi lý do để nghi ngờ rằng vấn đề tương tự cũng sẽ áp dụng cho các LLM được thiết kế để phản ánh các nền văn hóa trong quá khứ.
Vậy nên, dù có những khó khăn nhất định, chỉ thời gian mới có thể trả lời liệu những mô hình như vậy cuối cùng có được sử dụng trong nghiên cứu tâm lý học hay chỉ dừng lại ở những dự án của những người đam mê mà thôi. Chúng ta hãy cùng chờ xem nhé!
Điều này dẫn đến một hệ quả là các LLM không thể "sáng tạo" ra những đột phá khoa học chưa từng xảy ra, bởi vì làm gì có tài liệu nào nói về những đột phá đó mà chúng học được, đúng không nào? Cùng lắm thì AI chỉ có thể lặp lại hoặc tổng hợp những dự đoán mà các nhà nghiên cứu đã viết ra mà thôi.
Adam Mastroianni, trong bản tin *Experimental History* của mình, đã diễn tả điều này rất hay. Anh ấy nói rằng, nếu chúng ta "khởi động" một AI siêu thông minh ở Hy Lạp cổ đại, cung cấp cho nó toàn bộ tri thức nhân loại thời đó và hỏi cách hạ cánh lên mặt trăng, thì nó sẽ trả lời: "Bạn không thể hạ cánh lên mặt trăng. Mặt trăng là một vị thần đang trôi nổi trên bầu trời." Nghe có vẻ buồn cười nhưng lại rất đúng với bản chất của AI hiện tại.
Vậy thì, một câu hỏi thú vị đặt ra là: nếu chúng ta cố tình giới hạn dữ liệu huấn luyện thì sao? Liệu có thể tạo ra một hệ thống AI phản hồi như thể nó đến từ một thời kỳ trong quá khứ không? Và điều đó có thể tiết lộ gì về tâm lý hay trải nghiệm hàng ngày của con người từ thời đại đó?
Đây chính xác là ý tưởng mà Hayk Grigorian, một sinh viên tại Đại học Muhlenberg ở Allentown, Pennsylvania, đã ấp ủ khi tạo ra TimeCapsuleLLM. Hệ thống AI thử nghiệm này được huấn luyện hoàn toàn bằng các văn bản từ London thế kỷ 19. Phiên bản hiện tại của nó dựa trên 90 gigabyte tệp văn bản được xuất bản tại thành phố London trong khoảng thời gian từ năm 1800 đến năm 1875.
Phải nói rõ là đây chỉ là một dự án cá nhân thôi nhé. Các văn bản mẫu mà AI này tạo ra trên GitHub không phải lúc nào cũng mạch lạc, nhưng trang *Ars Technica* đã đưa tin rằng nó có thể tìm ra chính xác các tên và sự kiện từ những năm 1800. Chẳng hạn, khi được yêu cầu tiếp tục câu "Đó là năm của Chúa 1834," mô hình đã kể lại một cuộc biểu tình: "các đường phố London tràn ngập biểu tình và kiến nghị," và còn nhắc đến các chính sách của Lord Palmerston, người lúc đó là Bộ trưởng Ngoại giao. Thật đáng kinh ngạc phải không?
Đây là một thử nghiệm rất thú vị, nhưng liệu nó có thực sự hữu ích không? Có thể lắm chứ!
Một bài viết ý kiến được đăng trên *Proceedings of the National Academy of Sciences of the United States of America (PNAS)* của các cộng tác viên, trong đó có Michael E. W. Varnum, giáo sư tâm lý học từ Khoa Tâm lý học tại Đại học bang Arizona, là một tài liệu rất đáng đọc. Bài viết này đề xuất rằng các mô hình như TimeCapsuleLLM có thể là một cách để nghiên cứu tâm lý học ngoài bối cảnh hiện đại. Bài báo gọi những mô hình AI này là Mô hình Ngôn ngữ Lớn Lịch sử, hay HLLM, và cho rằng các nhà nghiên cứu tâm lý học có thể sử dụng chúng để nghiên cứu tư duy của con người trong các nền văn minh quá khứ.
Về nguyên tắc, các phản hồi từ những "cá nhân giả lập" này có thể phản ánh tâm lý của các xã hội trong quá khứ, cho phép một ngành khoa học về bản chất con người mạnh mẽ và liên ngành hơn. Chẳng hạn, các nhà nghiên cứu có thể so sánh xu hướng hợp tác của người Viking, người La Mã cổ đại và người Nhật Bản thời kỳ đầu hiện đại trong các trò chơi kinh tế. Hoặc họ có thể khám phá thái độ về vai trò giới tính điển hình của người Ba Tư cổ đại hay người châu Âu thời Trung cổ.
Đây là một ý tưởng rất hay, mặc dù bài báo cũng thừa nhận rằng điều này có thể khá phức tạp.
Tất cả các LLM đều là sản phẩm của kho dữ liệu huấn luyện, và HLLM phải đối mặt với những thách thức về việc lấy mẫu, vì các văn bản lịch sử còn sót lại có thể không phải là mẫu đại diện cho tất cả những người sống trong một thời kỳ cụ thể. Bài báo thừa nhận rằng các văn bản lịch sử thường được viết bởi giới tinh hoa, chứ không phải người dân thường. Do đó, sẽ rất khó để khái quát hóa từ những mô hình này.
Và còn một điều nữa chúng ta cần lưu ý. Nghiên cứu từ Đại học Ghent ở Bỉ cho thấy rằng tư tưởng của những người phát triển LLM sẽ thể hiện trong văn bản mà các mô hình đó tạo ra. Có mọi lý do để nghi ngờ rằng vấn đề tương tự cũng sẽ áp dụng cho các LLM được thiết kế để phản ánh các nền văn hóa trong quá khứ.
Vậy nên, dù có những khó khăn nhất định, chỉ thời gian mới có thể trả lời liệu những mô hình như vậy cuối cùng có được sử dụng trong nghiên cứu tâm lý học hay chỉ dừng lại ở những dự án của những người đam mê mà thôi. Chúng ta hãy cùng chờ xem nhé!