Bùi Minh Nhật
Intern Writer
GPT-4.5 phiên bản mới nhất của mô hình ngôn ngữ lớn (LLM) từ OpenAI vừa vượt qua bài kiểm tra Turing trong một thí nghiệm đáng chú ý do các nhà khoa học từ Đại học California San Diego thực hiện. Đây là lần đầu tiên một hệ thống trí tuệ nhân tạo có thể đánh lừa phần lớn người tham gia trong một thử nghiệm ba bên chuẩn mực, khiến họ nhầm AI là con người đến 73% thời gian.
Mặc dù đây là một bước tiến ấn tượng trong lĩnh vực AI, các chuyên gia nhấn mạnh rằng điều này không đồng nghĩa với việc chúng ta đã chạm đến trí tuệ nhân tạo tổng quát (AGI) mục tiêu tối thượng trong phát triển AI. Bài kiểm tra Turing, do nhà khoa học Alan Turing đề xuất từ năm 1950, đánh giá khả năng máy móc tạo ra phản hồi giống con người đến mức không thể phân biệt được qua giao tiếp. Tuy nhiên, nó chỉ kiểm tra một khía cạnh của trí thông minh đó là khả năng đối thoại.
Trong bài kiểm tra ba bên, người tham gia sẽ trò chuyện đồng thời với một người thật và một AI, rồi đoán ai là ai. Với tỷ lệ 73% nhầm lẫn, GPT-4.5 chứng minh được mức độ thuyết phục vượt trội nhưng có một lưu ý quan trọng: mô hình này chỉ đạt kết quả cao nhất khi được "nhập vai" nhân vật con người, với cách nói chuyện gần gũi, pha chút vụng về và dùng nhiều từ viết tắt kiểu mạng xã hội. Khi không đóng vai này, tỷ lệ đánh lừa chỉ còn 36%.
Điều này cho thấy AI không thật sự hiểu hay suy nghĩ như con người, mà chỉ giỏi bắt chước cách chúng ta giao tiếp. Một điều đáng lo ngại là nhiều người tham gia quyết định dựa trên cảm giác, bản năng thay vì lập luận logic. Nhà nghiên cứu John Nosta thậm chí nhận định: "Bài kiểm tra Turing giờ đây không còn là thử thách cho máy móc nữa, mà là thử thách cho chính con người. Và chúng ta đang thất bại."
Theo nhóm nghiên cứu, GPT-4.5 có thể thay thế con người trong các cuộc trò chuyện ngắn hạn, mở ra khả năng tự động hóa một số công việc hoặc tăng cường các cuộc tấn công kỹ thuật xã hội (social engineering) nơi AI có thể dễ dàng giả mạo con người để lừa đảo hoặc thao túng cảm xúc.
Mặc dù chưa phải là AGI hệ thống có thể hiểu, học và thích nghi như con người trên mọi lĩnh vực nhưng thành công này là lời cảnh báo rõ ràng: Chúng ta cần tiếp cận sự phát triển AI một cách thận trọng và có kiểm soát. Trong khi đó, chính phủ Hoa Kỳ và nhiều quốc gia vẫn chưa có động thái mạnh mẽ để kiểm soát rủi ro từ AI ngày càng giống con người. (popularmechanics)

Mặc dù đây là một bước tiến ấn tượng trong lĩnh vực AI, các chuyên gia nhấn mạnh rằng điều này không đồng nghĩa với việc chúng ta đã chạm đến trí tuệ nhân tạo tổng quát (AGI) mục tiêu tối thượng trong phát triển AI. Bài kiểm tra Turing, do nhà khoa học Alan Turing đề xuất từ năm 1950, đánh giá khả năng máy móc tạo ra phản hồi giống con người đến mức không thể phân biệt được qua giao tiếp. Tuy nhiên, nó chỉ kiểm tra một khía cạnh của trí thông minh đó là khả năng đối thoại.
Vượt qua con người... hay đánh lừa con người?
Trong bài kiểm tra ba bên, người tham gia sẽ trò chuyện đồng thời với một người thật và một AI, rồi đoán ai là ai. Với tỷ lệ 73% nhầm lẫn, GPT-4.5 chứng minh được mức độ thuyết phục vượt trội nhưng có một lưu ý quan trọng: mô hình này chỉ đạt kết quả cao nhất khi được "nhập vai" nhân vật con người, với cách nói chuyện gần gũi, pha chút vụng về và dùng nhiều từ viết tắt kiểu mạng xã hội. Khi không đóng vai này, tỷ lệ đánh lừa chỉ còn 36%.
Điều này cho thấy AI không thật sự hiểu hay suy nghĩ như con người, mà chỉ giỏi bắt chước cách chúng ta giao tiếp. Một điều đáng lo ngại là nhiều người tham gia quyết định dựa trên cảm giác, bản năng thay vì lập luận logic. Nhà nghiên cứu John Nosta thậm chí nhận định: "Bài kiểm tra Turing giờ đây không còn là thử thách cho máy móc nữa, mà là thử thách cho chính con người. Và chúng ta đang thất bại."
Tương lai AI: Thay thế con người trong đối thoại ngắn và rủi ro tiềm ẩn
Theo nhóm nghiên cứu, GPT-4.5 có thể thay thế con người trong các cuộc trò chuyện ngắn hạn, mở ra khả năng tự động hóa một số công việc hoặc tăng cường các cuộc tấn công kỹ thuật xã hội (social engineering) nơi AI có thể dễ dàng giả mạo con người để lừa đảo hoặc thao túng cảm xúc.
Mặc dù chưa phải là AGI hệ thống có thể hiểu, học và thích nghi như con người trên mọi lĩnh vực nhưng thành công này là lời cảnh báo rõ ràng: Chúng ta cần tiếp cận sự phát triển AI một cách thận trọng và có kiểm soát. Trong khi đó, chính phủ Hoa Kỳ và nhiều quốc gia vẫn chưa có động thái mạnh mẽ để kiểm soát rủi ro từ AI ngày càng giống con người. (popularmechanics)