Sóng AI
Writer

- Đại học California, San Diego công bố nghiên cứu vào thứ Ba, cung cấp "bằng chứng thực nghiệm đầu tiên về việc một hệ thống nhân tạo có thể vượt qua bài kiểm tra Turing ba bên tiêu chuẩn".
- Alan Turing đề xuất "trò chơi bắt chước" năm 1950, cho rằng nếu người thẩm vấn không thể phân biệt giữa máy và người trong văn bản, máy có thể sở hữu trí thông minh giống con người.
- Nghiên cứu kiểm tra ba mô hình AI: GPT-4.5 của OpenAI, Llama 3.1 405B của Meta và GPT-4o của OpenAI trong các cuộc trò chuyện kéo dài 5 phút.
- Người tham gia sử dụng giao diện màn hình chia đôi để trò chuyện với một người thật và một hệ thống AI, sau đó chọn người mà họ tin là con người.
- Các mô hình AI được đánh giá trong hai điều kiện: lời nhắc tối thiểu (NO-PERSONA) và lời nhắc PERSONA nâng cao hướng dẫn AI thể hiện phong cách giống con người.
- GPT-4.5 với lời nhắc PERSONA đạt tỷ lệ thắng 73%, cho thấy người thẩm vấn thường nhầm lẫn nó với con người thật.
- Llama 3.1-405B với lời nhắc PERSONA đạt tỷ lệ thắng khoảng 56%, trong khi GPT-4o trong điều kiện NO-PERSONA chỉ đạt 21%.
- Người thẩm vấn chủ yếu tham gia trò chuyện nhỏ—hỏi về hoạt động hàng ngày và thông tin cá nhân (61% tương tác), đồng thời thăm dò các khía cạnh xã hội và cảm xúc như ý kiến, cảm xúc, hài hước và trải nghiệm (50% tương tác).
- Nghiên cứu kết luận: "Nếu người thẩm vấn không thể phân biệt đáng tin cậy giữa con người và máy móc, thì máy được coi là đã vượt qua [bài kiểm tra Turing]. Theo logic này, cả GPT-4.5 và Llama-3.1-405B đều vượt qua bài kiểm tra Turing khi được cung cấp lời nhắc để thể hiện tính cách giống con người."
- Các tác giả cho rằng những hệ thống này có thể bổ sung hoặc thậm chí thay thế lao động con người trong các vai trò kinh tế dựa trên trao đổi hội thoại ngắn.
- Các hệ thống này có thể trở thành "sự thay thế không thể phân biệt" cho các tương tác xã hội khác, từ trò chuyện với người lạ trực tuyến đến bạn bè, đồng nghiệp và thậm chí là bạn tình.
- OpenAI phát hành mô hình GPT-4.5 vào tháng 2, được đánh giá cao vì phản hồi sâu sắc và giàu cảm xúc.
- Ethan Mollick, giáo sư tại Trường Wharton, nhận xét trên X rằng mô hình "có thể viết đẹp, rất sáng tạo, và đôi khi lạ lùng lười biếng trong các dự án phức tạp" và đùa rằng mô hình đã học "nhiều hơn" các lớp nhân văn.


GPT 4.5 Passes the Turing Test: Study
A UC San Diego study found that human participants frequently misidentified responses generated by OpenAI’s GPT‑4.5 along with Meta’s Llama‑3.1‑405B as coming from a human.

Nguồn: Songai.vn