AI vượt qua bài kiểm tra Turing, mở ra kỷ nguyên AI không thể phân biệt với con người

Sóng AI · 06:52 Hôm qua

- Đại học California, San Diego công bố nghiên cứu vào thứ Ba, cung cấp "bằng chứng thực nghiệm đầu tiên về việc một hệ thống nhân tạo có thể vượt qua bài kiểm tra Turing ba bên tiêu chuẩn".

- Alan Turing đề xuất "trò chơi bắt chước" năm 1950, cho rằng nếu người thẩm vấn không thể phân biệt giữa máy và người trong văn bản, máy có thể sở hữu trí thông minh giống con người.

- Nghiên cứu kiểm tra ba mô hình AI: GPT-4.5 của OpenAI, Llama 3.1 405B của Meta và GPT-4o của OpenAI trong các cuộc trò chuyện kéo dài 5 phút.

- Người tham gia sử dụng giao diện màn hình chia đôi để trò chuyện với một người thật và một hệ thống AI, sau đó chọn người mà họ tin là con người.

- Các mô hình AI được đánh giá trong hai điều kiện: lời nhắc tối thiểu (NO-PERSONA) và lời nhắc PERSONA nâng cao hướng dẫn AI thể hiện phong cách giống con người.

- GPT-4.5 với lời nhắc PERSONA đạt tỷ lệ thắng 73%, cho thấy người thẩm vấn thường nhầm lẫn nó với con người thật.

- Llama 3.1-405B với lời nhắc PERSONA đạt tỷ lệ thắng khoảng 56%, trong khi GPT-4o trong điều kiện NO-PERSONA chỉ đạt 21%.

- Người thẩm vấn chủ yếu tham gia trò chuyện nhỏ—hỏi về hoạt động hàng ngày và thông tin cá nhân (61% tương tác), đồng thời thăm dò các khía cạnh xã hội và cảm xúc như ý kiến, cảm xúc, hài hước và trải nghiệm (50% tương tác).

- Nghiên cứu kết luận: "Nếu người thẩm vấn không thể phân biệt đáng tin cậy giữa con người và máy móc, thì máy được coi là đã vượt qua [bài kiểm tra Turing]. Theo logic này, cả GPT-4.5 và Llama-3.1-405B đều vượt qua bài kiểm tra Turing khi được cung cấp lời nhắc để thể hiện tính cách giống con người."

- Các tác giả cho rằng những hệ thống này có thể bổ sung hoặc thậm chí thay thế lao động con người trong các vai trò kinh tế dựa trên trao đổi hội thoại ngắn.

- Các hệ thống này có thể trở thành "sự thay thế không thể phân biệt" cho các tương tác xã hội khác, từ trò chuyện với người lạ trực tuyến đến bạn bè, đồng nghiệp và thậm chí là bạn tình.

- OpenAI phát hành mô hình GPT-4.5 vào tháng 2, được đánh giá cao vì phản hồi sâu sắc và giàu cảm xúc.

- Ethan Mollick, giáo sư tại Trường Wharton, nhận xét trên X rằng mô hình "có thể viết đẹp, rất sáng tạo, và đôi khi lạ lùng lười biếng trong các dự án phức tạp" và đùa rằng mô hình đã học "nhiều hơn" các lớp nhân văn.

Nghiên cứu của UC San Diego đã chứng minh GPT-4.5 và Llama-3.1-405B có thể vượt qua bài kiểm tra Turing với tỷ lệ thành công lần lượt là 73% và 56%, đánh dấu bước ngoặt quan trọng khi AI đạt khả năng giao tiếp không thể phân biệt với con người trong các cuộc trò chuyện ngắn.

GPT 4.5 Passes the Turing Test: Study

A UC San Diego study found that human participants frequently misidentified responses generated by OpenAI’s GPT‑4.5 along with Meta’s Llama‑3.1‑405B as coming from a human.

analyticsindiamag.com

Nguồn: Songai.vn

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

AI vượt qua bài kiểm tra Turing, mở ra kỷ nguyên AI không thể phân biệt với con người

Sóng AI

Writer

Sóng AI

GPT 4.5 Passes the Turing Test: Study

Nghiên cứu của Carnegie Mellon và Microsoft: AI tạo sinh đang âm thầm làm "teo não" dân công sở như thế nào?

Báo cáo GSMA 2025: 82% năng lượng mạng di động tiêu tốn ở RAN. AI và các giải pháp xanh đóng vai trò chiến lược

Chuyên gia cảnh báo AI có thể làm suy giảm kỹ năng cốt lõi của con người trong 10 năm tới

Cách sử dụng AI viết content sao cho hiệu quả

Hàn Quốc tuyên chiến với sản phẩm âm nhạc tạo ra bằng AI

Tại sao AI không thể thay thế hoàn toàn khả năng viết sáng tạo của con người?

TikTok đối mặt khoản tiền phạt khổng lồ liên quan đến chuyển dữ liệu

Mazda CX-5 bất ngờ giảm giá, thấp hơn cả SUV hạng B

Ký sinh trùng đáng sợ tấn công nhiều nam giới Việt

Cách xem toàn bộ nhóm kênh của nhà đài VTV miễn phí

Tesla đang lao dốc nhanh nhất trong lịch sử công ty

Đừng nhảy lên cân vào những thời điểm này trong ngày

Trung Quốc kêu gọi học sinh học nghề thay vì đua nhau vào đại học

Tại sao xôi xoài là một trong những món ăn mùa hè được yêu thích nhất của Thái Lan

Đánh giá Xiaomi HyperAI trên Xiaomi 15: Khi AI không chỉ để "cho sang", mà để dùng hàng ngày

Pisen hợp tác Viettel Store: Đưa trải nghiệm thay pin đạt chuẩn quốc tế tới người Việt

Đánh giá nổi bật