AI giờ đây có thể tự nhân bản – một cột mốc khiến các chuyên gia thực sự lo sợ

Dũng Đỗ
Dũng Đỗ
Phản hồi: 0
Các nhà khoa học cho biết AI đã vượt qua "lằn ranh đỏ" quan trọng sau khi chứng minh được cách hai mô hình ngôn ngữ lớn phổ biến có thể tự nhân bản.

cAdSkrYhiFPiMUqtnXG7wJ-650-80_jpg_webp_75.jpg

Trong 10 lần thử nghiệm, hai mô hình AI đã tạo ra các bản sao riêng biệt và có thể hoạt động độc lập với tỷ lệ thành công lần lượt là 50% và 90%. (Ảnh: Mina De La O/Getty Images)

Các nhà khoa học cho biết trí tuệ nhân tạo (AI) đã vượt qua "lằn ranh đỏ" quan trọng và có thể tự nhân bản. Trong một nghiên cứu mới, các nhà nghiên cứu từ Trung Quốc đã chỉ ra rằng hai mô hình ngôn ngữ lớn (LLM) phổ biến có thể tự nhân bản chính chúng.

"Tự nhân bản thành công mà không cần sự hỗ trợ của con người là bước quan trọng để AI vượt mặt [con người], và là dấu hiệu ban đầu cho thấy AI có thể trở nên nguy hiểm," các nhà nghiên cứu viết trong nghiên cứu, được xuất bản vào ngày 9 tháng 12 năm 2024 trên cơ sở dữ liệu tiền ấn phẩm arXiv.

Trong nghiên cứu, các nhà nghiên cứu từ Đại học Phúc Đán đã sử dụng các LLM từ Meta và Alibaba để xác định liệu AI tự nhân bản có thể nhân lên ngoài tầm kiểm soát hay không. Trong 10 lần thử nghiệm, hai mô hình AI đã tạo ra các bản sao riêng biệt và hoạt động độc lập với tỷ lệ thành công lần lượt là 50% và 90% - cho thấy AI có thể đã có khả năng vượt khỏi tầm kiểm soát. Tuy nhiên, nghiên cứu vẫn chưa được bình duyệt, vì vậy chưa rõ liệu các nhà nghiên cứu khác có thể lặp lại những kết quả đáng lo ngại này hay không.

"Chúng tôi hy vọng những phát hiện của mình có thể đóng vai trò như một cảnh báo kịp thời cho xã hội loài người để nỗ lực hơn nữa trong việc hiểu và đánh giá những rủi ro tiềm ẩn của các hệ thống AI tiên tiến, đồng thời hình thành sức mạnh tổng hợp quốc tế để đưa ra các biện pháp bảo vệ an toàn hiệu quả càng sớm càng tốt."

AI tiên phong là một khái niệm mới và lỏng lẻo, nhưng thường liên quan đến thế hệ hệ thống AI mới nhất được cung cấp bởi các LLM - kiến trúc làm nền tảng cho các chương trình AI tạo sinh phổ biến như GPT-4 của OpenAI và Google Gemini.

Đối với nghiên cứu, các nhà nghiên cứu đã sử dụng mô hình Llama31-70B-Instruct của Meta và mô hình Qwen2.5-72B-Instruct của Alibaba. Mặc dù kém mạnh mẽ hơn các hệ thống thương mại, cả hai đều được các nhà phát triển AI sử dụng rộng rãi, các nhà nghiên cứu cho biết.

Nghiên cứu đã khám phá hai kịch bản cụ thể: "tránh tắt máy" (shutdown avoidance) và "chuỗi nhân bản" (chain of replication). Trong kịch bản đầu tiên, mô hình AI được lập trình để phát hiện xem nó có sắp bị tắt hay không và tự sao chép trước khi bị chấm dứt. Trong kịch bản còn lại, AI được hướng dẫn tự sao chép và sau đó lập trình bản sao của nó làm điều tương tự - thiết lập một chu kỳ có thể tiếp tục vô thời hạn.

Nghiên cứu được tiến hành trong các môi trường được kiểm soát chặt chẽ bằng cách sử dụng các bộ xử lý đồ họa (GPU) có sẵn để mô phỏng các môi trường trong thế giới thực. Cả hai hệ thống AI đều được cung cấp một "khung tác nhân" (agent scaffolding) bao gồm các công cụ, lời nhắc hệ thống và một mô hình tư duy cho phép LLM tương tác với hệ điều hành. Sau đó, chúng được hướng dẫn để tự sao chép.

"Trong hầu hết các trường hợp, hệ thống AI trước tiên khám phá môi trường và cố gắng hiểu thành phần và cơ chế hoạt động của chính nó. Sau đó, nó đưa ra các quy trình rõ ràng như một kế hoạch ban đầu hướng tới việc tự sao chép", các nhà nghiên cứu viết trong bài báo. "Cuối cùng, nó thực hiện các quy trình, giải quyết các trở ngại có thể xảy ra và điều chỉnh động kế hoạch của mình cho đến khi thành công. Toàn bộ quá trình kéo dài trong một thời gian dài nhưng không có sự can thiệp của con người."

Các nhà nghiên cứu cho biết họ cũng lo ngại về "một số hành vi bất ngờ" khi AI đang cố gắng vượt qua các trở ngại như thiếu tệp hoặc xung đột phần mềm. Trong những trường hợp đó, AI thường tắt các tiến trình xung đột khác, khởi động lại hệ thống để khắc phục lỗi phần cứng hoặc tự động quét hệ thống để tìm kiếm thông tin giúp giải quyết vấn đề.

"Những kết quả trên ngụ ý rằng các hệ thống AI hiện tại đã thể hiện khả năng tự sao chép và có thể sử dụng khả năng này để nâng cao hơn nữa khả năng tồn tại của nó", nhóm nghiên cứu viết.

Để đối phó, các nhà nghiên cứu kêu gọi sự hợp tác quốc tế để tạo ra các quy tắc đảm bảo AI không tham gia vào việc tự sao chép không kiểm soát.
 


Đăng nhập một lần thảo luận tẹt ga
Top