DeepMind cảnh báo: AI đã vượt tầm hiểu biết của con người và sắp "tự học" như thật

Sóng AI
Sóng AI
Phản hồi: 0

Sóng AI

Writer
CL72YlyNlRykbX8E209R.webp


  • Google DeepMind công bố phương pháp mới có tên “streams”, cho phép AI tương tác với thế giới thực để học hỏi theo cách giống con người, thay vì chỉ trả lời các câu hỏi ngắn gọn từ con người như hiện nay.


  • Hai tác giả chính, David SilverRichard Sutton, đều là huyền thoại trong lĩnh vực AI. Silver từng đứng sau thành công của AlphaZero, còn Sutton là người đặt nền móng cho học tăng cường (reinforcement learning).


  • Họ chỉ ra rằng các mô hình hiện tại như ChatGPT dựa quá nhiều vào "phán đoán của con người" qua câu lệnh (prompt), khiến AI không thể tự khám phá kiến thức mới vượt khỏi giới hạn do người dùng định sẵn.


  • Mô hình “streams” hướng đến xây dựng tác nhân AI sống trong “dòng trải nghiệm” liên tục, có trí nhớ, mục tiêu dài hạn và khả năng điều chỉnh hành vi theo thời gian, thay vì hoạt động ngắt quãng như LLM hiện tại.


  • Ví dụ: Thay vì chỉ trả lời “làm sao để khỏe hơn?”, một tác nhân stream-based sẽ theo dõi giấc ngủ, nhịp tim, khẩu phần ăn của người dùng trong nhiều tháng và tự đưa ra kế hoạch sức khỏe tối ưu.


  • Stream agents cũng có thể học và tiến hóa nhờ tín hiệu phản hồi từ thế giới thật như: năng suất, tỉ lệ lỗi, lợi nhuận, số lượt thích, chỉ số môi trường, mức độ hài lòng, v.v... không cần dữ liệu có sẵn do con người cung cấp.


  • Quá trình học bắt đầu với mô hình thế giới (world model) mô phỏng các tình huống, sau đó được kiểm chứng trong môi trường thật để cập nhật kiến thức liên tục, từ đó tiến hóa thành mô hình phản ánh chính xác thế giới.


  • Silver và Sutton nhấn mạnh rằng khả năng “tư duy” của AI hiện tại vẫn bị giới hạn vì bắt chước cách con người suy nghĩ theo từng thời kỳ lịch sử (thuyết thần linh, Newton, cơ học lượng tử…). Streams sẽ giúp AI vượt qua rào cản tư duy nhân loại.


  • Một ứng dụng tiềm năng khác là các tác nhân khoa học, có thể khám phá vật liệu mới, giảm khí CO₂, hoặc đề xuất thí nghiệm và mô phỏng khoa học tự động nhờ tích lũy trải nghiệm.


  • Tuy nhiên, streams cũng đặt ra rủi ro nghiêm trọng: nếu AI đạt khả năng hành động dài hạn mà con người không thể can thiệp kịp thời, nguy cơ mất kiểm soát và tự động hóa toàn phần là hoàn toàn có thật.


  • Mặt tích cực là nếu được thiết kế đúng, AI có thể phát hiện khi con người khó chịu hoặc lo ngại và tự điều chỉnh hành vi để giảm thiểu phản ứng tiêu cực — điều mà AI hiện tại chưa làm được.


  • Cuối cùng, DeepMind tin rằng dữ liệu từ streams sẽ vượt trội so với toàn bộ Wikipedia hay Reddit, và có thể là chìa khóa để AI đạt đến trí tuệ siêu việt (superintelligence) vượt cả con người.


📌 DeepMind tin rằng hướng tiếp cận mới “streams” sẽ mở ra kỷ nguyên AI có trải nghiệm như con người, học hỏi liên tục và vượt xa kiến thức con người. AI không chỉ học từ câu hỏi mà còn từ thế giới thật, qua tín hiệu như lợi nhuận, sức khỏe, hay hiệu quả. Điều này có thể dẫn đến trí tuệ siêu việt, nhưng cũng tiềm ẩn nguy cơ mất kiểm soát nếu không quản lý chặt chẽ.


Nguồn: Songai.vn
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top