'AI drift' là gì và tại sao nó lại khiến ChatGPT trở nên ngu ngốc?

Thoại Viết Hoàng · 09/08/2023

Bạn có thể muốn suy nghĩ lại về việc sử dụng GPT-4, đặc biệt là đối với các bài toán.

ChatGPT đang càng ngày càng kém cỏi?

Cho dù bạn đã tự mình trải nghiệm bằng ChatGPT hay đã đọc về nó, những tin đồn đều là sự thật, ChatGPT đang ngày càng trở nên ngu ngốc. Hiện tượng này đặc biệt khó hiểu vì các mô hình AI tổng quát sử dụng đầu vào của người dùng để tự đào tạo liên tục, điều này sẽ khiến chúng trở nên thông minh hơn khi tích lũy được nhiều mục nhập của người dùng hơn theo thời gian.

'AI drift' là gì và tại sao nó lại khiến ChatGPT trở nên ngu ngốc?

Câu trả lời có thể nằm trong một khái niệm gọi là "drift".
"Trôi" đề cập đến khi các mô hình ngôn ngữ lớn (LLM) hoạt động theo những cách không mong muốn hoặc không thể đoán trước, đi chệch khỏi các tham số ban đầu. Điều này có thể xảy ra do nỗ lực cải thiện các bộ phận của mô hình AI phức tạp khiến các bộ phận khác hoạt động kém hơn.
Các nhà nghiên cứu từ Đại học California tại Berkeley và Đại học Stanford đã tiến hành một nghiên cứu để đánh giá độ lệch và kiểm tra cách các mô hình ngôn ngữ lớn (LLM) phổ biến của ChatGPT, GPT 3.5 (LLM đằng sau ChatGPT) và GPT-4 (LLM đằng sau Bing Chat và ChatGPT Plus ) thay đổi theo thời gian.
Nghiên cứu đã so sánh khả năng của cả hai LLM trong việc giải toán, trả lời các câu hỏi nhạy cảm, trả lời khảo sát ý kiến, trả lời các câu hỏi chuyên sâu về kiến thức đa bước, thực hiện tạo mã, kiểm tra Giấy phép Y tế Hoa Kỳ và hoàn thành các nhiệm vụ lý luận trực quan vào tháng 3 và tháng 6.

Như kết quả nghiên cứu ở trên đã thấy, phiên bản tháng 3 của GPT-4 vượt trội so với phiên bản tháng 6 trong nhiều trường hợp, nổi bật nhất là các lời nhắc toán học cơ bản trong đó phiên bản tháng 3 của GPT-4 vượt trội hơn phiên bản tháng 6 trong cả hai ví dụ (a) và (b).
GPT-4 cũng kém hơn trong việc tạo mã, trả lời các câu hỏi kiểm tra y tế và trả lời các cuộc khảo sát ý kiến. Tất cả những trường hợp này có thể được quy cho hiện tượng trôi dạt.
Liên quan đến trôi dạt, một trong những nhà nghiên cứu, James Zou nói với tờ Wall Street Journal, "Chúng tôi đã nghi ngờ rằng nó có thể xảy ra ở đây, nhưng chúng tôi rất ngạc nhiên về tốc độ trôi dạt đang diễn ra".
Mặc dù trí thông minh đang giảm sút nhưng cũng có một số trường hợp cải thiện trong cả GPT-4 và GPT-3.5.
Do đó, các nhà nghiên cứu khuyến khích người dùng tiếp tục sử dụng LLM nhưng phải thận trọng khi sử dụng và liên tục đánh giá chúng.