ChatGPT trả lời sai hơn một nửa câu hỏi về kỹ thuật phần mềm

Đoàn Thúy Hà · 10/08/2023

Khả năng của ChatGPT cung cấp câu trả lời cho bất kỳ câu hỏi nào về kỹ thuật phần mềm vào bất kỳ thời điểm nào là một nguồn tài liệu hữu ích. Tuy nhiên, lưu ý rằng một nghiên cứu mới cho thấy bạn có thể không nên sử dụng ChatGPT cho các đề xuất về kỹ thuật phần mềm.

ChatGPT trả lời sai hơn một nửa câu hỏi về kỹ thuật phần mềm

Trước khi các chatbot AI ra đời và bùng nổ từ cuối năm ngoái, Stack Overflow là nguồn tài liệu mà các lập trình viên thường tìm đến khi cần tư vấn cho dự án của họ, với một mô hình câu hỏi và trả lời tương tự như ChatGPT.
Tuy nhiên, với Stack Overflow, bạn phải đợi đến khi có người trả lời câu hỏi trong khi với ChatGPT thì không cần.
Kết quả là, nhiều kỹ sư phần mềm và lập trình viên đã sử dụng ChatGPT để đặt câu hỏi. Vì không có dữ liệu cho thấy ChatGPT hiệu quả như thế nào trong việc trả lời các loại đề xuất như vậy, một nghiên cứu mới tại Đại học Purdue đã điều tra vấn đề này.
Để tìm hiểu khả năng hiệu quả của ChatGPT trong việc trả lời các đề xuất về kỹ thuật phần mềm, các nhà nghiên cứu đã cung cấp 517 câu hỏi từ Stack Overflow cho ChatGPT và xem xét tính chính xác và chất lượng của những câu trả lời đó. Kết quả cho thấy trong số 512 câu hỏi, 259 (52%) câu trả lời của ChatGPT là sai và chỉ có 248 (48%) câu trả lời đúng. Hơn nữa, có tới 77% câu trả lời dài dòng.
Mặc dù độ chính xác của các câu trả lời thấp, kết quả cũng cho thấy 65% thời gian các câu trả lời đều bao quát và đề cập đến tất cả khía cạnh của câu hỏi.
Để phân tích thêm chất lượng của các câu trả lời từ ChatGPT, các nhà nghiên cứu đã hỏi ý kiến của 12 người tham gia có các mức độ chuyên môn lập trình khác nhau về các câu trả lời. Mặc dù các người tham gia ưa thích các câu trả lời từ Stack Overflow hơn so với ChatGPT trong nhiều danh mục khác nhau, như thể hiện bởi biểu đồ, họ đã không thể định rõ đúng sai trong các câu trả lời do ChatGPT tạo ra 39,34% thời gian. Theo nghiên cứu, các câu trả lời từ ChatGPT được diễn đạt rõ ràng đã khiến người dùng bỏ qua thông tin sai trong các câu trả lời.
"Người dùng bỏ qua thông tin sai trong các câu trả lời của ChatGPT (39,34% thời gian) do tính toàn diện, sự diễn đạt tốt và cái nhìn giống con người trong các câu trả lời của ChatGPT", các tác giả viết. Việc tạo ra các câu trả lời có vẻ hợp lý nhưng sai là một vấn đề quan trọng của tất cả các chatbot vì nó tạo điều kiện cho việc lan truyền thông tin sai lệch. Ngoài nguy cơ đó, điểm độ chính xác thấp cũng đủ để bạn nên suy nghĩ lại việc sử dụng ChatGPT cho những loại đề xuất như vậy.
>> 'AI drift' là gì và tại sao nó lại khiến ChatGPT trở nên ngu ngốc?

Tìm kiếm

Có thể bạn quan tâm

ChatGPT trả lời sai hơn một nửa câu hỏi về kỹ thuật phần mềm

Đoàn Thúy Hà

Editor

Đoàn Thúy Hà

Elon Musk: Grok 3 đang huấn luyện nhanh hơn 10 lần so với Grok 2

Công ty mẹ TikTok tự phát triển GPU AI để không bị lệ thuộc vào công nghệ Mỹ

Hồ sơ người dùng trên LinkedIn đã bị sử dụng trái phép để đào tạo AI

EA muốn dùng AI tạo sinh để sản xuất trò chơi điện tử, giảm bớt vai trò của con người

Học dốt thì làm nghề gì? Những công việc phù hợp với người có học lực kém

Microsoft vẫn chưa biết phải làm gì với đơn vị gaming dù đã bỏ ra 69 tỷ USD mua Activision Blizzard

Samsung lại tung video "cà khịa" Apple vụ thiết kế iPhone mãi không đổi

Bùng nổ tranh cãi bibimbap là món ăn của Trung Quốc hay Hàn Quốc

Chiến lược mới "One Samsung" khi bị Trung Quốc "vây đánh" từ điện thoại đến TV, gia dụng

Nhật Bản đẩy mạnh bán máy móc và vật liệu bán dẫn cho Trung Quốc, Hàn Quốc

Samsung bán công nghệ cho Trung Quốc, đoạn tuyệt với tấm nền LCD

Giữa lúc Intel suy sụp, CPU AMD Ryzen 9000 hứng chịu thất bại doanh số

Vì sao Intel từ hãng chip lớn nhất thế giới trở thành mục tiêu bị thâu tóm nhanh như vậy?

Smartphone có nguy cơ phát nổ như máy nhắn tin của Hezbollah không?

Đánh giá nổi bật