Cách AI có thể khiến sai lầm trở nên ngày càng méo mó

Các nhà nghiên cứu đã chứng minh rằng chất lượng công việc của lao động tri thức giảm đáng kể do yêu cầu công nghệ [COLOR=rgba(34,87,218,var(--tw-text-opacity))]GPT-4 [/COLOR]thực hiện các nhiệm vụ mà nó không đào tạo nhưng không phát hiện ra "ảo giác" trong câu trả lời của nó.
Cách AI có thể khiến sai lầm trở nên ngày càng méo mó
Một nghiên cứu mới [COLOR=rgba(34,87,218,var(--tw-text-opacity))]với hơn 750 nhà tư vấn chiến lược[/COLOR] cho thấy AI đã giúp họ tạo ra nội dung tốt hơn, nhanh hơn trong nhiều nhiệm vụ - nhưng các nhà tư vấn "ít có khả năng đưa ra giải pháp chính xác" khi cố gắng thực hiện các nhiệm vụ có độ khó tương tự nằm ngoài khả năng của mô hình AI.
Tại sao nó quan trọng: AI tại nơi làm việc vẫn là con dao hai lưỡi - có thể tăng thêm giá trị lớn nhưng cũng có thể phá hủy nó khi người lao động sử dụng nó mà không được huấn luyện.
Những công nhân có tay nghề cao đã phải vật lộn để tìm ra những gì AI có thể và không thể làm tốt, đồng thời việc phụ thuộc vào các kết quả đầu ra GPT-4 sáo rỗng đã làm giảm 41% sự đa dạng trong suy nghĩ của nhóm.
Các nhà nghiên cứu gọi bản chất không đồng đều của khả năng AI là “biên giới công nghệ lởm chởm”.
Chi tiết: Các nhà nghiên cứu từ Harvard, MIT, Wharton và các tổ chức khác đã hợp tác với tổ chức tư vấn của Boston Consulting Group để nghiên cứu 758 nhà tư vấn BCG được giao những nhiệm vụ phức tạp "được các chuyên gia trong ngành lựa chọn để tái tạo quy trình làm việc trong thế giới thực".
Một nửa số người tham gia được yêu cầu lên ý tưởng và phát triển ý tưởng sản phẩm mới - chẳng hạn như đồ uống mới và các loại giày dép - và những người còn lại được yêu cầu xác định nguyên nhân gốc rễ của những thách thức của một công ty khi sử dụng dữ liệu hiệu suất và phỏng vấn giám đốc điều hành.
Những người tham gia đã thực hiện một nhiệm vụ đánh giá để thiết lập đường cơ sở cho chất lượng công việc của họ và nhiệm vụ thử nghiệm sau đó bao gồm 18 nhiệm vụ phụ do hai người chấm điểm.
Tất cả những người tham gia đều bắt đầu công việc mà không có AI, trước khi được chia ngẫu nhiên thành ba loại giữa chừng: không có quyền truy cập AI, quyền truy cập AI GPT-4 hoặc quyền truy cập AI GPT-4 với tổng quan kỹ thuật nhanh chóng.
Điều gì đã xảy ra: Trong số các chuyên gia tư vấn được yêu cầu phát triển ý tưởng mới — một thách thức trong khả năng đã biết của GPT-4 — những người nhận được cả quyền truy cập và hướng dẫn AI "nhất quán" hoạt động tốt hơn so với những người chỉ được cấp quyền truy cập AI. Cả hai nhóm đều vượt trội hơn nhóm đối chứng.
Trung bình, những người có quyền truy cập AI cũng làm việc nhanh hơn và hoàn thành nhiều hơn trong số 18 nhiệm vụ.
Các chuyên gia tư vấn đạt điểm dưới mức trung bình trong nhiệm vụ đánh giá nhận được sự thúc đẩy lớn nhất từ việc sử dụng AI sau này trong thử nghiệm sáng tạo: Sản lượng của họ được cải thiện 43%, so với 17% của các chuyên gia tư vấn trên mức trung bình.
Nửa còn lại của nhóm đang giải quyết các vấn đề sâu sắc của một công ty, một chủ đề mà GPT-4 biết rất ít. Theo báo cáo, những người sử dụng AI trong câu trả lời của họ "có nhiều khả năng mắc sai lầm hơn" và khả năng đưa ra giải pháp chính xác ít hơn 19% so với những người không sử dụng AI.
Hậu quả: Nhà tuyển dụng phải đối mặt với tình thế tiến thoái lưỡng nan với những kết quả này.
AI có thể tăng hiệu suất của người lao động một cách nhanh chóng và ít tốn kém, nhưng đi đường tắt với đào tạo AI có thể gây ra nhiều sai lầm hơn, điều này có thể khiến nhà tuyển dụng phải đối mặt.
Ngay cả các chuyên gia AI đằng sau báo cáo này cũng bối rối trước những khả năng AI “mới lạ và bất ngờ” cũng như những khoảng trống về năng lực tại nơi làm việc.
Tóm lại: AI hứa hẹn [COLOR=rgba(34,87,218,var(--tw-text-opacity))]cải thiện đáng kể tốc độ tăng trưởng năng suất[/COLOR] - điều đang hấp dẫn cả CEO và chính trị gia vì mối tương quan của nó với tăng trưởng kinh tế mạnh mẽ.
Nhưng các cuộc cách mạng công nghiệp từ động cơ hơi nước đến máy tính cá nhân phải mất hàng thập kỷ mới chuyển thành tăng trưởng năng suất trên diện rộng.
Những dự đoán dài hạn về tác động kinh tế của AI tổng hợp phần lớn chỉ là phỏng đoán ở giai đoạn đầu của quá trình phát triển công nghệ.
"Ngay cả những người tham gia đã được cảnh báo về khả năng trả lời sai từ công cụ cũng không phản đối kết quả đầu ra của nó" khi GPT-4 bịa đặt, [COLOR=rgba(34,87,218,var(--tw-text-opacity))]các nhà phân tích BCG lưu ý khi đánh giá nghiên cứu[/COLOR] .
Nhưng khi những người tham gia sử dụng AI để lên ý tưởng, "khoảng 90% người tham gia đã cải thiện hiệu suất của họ" và "mọi người làm tốt nhất khi họ không cố gắng chỉnh sửa đầu ra của GPT-4".
Theo báo cáo, “Nghiên cứu này nhấn mạnh tầm quan trọng của việc xác thực và thẩm vấn AI” cũng như tầm quan trọng của việc áp dụng “đánh giá của chuyên gia” khi làm việc với AI.
Lưu ý, công việc được nghiên cứu đo lường không phải là khoa học tên lửa, hay thậm chí là mã hóa phần mềm, và việc đánh giá chất lượng chắc chắn mang tính chủ quan.
Một số nhà phê bình [COLOR=rgba(34,87,218,var(--tw-text-opacity))]cho[/COLOR] rằng việc tăng năng suất của nhà tư vấn kinh doanh bằng AI là một trò chơi vô nghĩa nhằm tối đa hóa sản lượng cho "nghề tạo ra những con bò tót".
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top