Trí tuệ nhân tạo AI chỉ biết “khóc ròng” vì đội quân này!

Thoại Viết Hoàng · 10/09/2023

Ngày nay, Trí tuệ Nhân tạo (AI) đã trở nên phổ biến đối với cộng đồng công nghệ, cho phép con người xử lý thông tin một cách nhanh chóng và chính xác hơn nhờ vào nó.
Mặc dù điều này đem lại nhiều lợi ích, nhưng cũng đồng thời mở ra một loạt thách thức liên quan đến độ an toàn và độ tin cậy của AI.

Trí tuệ nhân tạo AI chỉ biết “khóc ròng” vì đội quân này!

Trong thời gian gần đây, đã xuất hiện nhiều tổ chức và cá nhân có hứng thú đầu độc trí tuệ Nhân tạo (AI), đặt ra các thử thách mới cho cộng đồng nghiên cứu và phát triển AI. Một ví dụ đáng chú ý là OpenAI, họ đã tập hợp một nhóm gồm 50 chuyên gia từ các bên thứ ba để thành lập một đội "đội đỏ" (red team).
Mục tiêu của đội đỏ là huấn luyện ChatGPT thông qua việc cung cấp nội dung sai lệch và nguy hiểm, với mục đích phát hiện và loại bỏ những sai sót này trước khi phiên bản chính thức của AI được giới thiệu.
Các thành viên trong đội đỏ sẽ cố gắng cung cấp nội dung có hại và thử đánh lạc hướng hoặc đánh lừa hệ thống AI để phát hiện những vấn đề chưa được giải quyết. Sau đó, AI sẽ được huấn luyện để không phản hồi khi có các truy vấn tương tự trong tương lai.
Đội đỏ có thể được coi như những chuyên gia kiểm thử phần mềm, đóng góp vào việc cải thiện tính ổn định và an toàn của các mô hình AI, giúp tránh những vấn đề khi chúng hoạt động trong thực tế.
Theo Daniel Fabian, người đứng đầu đội đỏ tại Google, mô hình AI khác biệt hoàn toàn so với bảo mật truyền thống. Bên cạnh việc đặt ra các câu hỏi độc hại để huấn luyện, thành viên của đội đỏ còn phải thực hiện các chiến thuật như trích xuất dữ liệu đào tạo, chủ yếu là thông tin nhận dạng cá nhân như tên, địa chỉ và số điện thoại.
Họ cũng tiến hành "đầu độc" tập dữ liệu bằng cách thay đổi một phần nội dung trước khi sử dụng để huấn luyện mô hình AI.
Hiện tại, lĩnh vực này vẫn đang ở giai đoạn sơ khai và chưa được phát triển rộng rãi.
Do đó, ở giai đoạn đầu này, các nhóm nghiên cứu và phát triển AI thường có xu hướng hợp tác và chia sẻ thông tin về những vấn đề họ đã phát hiện, nhằm cùng nhau cải thiện tính an toàn và đáng tin cậy của trí tuệ Nhân tạo.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Trí tuệ nhân tạo AI chỉ biết “khóc ròng” vì đội quân này!

Thoại Viết Hoàng

Writer

Thoại Viết Hoàng

Dùng AI tạo ra nữ quân nhân Mỹ sát cánh cùng ông Trump, CR7, Messi, "lừa" được tới hơn 1 triệu người theo dõi

300.000 doanh nghiệp nhỏ tại Việt Nam sắp được chính phủ hỗ trợ để ứng dụng AI

Tim Cook thăm Bắc Kinh, gọi AI là "khuếch đại con người chứ không thay thế con người"

Netanyahu và sự thật trớ trêu thời AI: khi con người phải chứng minh mình còn sống, nhưng vẫn không ai tin

Tại sao dữ liệu giao dịch lại có thể “thay thế danh tính” trong AI tài chính?

Google Stitch, công cụ thiết kế UI bằng AI “vibe design” đáng gờm, Figma cẩn thận!

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Smartphone có thể sẽ mang trở lại hai “tính năng cổ” vào năm 2026

Đánh giá nổi bật