Các vấn đề về AI và quyền riêng tư: Những điều bạn cần biết

Thoại Viết Hoàng · 08/08/2022

Tìm hiểu về các mối mối lo về quyền riêng tư và AI mà bạn nên lưu ý khi trí tuệ nhân tạo (AI) ngày càng trở nên phổ biến trong cuộc sống của chúng ta.

Nhật Bản tuyên bố đã tìm ra cách dịch tiếng kêu của gà bằng cách sử dụng trí tuệ nhân tạo

Các vấn đề về AI và quyền riêng tư: Những điều bạn cần biết

Các vấn đề về quyền riêng tư do việc sử dụng rộng rãi trí tuệ nhân tạo gây ra là mối quan tâm lớn, mặc dù thực tế là các doanh nghiệp cũng như người tiêu dùng đều rất hào hứng với tiềm năng AI sẽ biến đổi cuộc sống hàng ngày. Rõ ràng, khi ngày càng có nhiều dữ liệu cá nhân được đưa vào các mô hình AI, nhiều người tiêu dùng có lý do chính đáng để lo ngại về quyền riêng tư của họ và cách dữ liệu của họ được sử dụng.
Hướng dẫn này dành cho những người tiêu dùng này để xây dựng nền tảng kiến thức sâu hơn về các tính năng bảo mật của AI. Ngoài ra, đây còn là hướng dẫn để các chủ doanh nghiệp và lãnh đạo hiểu rõ hơn mối quan tâm của khách hàng cũng như cách sử dụng AI theo cách bảo vệ quyền riêng tư mà không làm mất đi chức năng.Các vấn đề với AI và quyền riêng tư
Ít quan tâm đến luật bản quyền và IP
Các mô hình AI lấy dữ liệu đào tạo từ mọi ngóc ngách của trang web. Thật không may, nhiều nhà cung cấp AI không nhận ra hoặc không quan tâm khi họ sử dụng tác phẩm nghệ thuật, nội dung hoặc tài sản trí tuệ khác có bản quyền của người khác mà không có sự đồng ý của họ.
Vấn đề này trở nên tồi tệ hơn nhiều khi các mô hình được đào tạo, đào tạo lại và tinh chỉnh với dữ liệu này; nhiều mô hình AI ngày nay phức tạp đến mức ngay cả người xây dựng chúng cũng không thể tự tin nói dữ liệu nào đang được sử dụng và ai có quyền truy cập vào dữ liệu đó.
Kết hợp trái phép dữ liệu người dùng
Khi người dùng mô hình AI nhập dữ liệu của riêng họ dưới dạng truy vấn, có khả năng dữ liệu này sẽ trở thành một phần của tập dữ liệu đào tạo trong tương lai của mô hình. Khi điều này xảy ra, dữ liệu này có thể hiển thị dưới dạng đầu ra cho các truy vấn của người dùng khác. Đây là một vấn đề đặc biệt lớn nếu người dùng nhập dữ liệu nhạy cảm vào hệ thống.
Trong một ví dụ nổi tiếng hiện nay, ba nhân viên khác nhau của Samsung đã rò rỉ thông tin nhạy cảm của công ty cho ChatGPT. Thông tin này hiện có thể là một phần trong dữ liệu đào tạo của ChatGPT. Nhiều nhà cung cấp, bao gồm cả OpenAI, đang tìm cách tích hợp thông tin đầu vào của người dùng vào quá trình đào tạo trong tương lai, nhưng vẫn không có gì đảm bảo rằng dữ liệu nhạy cảm sẽ được giữ an toàn và nằm ngoài các bộ đào tạo trong tương lai.
Cơ quan quản lý và biện pháp bảo vệ hạn chế
Một số quốc gia và cơ quan quản lý đang nghiên cứu các quy định về AI và chính sách sử dụng an toàn, nhưng hiện chưa có tiêu chuẩn tổng thể nào để buộc các nhà cung cấp AI phải chịu trách nhiệm về cách họ xây dựng và sử dụng các công cụ trí tuệ nhân tạo.
Một số nhà cung cấp AI đã bị chỉ trích vì vi phạm IP cũng như quy trình đào tạo và thu thập dữ liệu không rõ ràng. Nhưng trong hầu hết các trường hợp hiện nay, các nhà cung cấp AI có quyền quyết định việc lưu trữ dữ liệu, an ninh mạng và quy tắc người dùng của riêng họ mà không bị can thiệp.
Sử dụng trái phép dữ liệu sinh trắc học
Ngày càng có nhiều thiết bị cá nhân sử dụng nhận dạng khuôn mặt, dấu vân tay, nhận dạng giọng nói và bảo mật dữ liệu sinh trắc học khác thay cho các hình thức xác minh danh tính truyền thống hơn. Các thiết bị giám sát công cộng cũng thường xuyên sử dụng AI để quét dữ liệu sinh trắc học để có thể nhận dạng các cá nhân nhanh hơn.
Mặc dù các công cụ bảo mật sinh trắc học mới này cực kỳ tiện lợi nhưng vẫn có một số quy định hạn chế về cách các công ty AI có thể sử dụng dữ liệu này sau khi được thu thập. Trong nhiều trường hợp, các cá nhân thậm chí còn không biết rằng dữ liệu sinh trắc học của họ đã được thu thập, thậm chí dữ liệu đó đang được lưu trữ và sử dụng cho các mục đích khác.
Thực hành thu thập siêu dữ liệu bí mật
Khi người dùng tương tác với quảng cáo, TikTok hoặc video trên mạng xã hội khác hoặc gần như bất kỳ thuộc tính web nào, siêu dữ liệu từ tương tác đó cũng như lịch sử tìm kiếm và sở thích của người đó có thể được lưu trữ để nhắm mục tiêu nội dung chính xác hơn trong tương lai.
Phương pháp thu thập siêu dữ liệu này đã diễn ra trong nhiều năm, nhưng với sự trợ giúp của AI, nhiều dữ liệu đó có thể được thu thập và diễn giải trên quy mô lớn, giúp các công ty công nghệ có thể nhắm mục tiêu sâu hơn thông điệp của họ đến người dùng mà họ không biết về cách thực hiện. làm. Mặc dù hầu hết các trang web của người dùng đều có chính sách đề cập đến các phương pháp thu thập dữ liệu này, nhưng nó chỉ được đề cập ngắn gọn và nằm giữa văn bản chính sách khác, vì vậy hầu hết người dùng không nhận ra những gì họ đã đồng ý và buộc bản thân cũng như mọi thứ trên thiết bị di động của họ phải xem xét kỹ lưỡng.
Các tính năng bảo mật tích hợp hạn chế cho các mô hình AI
Mặc dù một số nhà cung cấp AI có thể chọn xây dựng các tính năng và biện pháp bảo vệ an ninh mạng cơ bản, nhưng nhiều mô hình AI không có sẵn các biện pháp bảo vệ an ninh mạng gốc. Điều này giúp người dùng trái phép và những kẻ có ý đồ xấu dễ dàng truy cập và sử dụng dữ liệu của người dùng khác, bao gồm cả thông tin nhận dạng cá nhân (PII).
Thời gian lưu trữ dữ liệu kéo dài
Rất ít nhà cung cấp AI minh bạch về thời gian, địa điểm và lý do họ lưu trữ dữ liệu người dùng và các nhà cung cấp minh bạch thường lưu trữ dữ liệu trong thời gian dài.
Ví dụ: chính sách của OpenAI cho biết họ có thể lưu trữ dữ liệu đầu vào và đầu ra của người dùng trong tối đa 30 ngày “để xác định hành vi lạm dụng”. Tuy nhiên, vẫn chưa rõ khi nào và bằng cách nào công ty có quyền xem xét kỹ hơn dữ liệu của người dùng cá nhân mà họ không hề biết.
Quyền riêng tư và việc thu thập dữ liệu AI
Quét web và thu thập dữ liệu web
Vì không yêu cầu quyền đặc biệt và cho phép nhà cung cấp thu thập lượng lớn dữ liệu đa dạng nên các công cụ AI thường dựa vào việc thu thập dữ liệu web và thu thập dữ liệu web để xây dựng tập dữ liệu đào tạo.
Nội dung được lấy từ các nguồn có sẵn công khai trên internet, bao gồm các trang web của bên thứ ba, wiki, thư viện kỹ thuật số, v.v. Trong những năm gần đây, siêu dữ liệu của người dùng cũng đã trở thành một phần lớn những gì được thu thập thông qua việc tìm kiếm và thu thập thông tin trên web. Siêu dữ liệu này thường được lấy từ các tập dữ liệu tiếp thị và quảng cáo cũng như các trang web có dữ liệu liên quan đến đối tượng được nhắm mục tiêu và những gì họ tương tác nhiều nhất.
Truy vấn của người dùng trong mô hình AI
Khi người dùng nhập câu hỏi hoặc dữ liệu khác của họ vào mô hình AI, hầu hết các mô hình AI sẽ lưu trữ dữ liệu đó trong ít nhất vài ngày. Mặc dù dữ liệu đó có thể không bao giờ được sử dụng cho bất kỳ mục đích nào khác, nhưng người ta đã chứng minh rằng nhiều công cụ trí tuệ nhân tạo không chỉ thu thập dữ liệu đó mà còn lưu giữ dữ liệu đó cho các mục đích đào tạo trong tương lai.
Công nghệ sinh trắc học
Tất cả các thiết bị giám sát, bao gồm camera an ninh, máy quét khuôn mặt và dấu vân tay cũng như micrô phát hiện giọng nói của con người đều có thể được sử dụng để thu thập dữ liệu sinh trắc học và nhận dạng con người mà họ không hề biết hoặc không đồng ý.
Theo từng tiểu bang, các quy định ngày càng khắt khe hơn về mức độ minh bạch mà các công ty cần phải minh bạch khi sử dụng loại công nghệ này. Tuy nhiên, phần lớn, họ có thể thu thập dữ liệu này, lưu trữ và sử dụng nó mà không cần xin phép khách hàng.
Cảm biến và thiết bị IoT
Cảm biến Internet of Things (IoT) và hệ thống điện toán ranh giới thu thập lượng lớn dữ liệu theo từng khoảnh khắc và xử lý dữ liệu đó ở gần để hoàn thành các tác vụ tính toán lớn hơn và nhanh hơn. Phần mềm AI thường tận dụng cơ sở dữ liệu của hệ thống IoT và thu thập dữ liệu liên quan thông qua các phương pháp như học dữ liệu, nhập dữ liệu, giao thức và cổng IoT an toàn cũng như API.
API
API cung cấp cho người dùng giao diện với các loại phần mềm kinh doanh khác nhau để họ có thể dễ dàng thu thập và sau đó tích hợp các loại dữ liệu khác nhau để phân tích và đào tạo AI. Với API và thiết lập phù hợp, người dùng có thể thu thập dữ liệu từ CRM, cơ sở dữ liệu và kho dữ liệu cũng như cả hệ thống tại chỗ và dựa trên đám mây.
Hồ sơ công khai
Cho dù hồ sơ có được số hóa hay không thì hồ sơ công khai vẫn thường được thu thập và đưa vào bộ đào tạo AI. Thông tin về các công ty đại chúng, các sự kiện hiện tại và lịch sử, hồ sơ tội phạm và nhập cư cũng như các thông tin công khai khác có thể được thu thập mà không cần có sự cho phép trước.
Khảo sát người dùng và bảng câu hỏi
Mặc dù phương pháp thu thập dữ liệu này đã lỗi thời hơn nhưng sử dụng khảo sát và bảng câu hỏi vẫn là cách đã được thử nghiệm và thực tế mà các nhà cung cấp AI thu thập dữ liệu từ người dùng của họ.
Người dùng có thể trả lời các câu hỏi về nội dung họ quan tâm nhất, họ cần trợ giúp về vấn đề gì, trải nghiệm gần đây nhất của họ với sản phẩm hoặc dịch vụ như thế nào hoặc bất kỳ câu hỏi nào khác giúp AI có ý tưởng tốt hơn về cách cá nhân hóa các tương tác với sản phẩm hoặc dịch vụ đó. người ở tương lai.
Giải pháp cho các vấn đề về AI và quyền riêng tư
Với một số phương pháp hay nhất, công cụ và tài nguyên bổ sung, doanh nghiệp của bạn có thể sử dụng các giải pháp trí tuệ nhân tạo một cách hiệu quả mà không ảnh hưởng đến quyền riêng tư của người dùng. Để bảo vệ dữ liệu nhạy cảm nhất của bạn ở mọi giai đoạn sử dụng AI, hãy làm theo các mẹo sau:
Thiết lập chính sách sử dụng phù hợp cho AI: Người dùng nội bộ nên biết họ có thể sử dụng dữ liệu nào cũng như cách thức và thời điểm họ nên sử dụng dữ liệu đó khi tương tác với các công cụ AI. Điều này đặc biệt quan trọng đối với các tổ chức làm việc với dữ liệu nhạy cảm của khách hàng, như thông tin bảo vệ sức khỏe (PHI) và thông tin thanh toán.
Đầu tư vào các công cụ bảo mật và quản trị dữ liệu: Một số giải pháp tốt nhất để bảo vệ các công cụ AI và phần còn lại của bề mặt tấn công của bạn bao gồm phát hiện và phản hồi mở rộng (XDR), ngăn ngừa mất dữ liệu cũng như phần mềm giám sát và thông tin về mối đe dọa. Một số công cụ dành riêng cho quản trị dữ liệu cũng tồn tại để giúp bạn bảo vệ dữ liệu và đảm bảo mọi hoạt động sử dụng dữ liệu vẫn tuân thủ các quy định liên quan.
Đọc bản in đẹp: Các nhà cung cấp AI thường cung cấp một số loại tài liệu đề cập đến cách sản phẩm của họ hoạt động và những kiến thức cơ bản về cách họ được đào tạo. Đọc tài liệu này một cách cẩn thận để xác định bất kỳ dấu hiệu nguy hiểm nào và nếu có điều gì đó bạn không chắc chắn hoặc không rõ ràng trong tài liệu chính sách của họ, hãy liên hệ với người đại diện để làm rõ.
Chỉ sử dụng dữ liệu không nhạy cảm: Theo nguyên tắc chung, không nhập dữ liệu nhạy cảm nhất của doanh nghiệp hoặc khách hàng của bạn vào bất kỳ công cụ AI nào, ngay cả khi đó là giải pháp được xây dựng tùy chỉnh hoặc tinh chỉnh mang lại cảm giác riêng tư. Nếu có một trường hợp sử dụng cụ thể mà bạn muốn theo đuổi có liên quan đến dữ liệu nhạy cảm, hãy nghiên cứu xem có cách nào để hoàn thành thao tác một cách an toàn với bản sao kỹ thuật số, ẩn danh dữ liệu hoặc dữ liệu tổng hợp hay không.
Để biết thêm các mẹo liên quan đến an ninh mạng, quản lý rủi ro và sử dụng AI có đạo đức khi nói đến AI tổng hợp nói riêng, hãy xem các hướng dẫn thực hành tốt nhất trước đây:
Tóm lại: Các vấn đề về AI và quyền riêng tư
Các công cụ AI mang đến cho doanh nghiệp và người tiêu dùng hàng ngày tất cả các loại tiện ích mới, từ tự động hóa tác vụ đến hỏi đáp có hướng dẫn cho đến thiết kế và lập trình sản phẩm. Tuy nhiên, mặc dù những công cụ này có thể đơn giản hóa cuộc sống của chúng ta nhưng chúng cũng có nguy cơ vi phạm quyền riêng tư cá nhân theo những cách có thể gây tổn hại đến danh tiếng của nhà cung cấp và niềm tin của người tiêu dùng, an ninh mạng và việc tuân thủ quy định.
Cần phải nỗ lực nhiều hơn để sử dụng AI một cách có trách nhiệm nhằm bảo vệ quyền riêng tư của người dùng, nhưng điều đó rất đáng giá khi bạn xem xét mức độ vi phạm quyền riêng tư có thể ảnh hưởng đến hình ảnh công khai của công ty. Đặc biệt khi công nghệ này trưởng thành và trở nên phổ biến hơn trong cuộc sống hàng ngày của chúng ta, việc tuân thủ luật AI khi chúng được thông qua và phát triển các phương pháp hay nhất về sử dụng AI cụ thể hơn phù hợp với văn hóa tổ chức của bạn và kỳ vọng về quyền riêng tư của khách hàng sẽ trở nên quan trọng.

Tham khảo bài viết gốc tại đây:

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Các vấn đề về AI và quyền riêng tư: Những điều bạn cần biết

Thoại Viết Hoàng

Writer

Thoại Viết Hoàng

Nghiên cứu mới nhất của Microsoft về top 40 công việc dễ bị AI thay thế nhất, lĩnh vực nào cũng gặp nạn trừ những người này

"Kỳ lân AI" hết thời chỉ trong vòng 6 tháng nhưng quyết không thừa nhận thất bại

7 công cụ tìm kiếm không can thiệp kết quả bằng AI

Kính AI siêu mỏng: Đối thủ nặng ký khiến Meta Ray-Bans thất thế với pin gấp 3 lần!

Kính AI siêu mỏng mới: Đối thủ mạnh mẽ khiến Meta Ray-Bans trở nên lỗi thời!

Khám phá 4 tính năng mới hấp dẫn trong chế độ AI của Google và cách trải nghiệm chúng!

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Không phải Samsung Electronics, "đế vương chíp" thực sự là người đồng hương nắm trong tay "phép màu công nghệ"

Apple kiện rạp chiếu phim vì trong tên có từ "Apple"

Ngành thép toàn cầu dư cung, chi phí tăng cao: Tại sao các quốc gia vẫn không dám ngừng sản xuất?

Trung Quốc tố hệ thống Microsoft Exchange bị khai thác gián điệp

Trump tuyên bố sử dụng vũ khí hạt nhân này sau tuyên bố từ tổng thống Medvedev

Cơn khát điện AI đang ngốn lượng tài nguyên khổng lồ của Trái Đất

Kính AI siêu mỏng mới: Đối thủ mạnh mẽ khiến Meta Ray-Bans trở nên lỗi thời!

Giờ này còn nhắc đến smartphone Xperia làm gì nữa, Sony sắp bán xe điện đến nơi rồi bạn ơi!

Bệnh phổi kẽ (Interstitial lung disease) một căn bệnh nguy hiểm còn ít được quan tâm

Đánh giá nổi bật