VNR Content
Pearl
Vì quá hào hứng với món đồ chơi mới mua, trong quá trình thiết lập ban đầu cho chiếc điện thoại di động, máy tính, hay một phần mềm mới nào đó, bạn nhiều khả năng đã nhấn nút “Yes” khi được hỏi có muốn chia sẻ dữ liệu phân tích và dữ liệu liên quan quá trình sử dụng với nhà sản xuất để giúp họ cải thiện sản phẩm sau này.
Các nhà phát triển phần mềm có thể định mức dữ liệu mà các chương trình của họ thu thập trong quá trình hoạt động, dưới danh nghĩa cải thiện sản phẩm. Việc thu thập dữ liệu này diễn ra song hành với hoạt động khai thác dữ liệu riêng tư của các dịch vụ internet như Google và Facebook, vốn tìm cách thu lợi nhuận từ việc nhắm quảng cáo vào bạn. Lấy lý do cải thiện sản phẩm, một số công ty tỏ ra khá mạnh bạo, trong khi số khác chỉ “xin” một ít dữ liệu rất cơ bản từ người dùng. “Rất nhiều các công ty sử dụng dữ liệu và có lý do chính đáng để sử dụng dữ liệu” - theo Mihir Kshirsagar, chuyên gia chính sách công nghệ tại Trung tâm Chính sách Công nghệ Thông tin thuộc Đại học Princeton. “Ví dụ, một trong số nhiều lý do là dữ liệu sẽ giúp cải thiện sản phẩm, bởi những lần xảy ra lỗi sẽ là manh mối cho biết làm sao để cải thiện nó”. Vấn đề là, rất khó để biết liệu sự thật có phải là họ sử dụng dữ liệu cho những mục đích mà họ đề nghị được thu thập - ông nói tiếp. “Làm sao mà bạn, một người tiêu dùng, biết được liệu dữ liệu có đang được sử dụng để cải thiện sản phẩm, hay đang bị lợi dụng để bán cho bạn thứ gì đó, hay để xác định một số vấn đề khác có khả năng giúp ích cho công ty?”
Mặc định, Microsoft theo dõi thứ họ gọi là dữ liệu “cần thiết” về cách bạn sử dụng hệ điều hành Windows cũng như các chương trình Office bao gồm Word, Excel và Outlook. Đối với Office, những dữ liệu được gửi về Microsoft bao gồm chi tiết về pin, camera, vi xử lý, tốc độ mạng, ổ cứng, các thiết bị...trên laptop, các dữ liệu crash và lỗi, cùng rất nhiều thứ khác. Skype - do Microsoft sở hữu - cũng thu thập những dữ liệu này. “Bạn kỳ vọng Office sẽ bảo mật và hoạt động đáng tin cậy. Để đáp ứng kỳ vọng đó, chúng tôi thu thập dữ liệu chẩn đoán khi bạn dùng Office và OneDrive để giúp tìm và khắc phục lỗi” - công ty giải thích trên website như vậy. “Dữ liệu này không bao gồm tên và địa chỉ email của bạn, nội dung tập tin của bạn, hoặc thông tin về các ứng dụng không liên quan đến Office hay OneDrive” Những dữ liệu người dùng đó giúp các nhà phát triển Microsoft phát hiện nhiều vấn đề như driver video bị lỗi và cho các nhà phát triển phần mềm biết những tính năng người ta dùng nhiều nhất. Theo dõi còn cho phép các chương trình phần mềm cập nhật tự động. Office không cho phép người dùng tắt việc truyền tải dữ liệu cần thiết này. Microsoft cũng mời người dùng Office chia sẻ thêm nhiều “dữ liệu chẩn đoán tùy chọn” khác, để mang lại cho công ty cái nhìn sâu hơn về những thứ như hình ảnh mà khách hàng chèn vào tài liệu Word hoặc tốc độ xuất hiện của các slide PowerPoint trên màn hình. Hệ điều hành Windows của Microsoft cũng mặc định chia sẻ thông tin người dùng, nhưng khách hàng mày mò phần thiết lập có thể tắt Chương trình Cải thiện Trải nghiệm Khách hàng là xong. “Bản thân hệ điều hành mặc định đã gửi một lượng lớn dữ liệu về Microsoft. Và bạn phải mày mò để biết cách tắt nó đi” - theo Kahn Gillmor. “Lượng thông tin được thu thập từ hệ thống ngày càng khiến tối lo ngại khi nhìn từ góc nhìn của người bị theo dõi” Nếu thích xem chính xác thứ các thiết bị của bạn đang gửi về Microsoft, bạn có thể tải về công cụ Diagnostic Data Viewer của công ty. Việc thu thập thông tin từ thiết bị của bạn cũng mang lại cho Microsoft thông tin quý giá để nhắm quảng cáo. Nếu bạn bật “tailored experiences” của Microsoft để cho phép hiển thị các gợi ý và khuyến nghị cá nhân hóa, họ cũng sẽ sử dụng thông tin này cho quảng cáo. “Nếu bạn chọn tắt Tailored experiences, chúng tôi sẽ sử dụng dữ liệu chẩn đoán Windows để cung cấp cho bạn gợi ý, quảng cáo, và khuyến nghị cá nhân hóa nhằm tăng cường trải nghiệm Microsoft” - công ty viết trên website như vậy. Thế nhưng điều đó cũng không làm lằn ranh phân cách giữ việc thu thập thông tin người dùng chỉ nhằm cải thiện sản phẩm với việc kiếm thêm một chút lợi nhuận trở nên rõ ràng hơn. “Điều này vừa không khiến người ta ngạc nhiên, vừa đi ngược lại mọi kỳ vọng” - theo nhà nghiên cứu về quyền riêng tư của Consumer Reports, Bill Fitzgerald. “Dữ liệu thu thập để phân tích thường được miêu tả theo cách khiến chúng ta thấy nó tách biệt hoặc khác với dữ liệu thu thập cho quảng cáo hay theo dõi” - ông nói. “Nhưng nó chưa bao giờ qua mắt được các bài test. Dữ liệu phân tích là loại nhạy cảm - có thể được sử dụng riêng biệt để theo dõi người dùng, và khi kết hợp với những bộ dữ liệu đã có sẵn, nó càng làm hoạt động theo dõi của các công ty trở nên chính xác hơn” Google
Khi thiết lập điện thoại Android, chương trình sẽ cho bạn lựa chọn chia sẻ dữ liệu người dùng. Thông tin này bao gồm tần suất sử dụng ứng dụng, dữ liệu kết nối mạng, và chi tiết về WiFi và các kết nối khác. Một số dữ liệu còn được chia sẻ với các nhà phát triển Android. Bạn có thể tắt chia sẻ dữ liệu trong phần Settings > Google > More > Usage & Diagnostics. Tuy nhiên, một tài liệu vào năm 2021 đã phát hiện ra rằng cả Android và Apple iOS vẫn gửi một lượng dữ liệu đáng ngạc nhiên kể cả khi người dùng không chọn chia sẻ, trong đó Google gửi đi lượng dữ liệu gấp 20 lần Apple. Trung bình, các điện thoại Apple và Android gửi dữ liệu mỗi 4,5 phút một lần khi không sử dụng. “Dữ liệu của chúng tôi cho thấy hoạt động thu thập dữ liệu cơ bản thực ra rất rộng, và trái ngược với những gì người dùng cho là hợp lý” - theo tác giả Douglas Leith, Tiến sỹ, GIáo sư và Trưởng khoa Hệ thống Máy tính tại Trinity College Dublin ở Ireland. Phản ứng lại với nghiên cứu, người phát ngôn Google là Scott Westover cho biết: “Nghiên cứu này chủ yếu chỉ ra cách smartphone hoạt động. Xe hơi hiện đại cũng định kỳ gửi dữ liệu cơ bản về thành phần, trạng thái an toàn, và lịch bảo dưỡng đến nhà sản xuất, và điện thoại di động hoạt động theo cách rất tương tự. Báo cáo này chỉ ra điều đó, vốn giúp đảm bảo phần mềm iOS và Android luôn được cập nhật, các dịch vụ hoạt động như dự kiến, và điện thoại bảo mật và hoạt động hiệu quả. Trình duyệt Chrome của Google mặc định thu thập dữ liệu sử dụng và dữ liệu crash. Để tắt tính năng này, hãy vào Settings > You and Google > Sync and Google Services, sau đó tắt tab “Help improve Chrome’s features and performance”. Bạn cũng có thể tắt luôn “Make searches and browsing better” nếu muốn hạn chế thu thập dữ liệu. “Chính sách Quyền riêng tư của chúng tôi giúp người dùng hiểu được thông tin nào bị thu thập, tại sao chúng tôi thu thập nó, và làm sao họ có thể cập nhật, quản lý, xuất, và xóa thông tin đó” - theo người phát ngôn Google là Matt Bryant. Amazon
Nhiều trợ lý giọng nói, bao gồm Amazon Alexa, Apple Siri, và Google Assistant, có thể gửi các bản ghi âm giọng nói của bạn trong khuôn khổ chương trình cải thiện sản phẩm của chúng. Các sản phẩm của Apple và Google đòi hỏi người dùng tham gia vào chương trình review giọng nói trong quá trình thiết lập. Mặc định thì Amazon Alexa bật quy trình này. Những nội dung của các chương trình theo dõi giọng nói này đã khiến cả ba công ty vướng vào một số cuộc tranh cãi vào năm 2019, khi một loạt bài báo tiết lộ các nhân viên công ty đã nghe các đoạn ghi âm của người tiêu dùng. Apple và Google sau vụ việc đó đã chuyển các chương trình của mình sang tùy chọn, còn Amazon vẫn mặc định kích hoạt. “Điều họ không nói với người tiêu dùng là, định kỳ, để đánh giá xem liệu AI có phiên dịch những từ bạn nói ra một cách chính xác hay không, họ sẽ cho con người nghe những đoạn hội thoại đó” - theo Kshirsagar. “Bạn có tin những nhân viên ở đó? Bạn có tin những nhà thầu của họ, những người chịu trách nhiệm giám sát việc này? Có hàng loạt vấn đề đấy” Amazon cho biết việc giám sát đó giúp cải thiện độ chính xác trong việc diễn dịch lời nói của thiết bị, cho phép nó phân biệt giữa những từ ngữ với âm thanh tương tự nhau. “Huấn luyện Alexa với nhiều bản ghi giọng nói đa dạng giúp nó hiểu tốt hơn những yêu cầu của khách hàng và cung cấp những phản hồi chính xác hơn, cá nhân hóa hơn” - theo người phát ngôn Lauren Raemhild. “Để giúp cải thiện Alexa, chúng tôi tự đánh giá và ghi chú một phần rất nhỏ trong số 1% tổng yêu cầu gửi đến Alexa. Việc tiếp cận những công cụ đánh giá dành cho các nhân viên cũng được kiểm soát gắt gao và chỉ được cấp phép cho một số lượng giới hạn các nhân viên cần đến” Bà nói thêm rằng những ghi chú kia không bao gồm thông tin có thể xác định người dùng, và khách hàng có thể không cho phép nhân viên Amazon đánh giá các bản ghi giọng nói của họ theo hướng dẫn của Amazon tại đây. Ví dụ, bạn có thể nói với Alexa rằng “Alexa, turn off human review of my voice recordings”. Adobe
Một chương trình đồ họa như Photoshop có thể phân tích ảnh của bạn để đánh giá các tính năng của nó hoạt động tốt đến mức nào. Adobe, nhà phát triển phần mềm đồ họa và video Photoshop, mặc định sẽ sử dụng học máy lên các hình ảnh đã xử lý trên đám mây của họ. “Các hệ thống tự động của Adobe phân ích hình ảnh người dùng (ví dụ từng phần của hình ảnh, phân tích độ tương phản...) để cải thiện các sản phẩm của Adobe, nhưng chúng tôi không thu thập dữ liệu về người dùng cụ thể” - theo Andrew Savage, lãnh đạo đội pháp lý của Adobe. Công ty giải thích về cơ chế hoạt động của hệ thống học máy của mình tại đây. Người dùng có thể tắt tính năng này bằng cách đăng nhập vào tài khoản Adobe, tìm phần “machine learning” và tắt “Allow my content to be analyzed by Adobe using machine learning techniques”. Người dùng Photoshop còn có thể tham gia vào chương trình cho phép các nhà nghiên cứu Adobe đánh giá những bản sao độ phân giải thấp của ảnh người dùng. Adobe cho biết những thông tin như vậy giúp họ tinh chỉnh các tính năng như tự động chọn chủ thể chính của ảnh hoặc lấp đầy các vùng trong ảnh mà bạn muốn thay thế. “Một khi người dùng tham gia, các nhà nghiên cứu Adobe có thể đánh giá những hình ảnh Photoshop mà người dùng đã upload lên máy chủ Adobe” - Savage nói. “Xin lưu ý rằng Adobe không có quyền truy xuất ảnh trên máy tính của người dùng” Adobe còn tự động upload nhiều thông tin chung về thiết bị của bạn và quá trình tương tác với các chương trình và dịch vụ của Adobe. Người dùng có thể ngừng tham gia hoạt động thu thập dữ liệu này. Apple
Apple, công ty luôn quảng bá là đề cao quyền riêng tư của người dùng trong vài năm trở lại đây, đưa ra một mô hình tham gia chia sẻ thông tin phân tích, nhưng bạn sẽ phải nghiên cứu khá kỹ trên nhiều trang web khác nhau của công ty để hiểu rõ mọi lựa chọn họ cung cấp. Những lựa chọn đó dường như khiến khá nhiều người cảm thấy khó hiểu, và đó không chỉ là người tiêu dùng, mà ngay cả một số nhân viên hỗ trợ kỹ thuật của công ty cũng phải nhíu mày khi được hỏi liệu công ty có tự động thu thập dữ liệu phân tích người dùng từ hệ điều hành iOS, iCloud, và iPhone mà không được sự đồng ý của họ hay không (câu trả lời là...có). Nhưng website của Apple thì nói rằng thông tin sử dụng chỉ được chia sẻ sau khi bạn đồng ý tham gia trong quá trình thiết lập các thiết bị. “Giúp đỡ Apple cải thiện các sản phẩm bằng cách cho phép phân tích dữ liệu sử dụng từ iPhone của bạn” - điện thoại hỏi như vậy khi bạn thiết lập lần đầu (nút “Share with Apple” cũng sẽ được tô sáng lên). “Bạn có thể thay đổi quyết định về sau trong phần Settings” Để kiểm tra thiết lập của iPhone, hãy vào Settings > Privacy > Analytics & Improvements. “iPhone Analytics có thể bao gồm những chi tiết về thông số phần cứng và hệ điều hành, thống kê hiệu năng, và dữ liệu về cách bạn sử dụng thiết bị và ứng dụng”, công ty cho biết như vậy trên website, nhấn mạnh rằng dữ liệu vị trí cũng có thể được thu thập nếu “Location Services” được kích hoạt. Apple còn hỏi riêng rằng người dùng có muốn chia sẻ các bản ghi y tế và phân tích iCloud với Apple, cũng như dữ liệu crash và quá trình sử dụng với các nhà phát triển ứng dụng bên thứ ba. Đối với hệ điều hành iOS, Apple viết: “Apple đề nghị khách hàng giúp cải thiện iOS bằng cách thỉnh thoảng cung cấp thông tin phân tích, chẩn đoán và sử dụng. Apple thu thập thông tin này một cách ẩn danh”. Những thông tin đó giúp họ đưa ra đề xuất đoán từ hoặc đề xuất emoji tốt hơn trong khi bạn gõ phím. Trên các thiết bị macOS, bạn có thể điều chỉnh thiết lập chia sẻ trong System Preferences, mục Security & Privacy > Privacy > Analytics & Improvements. Đối với dịch vụ lưu trữ trực tuyến iCloud, vốn hoạt động xuyên thiết bị, công ty cho biết: “Nếu bạn cho phép chia sẻ iCloud Analytics, Apple có thể cải thiện Siri và các tính năng thông minh khác bằng cách phân tích cách bạn sử dụng dữ liệu iCloud từ tài khoản, như các đoạn văn bản từ email” Khi được hỏi về hoạt động thu thập và chia sẻ dữ liệu phân tích thiết bị, người phát ngôn của Apple giải thích: “Khi người dùng thiết lập một thiết bị Apple, họ sẽ được hỏi liệu có thích chia sẻ phân tích ứng dụng với các nhà phát triển và các đối tác để giúp cải thiện ứng dụng hay không. Nếu một người dùng tham gia chia sẻ dữ liệu này, thiết bị sẽ chỉ cung cấp thông tin chẩn đoán và thống kê theo kiểu tập hợp, tức dưới dạng không thể xác định được người dùng là ai”. Tuy nhiên, tài liệu của Giáo sư Leith của Trinity College Dublin, Apple chia sẻ một số dữ liệu kể cả từ những người dùng không tham gia chương trình. “Một lượng lớn các ứng dụng, dịch vụ cài đặt sẵn cũng tìm cách kết nối với mạng, mặc cho chưa bao giờ được mở hoặc sử dụng. Cụ thể, trên iOS, chúng bao gồm Siri, Safari, và iCloud” - Leith viết, nhấn mạnh rằng các chương trình Google cũng hành động tương tự. “Tần suất kết nối mạng khá cao được thực hiện bởi cả iOS và Google Android (trung bình mỗi 4,5 phút một lần) cho phép Apple và Google theo dõi vị trí của thiết bị theo thời gian” Đáp lại phát hiện này, người phát ngôn của Apple cho biết: “Các thiết bị Apple có thể gửi dữ liệu đến máy chủ Apple vì những lý do cần thiết cho sự hoạt động của thiết bị, như đăng ký một điện thoại mới với nhà mạng. Kể cả trong những trường hợp đó, các thiết bị và phần mềm Apple cũng tối thiểu hóa dữ liệu chia sẻ với Apple, và khi có thể, không liên kết dữ liệu gửi đi với Apple ID hay bất kỳ dạng thông tin định danh nào” Firefox
Nhiều công ty cũng chia sẻ dữ liệu sử dụng nặc danh với các đối tác bên ngoài. Chính sách quyền riêng tư của trình duyệt Firefox do Mozilla phát triển nêu chi tiết cách họ chia sẻ dữ liệu trong mục “**improve performance and stability for users everywhre” (**cải thiện hiệu suất và độ ổn định cho mọi người dùng). Cụ thể, “Firefox gửi dữ liệu về tương tác của bạn với Firefox cho chúng tôi (như số lượng tab và cửa sổ đang mở; số lượng trang web ghé thăm; số lượng và loại add-on Firefox đã cài; và thời gian phiên làm việc) và các tính năng Firefox do Mozilla hoặc các đối tác của chúng tôi cung cấp (như tương tác với tính năng tìm kiếm của Firefox và các đối tác tìm kiếm”. Dữ liệu được mặc định thu thập sau khi bạn cài đặt trình duyệt. Người dùng bình thường có thể không nhận ra lượng dữ liệu mà chính sách này cho phép chia sẻ nhiều đến mức nào, nhưng sau khi đọc xong, McDonald - người từng làm nghiên cứu quyền riêng tư tại Mozilla - đã bày tỏ sự quan ngại về việc chia sẻ dữ liệu tìm kiếm internet nặc danh với “các đối tác tìm kiếm”. “Những từ khóa tìm kiếm từ một người nhất định có thể nhanh chóng trở thành thông tin định danh ra họ” - bà nói. “Khá là xâm phạm quyền riêng tư đấy”. Người dùng Firefox có thể tắt chia sẻ dữ liệu hiệu suất bằng cách vào Settings > Privacy & Security > Firefox Data Collection and Use, sau đó bỏ chọn “Allow Firefox to send technical and interaction data to Mozilla”. Ngoài ra, bạn có thể tắt luôn “Allow Firefox to install and run studies” Các bản báo cáo crash của Firefox - thứ bạn có thể chọn chia sẻ với Mozilla mỗi khi phần mềm bị treo - cũng chứa thứ mà công ty miêu tả là dữ liệu nhạy cảm có thể định danh bạn. “Chúng tôi nghiêm khắc hạn chế truy xuất đến các bản dump crash này đối với một số rất ít các nhân viên, những người chuyên phụ trách điều tra crash, và dữ liệu thu thập được sẽ bị xóa sau 6 tháng dù bất kỳ giá nào” - theo Vicky Chin, giám đốc kỹ thuật desktop của Mozilla. Tham khảo: ConsumerReports