Có một ngành công nghiệp trị giá 12 tỉ USD tận dụng dữ liệu vị trí của bạn

Có những công ty có thể bạn chưa hề biết đến, nhưng lại sở hữu khả năng truy cập vào lịch sử vị trí trên chiếc điện thoại của bạn. Ngành công nghiệp dữ liệu vị trí này có giá trị ước tính khoảng 12 tỉ USD với rất nhiều thành phần đóng góp, bao gồm những người thu thập, tổng hợp, thị trường cùng những công ty tình báo vị trí. Tất cả đều đã tích lũy được quy mô cũng như độ chính xác dữ liệu đáng nể.
Có một ngành công nghiệp trị giá 12 tỉ USD tận dụng dữ liệu vị trí của bạn
Công ty vị trí Near mô tả bản thân mình là “tập dữ liệu về hành vi con người trong thế giới thực lớn nhất thế giới”, với lượng dữ liệu đại diện cho “1,6 tỉ người trên 44 quốc gia”. Mobilewalla nắm trong tay “hơn 40 quốc gia, hơn 1,9 tỉ thiết bị, 50 tỉ tín hiệu di động hàng ngày cùng hơn 5 năm dữ liệu”. Trang web của X-Mode lại tuyên bố, dữ liệu của họ bao gồm “hơn 25% dân số Mỹ trưởng thành hàng tháng.”

Cả một ngành công nghiệp​

Để tìm hiểu sâu hơn về ngành công nghiệp ít được chú ý này, The Markup đã xác định được 47 công ty thu thập, bán hoặc kinh doanh dữ liệu vị trí điện thoại di động. Dù không thực sự toàn diện, danh sách này vẫn giúp chúng ta hiểu hơn một chút về sự liên kết giữa những giữa công ty tham gia, làm mọi tứ, từ cung cấp mã cho các nhà phát triển ứng dụng hòng kiếm tiền từ dữ liệu người dùng cho đến việc cung cấp phân tích từ “1,9 tỉ thiết bị” và truy cập vào bộ dữ liệu hàng triệu người. 6 công ty xác nhận dữ liệu của họ có hơn 1 tỉ thiết bị, và ít nhất 4 công ty khẳng định dữ liệu của họ là “chính xác nhất” trong ngành.
Justin Sherman, chuyên gia chính sách mạng tại Duke Tech Policy Lab, cho biết: “Không có nhiều sự minh bạch rõ ràng và có 1 mạng lưới tương tác rất phức tạp trong bóng tối, giữa những công ty này và rất khó để hiểu rõ. Họ hoạt động dựa trên những gì mà quan hệ công chúng, mọi người ở Washington lẫn các trung tâm quản lý khác không chú ý đến.”
Đã có những câu chuyện xuất hiện để làm sáng tỏ mức độ xâm lấn của ngành công nghiệp này. Hồi năm 2020, Motherboard cho biết, X-Mode – công ty chuyên thu thập dữ liệu vị trí thông qua các ứng dụng – đang thu thập dữ liệu từ các ứng dụng cầu nguyện của người Hồi Giáo và bán nó cho những nhà thầu quân sự. Cũng trong năm ngoái, The Wall Street Journal xác nhận, Venntel – một nhà cung cấp dữ liệu vị trí – đang bán dữ liệu vị trí cho các cơ quan liên bang với mục đích thực thi di trú.
Một hãng tin Công giáo cũng sử dụng dữ liệu vị trí từ một nhà cung cáp dữ liệu hòng tìm ra một linh mục thường lui tới các quán bar dành cho người đồng tính nam, dù vẫn chưa biết rõ công ty nào đã bán thông tin đó.
Nhiều công ty cam kết rằng quyền riêng tư là trọng tâm trong công việc kinh doanh của họ và họ luôn cẩn thận, không bao giờ bán thông tin có khả năng truy ngược lại cho một người. Nhưng với các nghiên cứu về dữ liệu vị trí ẩn danh, những nhà nghiên cứu đã cho thấy tuyên bố đó có thể gây ra hiểu lầm như thế nào.
Rất khó để biết rõ mọi cách thức theo dõi và giao dịch những chuyển động của bạn. Các công ty thường tiết lộ rất ít về việc ứng dụng nào là nguồn dữ liệu họ thu thập, những dữ liệu họ thu thập bao gồm những gì và mức độ dữ liệu đó được gửi đi. Để tạo ra một bức tranh tổng thể của hệ sinh thái này, The Markup đã đánh giá nhiều trang web và ngôn ngữ tiếp thị của từng công ty trong số 47 công ty được xác định là đang hoạt động trong ngành dữ liệu vị trí, cũng như bất kỳ thông tin nào liên quan đến việc họ lấy dữ liệu như thế nào.

Cách thức dữ liệu "bay ra khỏi" điện thoại của bạn​

Có một ngành công nghiệp trị giá 12 tỉ USD tận dụng dữ liệu vị trí của bạn
Hầu hết mọi lần, đường dẫn dữ liệu vị trí ban đầu đều nằm trong tay bạn, khi một ứng dụng gửi thông báo yêu cầu quyền truy cập vào dữ liệu vị trí của bạn.
Các ứng dụng có đủ loại lý do để sử dụng vị trí của bạn. Các ứng dụng bản đồ cần biết bạn ở đâu để chỉ đường cho bạn đến đúng nơi. Ứng dụng thời tiết, sóng hoặc gió sẽ kiểm tra vị trí của bạn để cung cấp thông tin khí tượng liên quan. Ứng dụng phát video trực tuyến sẽ kiểm tra vị trí của bạn nhằm đảm bảo bạn đang ở quốc gia được cấp phép đối với một số một số chương trình nhất định.
Nhưng hầu hết người dùng không biết được rằng một số ứng dụng bán hoặc chia sẻ dữ liệu vị trí của họ cho các công ty phân tích dữ liệu, chẳng hạn như Advan Research. Các công ty khác, như Adsquare, mua hoặc lấy dữ liệu vị trí từ nhiều ứng dụng nhằm mục đích tổng hợp chúng với những nguồn dữ liệu khác. Sau đó, các công ty như bất động sản, quỹ đầu cơ và doanh nghiệp bán lẻ có thể chuyển và sử dụng dữ liệu đó cho những mục đích quảng cáo, phân tích, đưa ra chiến lược đầu tư hoặc tiếp thị của riêng họ.
Serge Egelman, một nhà nghiên cứu tại Viện Khoa học Máy tính Quốc tế của UC Berkeley và CTO của AppCensus, vốn cũng là người nghiên cứu các quyền dữ liệu nhạy cảm trên những ứng dụng di động, cho biết rằng rất khó để biết ứng dụng nào trên điện thoại của bạn chỉ sử dụng dữ liệu cho các mục đích chức năng của riêng chúng hay ứng dụng nào gửi dữ liệu của bạn đi với mục đích kinh tế.
“Ở hiện tại, khi ứng dụng yêu cầu vị trí do nhấp vào nút tìm nội dung gần đó và bạn thấy hộp thoại cấp quyền, bạn có thể nghĩ rằng ‘điều đó là nhằm phục vụ chức năng đó’, nhưng đáng tiếc, không có gì đảm bảo được điều đó”, Egelman cho hay. “Và chắc chắn, chúng thường không bao giờ tiết lộ rằng dữ liệu sẽ chỉ được giới hạn cho mục đích đó.”
Các công ty kinh doanh dữ liệu này không muốn chia sẻ danh sách những ứng dụng mà họ sử dụng để thu thập dữ liệu.
The Markup đã thử hỏi những người đại diện của mọi công ty có trong danh sách này về vấn đề họ thu thập dữ liệu vị trí ở đâu. Các công ty như Adsquare và Cuebiq cho biết rằng họ sẽ không tiết lộ công khai những ứng dụng nào mà họ sử dụng để thu thập dữ liệu vị trí nhằm giữ lợi thế cạnh tranh của riêng mình. Tuy nhiên, họ vẫn tuyên bố rằng quy trình thu thập dữ liệu của họ hoàn toàn minh bạch và có sự đồng ý rõ ràng của người dùng ứng dụng.
Phát ngôn viên của Cuebiq có tên là Bill Daddi cho biết: “Tất cả đều cực kỳ minh bạch.” Ông cho biết thêm rằng người tiêu dùng phải biết các ứng dụng đang làm gì với dữ liệu của họ bởi rất ít người đồng ý chia sẻ dữ liệu đó. Trong một email, Daddi cho hay: “Tỉ lệ chọn tham gia xác nhận rõ ràng người dùng hoàn toàn nhận thức được điều gì đang xảy ra bởi tỉ lệ chọn thậm gia có thể thấp hơn 20%, tùy thuộc vào ứng dụng.”
Có một ngành công nghiệp trị giá 12 tỉ USD tận dụng dữ liệu vị trí của bạn
Yiannis Tsiounis, CEO của công ty phân tích vị trí Advan Research, cho biết, công ty của ông giao dịch với các nhà tổng hợp dữ liệu vị trí, vốn có vai trò thu thập dữ liệu từ hàng nghìn ứng dụng, nhưng lại không đề cập đến bất kỳ cái tên cụ thể nào. Tsiounis cho biết, các ứng dụng mà anh hợp tác đều nói rõ ràng chúng chia sẻ dữ liệu vị trí với bên thứ ba trong chính sách bảo mật, dù rằng anh thừa nhận việc hầu hết người dùng không đọc chính sách bảo mật.
Tuy nhiên, phát ngôn viên Ashley Dawkins của Foursquare lại đề cập đến những ứng dụng cụ thể được sử dụng như nguồn dữ liệu vị trí của họ. Cụ thể là những sản phẩm của chính Foursquare, chẳng hạn như Swarm, CityGuide và Rewards.
Nhưng Foursquare cũng cung cấp một bộ công cụ phát triển phần mềm (SDK) miễn phí có khả năng theo dõi vị trí thông qua bất kỳ ứng dụng nào sử dụng nó. SDK là một bộ công cụ được xây dựng sẵn mà các nhà phát triển có thể sử dụng trong những ứng dụng của họ. Pilgrim SDK của Foursquare được sử dụng trong các ứng dụng như GasBuddy – một dịch vụ so sánh giá của những trạm xăng gần đó, Flipp – một ứng dụng mua sắm với những mã giảm giá, và Checkout561 – một ứng dụng giảm giá khác dựa trên vị trí.
GasBuddy, Flipp và Checkout 51 không đưa ra bất kỳ bình luận nào liên quan đến vấn đề này.
Theo tìm kiếm của Mighty Signal – một trang web phân tích và theo dõi SDK trong ứng dụng, Pilgrim SDK của Foursquare xuất hiện trong 26 ứng dụng Android.
Dù không phải mọi ứng dụng sử dụng SDK của Foursquare đều gửi dữ liệu vị trí ngược lại cho công ty này, thế nhưng, các chính sách bảo mật của Flipp, Checkout 51 và GasBuddy đều thừa nhận rằng họ chia sẻ dữ liệu vị trí với Foursquare.
Cách thu thập dữ liệu vị trí thông qua SDK của Foursquare là một phương pháp phổ biến. Trong số 47 công ty mà The Markup đã xác định, 12 trong số đó đã quảng bá những SDK của mình cho các nhà phát triển ứng dụng để họ có thể trao đổi dữ liệu vị trí của khách hàng với tiền hoặc dịch vụ.
Trong hoạt động tiếp thị của mình, Placer.ai tiết lộ, họ thực hiện phân tích lưu lượng truy cập và SDK của họ được cài đặt trong hơn 500 ứng dụng cũng như sở hữu thông tin phân tích chi tiết của hơn 20 triệu thiết bị.
Trả lời email, Ethan Chernofsky, Phó Chủ tịch tiếp thị của Placer.ai, cho biết: “Chúng tôi hợp tác với các ứng dụng di động cung cấp dịch vụ định vị và nhận dữ liệu tổng hợp ẩn danh. Tất cả dữ liệu đều được ẩn danh và bị loại bỏ danh tính cá nhân trước khi đến tay chúng tôi.”

Tham gia vào thị trường dữ liệu vị trí​

Có một ngành công nghiệp trị giá 12 tỉ USD tận dụng dữ liệu vị trí của bạn
Sau khi dữ liệu vị trí của người dùng đã được ứng dụng thu thập và tham gia vào thị trường dữ liệu vị trí, chúng có thể được bán đi bán lại nhiều lần, từ các nhà cung cấp dữ liệu đến một công ty tổng hợp bán lại dữ liệu từ nhiều nguồn. Chúng có thể nằm trong tay của 1 công ty “thông tin vị trí, vốn sử dụng dữ liệu thô để phân tích lưu lượng người đến các khu vực mua sắm và nhân khẩu học liên quan đến lượng khách ghé thăm của họ. Hoặc “cập bến” 1 quỹ đầu cơ muốn có thông tin chi tiết về số lượng người sẽ đến 1 cửa hàng nhất định.
Yiannis Tsiounis cho biết: “Có những công ty tổng hợp dữ liệu, vốn thu thập dữ liệu từ nhiều ứng dụng và bán chúng hàng loạt. Và sau đó, các công ty phân tích mua dữ liệu đó từ những nhà tổng hợp hoặc ứng dụng, rồi thực hiện phân tích. Mọi người bán cho mọi người khác.”
Một số thị trường dữ liệu là một phần của các công ty nổi tiếng, chẳng hạn như AWS Data Exchange của Amazon hoặc Data Marketplace của Oracle, vốn bán mọi loại dữ liệu chứ không chỉ riêng dữ liệu vị trí. Oracle tự hào là “thị trường dữ liệu bên thứ ba lớn nhất thế giới” đối với quảng cáo hướng mục tiêu, trong khi Amazon tự tin tuyên bố “giúp quá trình tìm kiến, đăng ký và sử dụng dữ liệu bên thứ ba trên đám mây dễ dàng hơn”.
Phát ngôn viên Claude Shy của Amazon cho biết, các nhà cung cấp dữ liệu phải giải thích cách họ có được sự đồng ý đối với việc thu thập dữ liệu và cách họ giám sát những người sử dụng dữ liệu mà họ mua.
Shy cho biết: “Chỉ các nhà cung cấp dữ liệu đủ điều kiện mới có quyền truy cập vào AWS Data Exchange. Những nhà cung cấp dữ liệu tiềm năng phải vượt qua một quy trình đăng ký nghiêm ngặt.”
Oracle lại từ chối đưa ra bình luận.
Các công ty khác như Narrative cho biết, họ chỉ làm một nhiệm vụ đơn giản: kết nối người mua và người bán dữ liệu bằng cách cung cấp một nền tảng. Chẳng hạn, trang web của Narrative liệt kê 17 nhà cung cấp dữ liệu vị trí, trong đó có SafeGraph và Complementics, cùng hơn 2 tỉ ID quảng cáo trên thiết bị di động có thể mua.
Nhưng CEO Narrative, Nick Jordan, cho biết, công ty không “lục lọi” chính những dữ liệu này.
Ông cho biết: “Có một số công ty đang sử dụng nền tảng của chúng tôi để thu thập và kiếm tiền từ dữ liệu vị trí địa lý, nhưng chúng tôi không có bất kỳ quyền hạn nào đối với dữ liệu. Chúng tôi không mua chúng cũng không bán chúng.”
Để dễ hình dung được quy mô của ngành công nghiệp này, Jordan Hauer, CEO của Amass Insights, cho biết rằng công ty của ông có 320 nhà cung cáp dữ liệu vị trí. Dù công ty không trực tiếp thu thập hoặc bán bất kỳ dữ liệu nào, thế nhưng, các quỹ đầu cơ sẽ trả tiền để hướng dẫn họ đưa chúng đến vô số công công ty dữ liệu vị trí.

Nơi đến của những dữ liệu vị trí​

Có một ngành công nghiệp trị giá 12 tỉ USD tận dụng dữ liệu vị trí của bạn
Có rất nhiều người mua dữ liệu vị trí tiềm năng: các nhà đầu tư đang tìm kiềm thông tin về xu hướng thị trường hoặc những gì đối thủ của họ đang làm, các chiến dịch chính trị, những cửa hàng theo dõi khách hàng hay thậm chí là các cơ quan thực thi pháp luật,…
Chẳng hạn, dữ liệu từ công ty tình báo vị trí Thasos Group đã được sử dụng để đo lường số lượng công nhân tăng ca tại các nhà máy của Tesla. Các chiến dịch chính trị của cả 2 đảng cũng đã sử dụng dữ liệu vị trí từ những người đã tham gia các cuộc biểu tình cho mục đích quảng cáo hướng mục tiêu.
Các nhà hàng thức ăn nhanh hay nhiều daonh nghiệp khác cũng mua dữ liệu vị trí cho mục đích quảng cáo dựa trên từng bước chân của mỗi người. Chẳng hạn, trong năm 2018, Burger King đã thực hiện 1 chương trình khuyến mãi, trong đó, nếu điện thoại của khách hàng cách cửa hàng McDonalds trong vòng 180m, ứng dụng Burger King sẽ cho phép người dùng mua một chiếc bánh hamburger với giá 1 cent.
The Wall Street Journal và Motherboard cũng đã từng đăng tải nhiều bài viết về cách các cơ quan liên bang, bao gồm Sở Thuế vụ, Hải quan và Bảo vệ Biên giới, và Quân đội Hoa Kỳ, mua dữ liệu vị trí từ những công ty theo dõi điện thoại.
Các công ty dữ liệu vị trí mà The Markup để mắt đến cung cấp nhiều dịch vụ đa dạng.
Ví dụ, Advan Research sử dụng dữ liệu lịch sử vị trí để tiết lộ với khách hàng rằng khách của họ đến từ đâu và đưa ra các phỏng đoán về thu nhập, chủng tộc và sở thích của họ dựa trên nơi họ đã đến. Hầu hết khách hàng của Advan Research đều là các doanh nghiệp bán lẻ hoặc chủ sở hữu công ty cổ phần tư nhân.
Những công ty khác lại có thể kết hợp dữ liệu vị trí mà họ có được với các phần dữ liệu khác được thu thập từ các hoạt động trực tuyến của người dùng. Complementics, vốn tự hào khi sở hữu dữ liệu “hơn 1 tỉ ID thiết bị di động”, cung cấp dữ liệu trí song song với dữ liệu chéo thiết bị cho mục đích quảng cáo hướng mục tiêu trên di động. Giá của “sản phẩm” này có thể cao.
Outlogic (trước đây gọi là X-Mode) cung cấp quyền truy cập cho tập dữ liệu vị trí có tên “Dữ liệu vị trí an ninh mang” trên Datarade với giá 240.000 USD mỗi năm. Theo mô tả, “dữ liệu vị trí chi tiết và chính xác của Outlogic được thu thập trực tiếp từ GPS của thiết bị di động”.
Có một ngành công nghiệp trị giá 12 tỉ USD tận dụng dữ liệu vị trí của bạn
Hiện có rất ít quy tắc hạn chế ai có thể mua được những dữ liệu của người dùng.
Sherman, một nhân viên thuộc Phòng thí nghiệm Chính sách Công nghệ Duke, đã xuaát bản một báo cáo vào hồi tháng 8, cho thấy các nhà môi giới dữ liệu đang quang cáo thông tin vị trí của mọi người dựa trên niềm tin chính trị của họ, cũng như dữ liệu về nhân viên Chính phủ và quân nhân Hoa Kỳ.
Sherman cho biết: “Luật pháp Mỹ không có điều luật nào ngăn cản 1 công ty Mỹ bán dữ liệu của 2 triệu thành viên dịch vụ cho một số công ty Nga, vốn là bình phong cho Chính phủ Nga.”
Các luật hiện hành về quyền riêng tư ở Mỹ, chẳng hạn như Đạo luật về quyền riêng tư của người tiêu dùng tại California, không giới hạn những ai có thể mua được dữ liệu, dù rằng cư dân ở California có thể yêu cầu “không được” bán dữ liệu của họ - một định nghĩa cực kỳ khó hiểu. Thay vào đó, đạo luật này tập trung vào việc cho phép mọi người từ chối chia sẻ vị trí của họ ngay từ đầu.
Quy định chung về Bảo vệ Dữ liệu của Liên minh Châu Âu lại có các yêu cầu nghiêm ngặt hơn trong việc thông báo cho người dùng khi dữ liệu của họ đang trong quá trình xử lý hoặc chuyển giao.
Nhưng Ashkan Soltani, một chuyên gia về quyền riêng tư và là cựu giám đốc công nghệ của Ủy ban Thương mại Liên Bang (FTC), cho biết, việc mong đợi khách hàng săn lùng những công ty đó và yêu cầu họ xóa mọi dữ liệu cá nhân là điều hoàn toàn phi thực tế.
Ông cho biết: “Thực tế, chúng ta biết rằng người tiêu dùng sẽ không làm bất cứ điều gì.”
Theo Egelman tại AppCensus, các công ty như Apple và Google, vốn kiểm soát quyền truy cập vào những cửa hàng ứng dụng, lại nắm trong tay vị trí tốt nhất để kiểm soát thị trường dữ liệu vị trí. Egelman cho biết: “Mối nguy hiểm thực sự chính là việc ứng dụng bắt đầu từ Google Play Store hoặc iOS App Store. Điều đó khiến công ty của bạn mất tiền.”
Cả Google lẫn Apple gần đây đều đã cấm các nhà phát triển ứng dụng sử dụng những SDK báo cáo vị trí của một số công ty dữ liệu. Tuy nhiên, các nhà nghiên cứu nhận thấy rằng những SDK của nhiều công ty đó vẫn đang xuất hiện trong kho ứng dụng của Google.
Apple không đưa ra bất kỳ bình luận nào.
Trong một email, phát ngôn viên Scott Westover của Google cho biết: “Đội ngũ Google Play luôn chăm chỉ làm việc nhằm tăng cường các biện pháp bảo vệ quyền riêng tư thông qua những cải tiến đối với cả sản phẩm lẫn chính sách. Khi chúng tôi phát hiện các ứng dụng hoặc những nhà cung cấp SDK vi phạm chính sách của mình, chúng tôi sẽ can thiệp.”
Thượng nghị sĩ Mỹ Ron Wyden, đồng thời cũng là một thành viên trong Đảng Dân chủ đến từ Oregon, cho biết rằng các cửa hàng ứng dụng lớn cần phải làm nhiều thứ hơn thế.
Đây là bước đi đúng đắn của Google, nhưng họ và Apple cần phải làm nhiều thứ hơn nữa thay vì chỉ chơi trò ‘mèo vờn chuột’ với các ứng dụng bán thông tin vị trí của người Mỹ. Các công ty này cần phải có kế hoạch thực sự để bảo vệ quyền riêng tư và sự an toàn của người dùng khỏi những ứng dụng độc hại này.”
Nguồn: The Next Web
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top