Dữ liệu của chính phủ sẽ mang lại sức mạnh phi thường cho một công ty AI như thế nào

Trung Đào
Trung Đào
Phản hồi: 0

Trung Đào

Writer
Việc Elon Musk sử dụng AI để thực hiện các công việc kiểm toán, đánh giá chi tiêu của chính phủ Hoa Kỳ đang bị phe cánh tả (đảng Dân chủ) phản đối.
Dưới đây là một bài viết như vậy, mới đăng trên The Conversations. Bỏ qua những định kiến, trong bài có cung cấp một số thông tin đáng tham khảo về việc khai thác dữ liệu của chính phủ cho AI. Chi tiết bài viết 👇
1742271599061.png

Bộ Hiệu quả Chính phủ, hay DOGE, đã bảo đảm quyền truy cập chưa từng có vào ít nhất bảy cơ sở dữ liệu liên bang nhạy cảm, bao gồm cả cơ sở dữ liệu của Sở Thuế vụ và Cục An sinh Xã hội. Quyền truy cập này đã làm dấy lên nỗi lo ngại về lỗ hổng an ninh mạng và vi phạm quyền riêng tư . Một mối quan tâm khác ít được chú ý hơn nhiều: khả năng sử dụng dữ liệu để đào tạo hệ thống trí tuệ nhân tạo của một công ty tư nhân.

Thư ký báo chí Nhà Trắng cho biết dữ liệu chính phủ mà DOGE thu thập không được sử dụng để đào tạo các mô hình AI của Musk, mặc dù Elon Musk kiểm soát DOGE. Tuy nhiên, có bằng chứng cho thấy nhân viên DOGE đồng thời giữ chức vụ tại ít nhất một trong các công ty của Musk.

Tại Cục Hàng không Liên bang, nhân viên SpaceX có địa chỉ email của chính phủ . Việc làm kép này tạo ra một kênh để dữ liệu liên bang có khả năng bị chuyển đến các doanh nghiệp do Musk sở hữu, bao gồm cả xAI. Mô hình chatbot Grok AI mới nhất của công ty rõ ràng từ chối đưa ra lời phủ nhận rõ ràng về việc sử dụng dữ liệu đó.

Là một nhà khoa học chính trị và công nghệ có hiểu biết sâu sắc về các nguồn dữ liệu công khai của chính phủ , tôi tin rằng việc truyền dữ liệu chính phủ tiềm ẩn này cho các công ty tư nhân có tác động lớn hơn nhiều đến quyền riêng tư và quyền lực so với hầu hết các báo cáo xác định. Một thực thể tư nhân có khả năng phát triển công nghệ trí tuệ nhân tạo có thể sử dụng dữ liệu của chính phủ để vượt qua các đối thủ cạnh tranh và tạo ra ảnh hưởng lớn đến xã hội.

Giá trị của dữ liệu chính phủ đối với AI
Đối với các nhà phát triển AI, cơ sở dữ liệu của chính phủ đại diện cho một cái gì đó tương tự như việc tìm kiếm Chén Thánh . Trong khi các công ty như OpenAI, Google và xAI hiện đang dựa vào thông tin được thu thập từ internet công cộng, các kho lưu trữ không công khai của chính phủ cung cấp một thứ có giá trị hơn nhiều: hồ sơ đã được xác minh về hành vi thực tế của con người trên toàn bộ dân số.

Đây không chỉ là nhiều dữ liệu hơn – mà về cơ bản là dữ liệu khác . Các bài đăng trên phương tiện truyền thông xã hội và lịch sử duyệt web cho thấy các hành vi được quản lý hoặc có chủ đích, nhưng cơ sở dữ liệu của chính phủ nắm bắt các quyết định thực tế và hậu quả của chúng. Ví dụ, hồ sơ Medicare tiết lộ các lựa chọn và kết quả chăm sóc sức khỏe. Dữ liệu của IRS và Kho bạc tiết lộ các quyết định tài chính và tác động dài hạn. Và số liệu thống kê về việc làm và giáo dục của liên bang tiết lộ các con đường giáo dục và quỹ đạo nghề nghiệp.

Điều khiến dữ liệu này đặc biệt có giá trị đối với đào tạo AI là bản chất theo chiều dọc và độ tin cậy của nó . Không giống như thông tin hỗn loạn có sẵn trực tuyến, hồ sơ của chính phủ tuân theo các giao thức chuẩn hóa , trải qua các cuộc kiểm toán thường xuyên và phải đáp ứng các yêu cầu pháp lý về tính chính xác. Mỗi khoản thanh toán An sinh xã hội, yêu cầu Medicare và trợ cấp liên bang đều tạo ra một điểm dữ liệu đã được xác minh về hành vi trong thế giới thực. Dữ liệu này không tồn tại ở bất kỳ nơi nào khác có phạm vi và tính xác thực như vậy tại Hoa Kỳ

Quan trọng nhất, cơ sở dữ liệu của chính phủ theo dõi toàn bộ dân số theo thời gian , không chỉ những người dùng hoạt động kỹ thuật số. Chúng bao gồm những người không bao giờ sử dụng phương tiện truyền thông xã hội, không mua sắm trực tuyến hoặc chủ động tránh các dịch vụ kỹ thuật số. Đối với một công ty AI, điều này có nghĩa là đào tạo các hệ thống về sự đa dạng thực sự của trải nghiệm của con người thay vì chỉ là những phản ánh kỹ thuật số mà mọi người đưa lên trực tuyến.
Lợi thế về mặt kỹ thuật
Các hệ thống AI hiện tại phải đối mặt với những hạn chế cơ bản mà không có lượng dữ liệu nào được thu thập từ internet có thể khắc phục được. Khi ChatGPT hoặc Gemini của Google mắc lỗi, thường là do chúng được đào tạo về thông tin có thể phổ biến nhưng không nhất thiết là đúng . Chúng có thể cho bạn biết mọi người nói gì về tác động của chính sách, nhưng chúng không thể theo dõi những tác động đó trên nhiều nhóm dân số và nhiều năm.

Dữ liệu của chính phủ có thể thay đổi phương trình này. Hãy tưởng tượng việc đào tạo một hệ thống AI không chỉ về ý kiến về chăm sóc sức khỏe mà còn về kết quả điều trị thực tế trên hàng triệu bệnh nhân. Hãy xem xét sự khác biệt giữa việc học hỏi từ các cuộc thảo luận trên mạng xã hội về các chính sách kinh tế và phân tích tác động thực sự của chúng trên các cộng đồng và nhân khẩu học khác nhau trong nhiều thập kỷ.

Một mô hình lớn, hiện đại hoặc tiên tiến được đào tạo trên dữ liệu chính phủ toàn diện có thể hiểu được mối quan hệ thực tế giữa các chính sách và kết quả. Nó có thể theo dõi các hậu quả không mong muốn trên các phân khúc dân số khác nhau, mô hình hóa các hệ thống xã hội phức tạp với xác thực trong thế giới thực và dự đoán tác động của các thay đổi được đề xuất dựa trên bằng chứng lịch sử. Đối với các công ty đang tìm cách xây dựng các hệ thống AI thế hệ tiếp theo, việc truy cập vào dữ liệu này sẽ tạo ra một lợi thế gần như không thể vượt qua.

Kiểm soát các hệ thống quan trọng
Một công ty như xAI có thể làm được nhiều hơn với các mô hình được đào tạo trên dữ liệu của chính phủ so với việc xây dựng các chatbot hoặc trình tạo nội dung tốt hơn. Các hệ thống như vậy về cơ bản có thể chuyển đổi - và có khả năng kiểm soát - cách mọi người hiểu và quản lý các hệ thống xã hội phức tạp. Mặc dù một số khả năng này có thể có lợi dưới sự kiểm soát của các cơ quan công cộng có trách nhiệm, tôi tin rằng chúng gây ra mối đe dọa trong tay một công ty tư nhân duy nhất.

Cơ sở dữ liệu Medicare và Medicaid chứa hồ sơ về các phương pháp điều trị, kết quả và chi phí trên nhiều nhóm dân số khác nhau trong nhiều thập kỷ. Một mô hình biên giới được đào tạo trên dữ liệu chính phủ mới có thể xác định các mô hình điều trị thành công khi những mô hình khác thất bại và do đó thống trị ngành chăm sóc sức khỏe. Một mô hình như vậy có thể hiểu cách các can thiệp khác nhau ảnh hưởng đến các nhóm dân số khác nhau theo thời gian, tính đến các yếu tố như vị trí địa lý, tình trạng kinh tế xã hội và các điều kiện đồng thời.

Một công ty sử dụng mô hình này có thể tác động đến chính sách chăm sóc sức khỏe bằng cách chứng minh khả năng dự đoán vượt trội và hiểu biết sâu sắc về dân số thị trường cho các công ty dược phẩm và công ty bảo hiểm.

Dữ liệu kho bạc có lẽ là giải thưởng có giá trị nhất . Cơ sở dữ liệu tài chính của chính phủ chứa thông tin chi tiết về cách tiền chảy qua nền kinh tế. Bao gồm dữ liệu giao dịch thời gian thực trên các hệ thống thanh toán liên bang, hồ sơ hoàn chỉnh về thanh toán thuế và hoàn thuế, mô hình phân phối phúc lợi chi tiết và thanh toán cho nhà thầu chính phủ với số liệu hiệu suất.

Một công ty AI có quyền truy cập vào dữ liệu này có thể phát triển các khả năng phi thường để dự báo kinh tế và dự đoán thị trường. Nó có thể mô hình hóa các hiệu ứng lan tỏa của những thay đổi về quy định, dự đoán các lỗ hổng kinh tế trước khi chúng trở thành khủng hoảng và tối ưu hóa các chiến lược đầu tư với độ chính xác không thể thực hiện được thông qua các phương pháp truyền thống.
Cơ sở hạ tầng và hệ thống đô thị
Cơ sở dữ liệu của chính phủ chứa thông tin về các mô hình sử dụng cơ sở hạ tầng quan trọng, lịch sử bảo trì, thời gian phản ứng khẩn cấp và tác động phát triển. Mỗi khoản tài trợ của liên bang, kiểm tra cơ sở hạ tầng và phản ứng khẩn cấp đều tạo ra một điểm dữ liệu có thể giúp đào tạo AI để hiểu rõ hơn về cách các thành phố và khu vực hoạt động.

Sức mạnh nằm ở khả năng kết nối tiềm tàng của dữ liệu này . Một hệ thống AI được đào tạo về hồ sơ cơ sở hạ tầng của chính phủ sẽ hiểu được cách thức các mô hình giao thông ảnh hưởng đến việc sử dụng năng lượng, cách thức các chính sách nhà ở ảnh hưởng đến thời gian phản ứng khẩn cấp và cách thức đầu tư cơ sở hạ tầng ảnh hưởng đến sự phát triển kinh tế trên khắp các khu vực.

Một công ty tư nhân có quyền truy cập độc quyền sẽ có được cái nhìn sâu sắc độc đáo về các động mạch vật lý và kinh tế của xã hội Mỹ. Điều này có thể cho phép công ty phát triển các hệ thống "thành phố thông minh" mà chính quyền thành phố sẽ phụ thuộc vào, về cơ bản là tư nhân hóa các khía cạnh của quản trị đô thị. Khi kết hợp với dữ liệu thời gian thực từ các nguồn tư nhân, khả năng dự đoán sẽ vượt xa những gì bất kỳ hệ thống hiện tại nào có thể đạt được.

Dữ liệu tuyệt đối làm hỏng tuyệt đối
Một công ty như xAI, với nguồn lực của Musk và quyền truy cập ưu tiên thông qua DOGE, có thể vượt qua các trở ngại về kỹ thuật và chính trị dễ dàng hơn nhiều so với các đối thủ cạnh tranh. Những tiến bộ gần đây trong học máy cũng đã giảm bớt gánh nặng chuẩn bị dữ liệu để các thuật toán xử lý, biến dữ liệu của chính phủ thành một mỏ vàng thực sự - một mỏ vàng thuộc về người dân Mỹ.

Mối đe dọa từ một công ty tư nhân truy cập dữ liệu của chính phủ vượt xa mối lo ngại về quyền riêng tư của cá nhân. Ngay cả khi đã xóa thông tin nhận dạng cá nhân, một hệ thống AI phân tích các mẫu trên hàng triệu hồ sơ của chính phủ có thể cho phép các khả năng đáng ngạc nhiên trong việc đưa ra dự đoán và tác động đến hành vi ở cấp độ dân số. Mối đe dọa là các hệ thống AI tận dụng dữ liệu của chính phủ để tác động đến xã hội, bao gồm cả kết quả bầu cử.

Vì thông tin là sức mạnh, việc tập trung dữ liệu chưa từng có vào tay một thực thể tư nhân có chương trình nghị sự chính trị rõ ràng là một thách thức sâu sắc đối với nền cộng hòa. Tôi tin rằng câu hỏi đặt ra là liệu người dân Mỹ có thể chống lại được nạn tham nhũng có khả năng phá vỡ nền dân chủ mà sự tập trung như vậy có thể gây ra hay không. Nếu không, người Mỹ nên chuẩn bị trở thành chủ thể kỹ thuật số thay vì công dân con người.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top