AI: rất nhiều công việc phải triển khai đằng sau trí tuệ nhân tạo

Vài tháng sau khi tốt nghiệp đại học ở Nairobi, một thanh niên 30 tuổi mà tôi tạm gọi là Joe đã nhận được công việc là một người chú thích — công việc tẻ nhạt là xử lý thông tin thô dùng để đào tạo trí tuệ nhân tạo.
AI: rất nhiều công việc phải triển khai đằng sau trí tuệ nhân tạo
AI học bằng cách tìm các mẫu trong lượng dữ liệu khổng lồ, nhưng trước tiên, dữ liệu đó phải được con người sắp xếp và gắn thẻ, một lực lượng lao động khổng lồ chủ yếu ẩn sau máy móc. Trong trường hợp của Joe, anh ấy đang dán nhãn cảnh quay cho ô tô tự lái — xác định mọi phương tiện, người đi bộ, người đi xe đạp, bất kỳ thứ gì mà người lái xe cần biết — từng khung hình và từ mọi góc máy quay có thể. Đó là công việc khó khăn và lặp đi lặp lại. Một đoạn phim dài vài giây mất tám giờ để chú thích, Joe được trả khoảng 10 đô la.
Sau đó, vào năm 2019, một cơ hội đã nảy sinh: Joe có thể kiếm được gấp bốn lần khi chạy một chương trình đào tạo về chú thích cho một công ty mới đang khao khát những người gắn nhãn. Cứ hai tuần một lần, 50 tân binh sẽ nộp đơn vào một tòa nhà văn phòng ở Nairobi để bắt đầu học việc. Dường như có nhu cầu vô hạn đối với công việc. Họ sẽ được yêu cầu phân loại quần áo nhìn thấy trong ảnh tự chụp trước gương, nhìn qua mắt của robot hút bụi để xác định xem họ đang ở trong phòng nào và vẽ các hình vuông xung quanh ảnh quét của xe máy. Hơn một nửa số học sinh của Joe thường bỏ học trước khi chương trình đào tạo kết thúc. “Một số người không biết làm thế nào để ở một chỗ lâu,” anh ấy giải thích với một cách nói lịch sự. Ngoài ra, anh ấy thừa nhận, "nó rất nhàm chán."
Nhưng đó là một công việc ở một nơi khan hiếm việc làm, và Joe đã đào tạo ra hàng trăm sinh viên tốt nghiệp. Sau chương trình đào tạo, họ về nhà làm việc một mình trong phòng ngủ và nhà bếp, bị cấm nói cho bất kỳ ai biết họ đang làm gì, điều này thực sự không thành vấn đề vì họ hiếm khi biết về bản thân. Việc dán nhãn các đối tượng cho ô tô tự lái là điều hiển nhiên, nhưng còn việc phân loại xem các đoạn đối thoại bị bóp méo do rô-bốt hay con người nói ra thì sao? Tải lên những bức ảnh bạn nhìn chằm chằm vào webcam với vẻ mặt trống rỗng, sau đó cười toe toét, sau đó đội mũ bảo hiểm xe máy? Mỗi dự án là một thành phần nhỏ của một số quy trình lớn hơn nên rất khó để nói họ thực sự đang đào tạo AI để làm gì. Tên của các dự án cũng không cung cấp bất kỳ manh mối nào: Crab Generation, Whale Segment, Woodland Gyro và Pillbox Bratwurst. Chúng là tên mã không theo trình tự cho công việc không theo trình tự.
Đối với công ty tuyển dụng họ, hầu hết chỉ biết đến nó với cái tên Remotasks, một trang web cung cấp công việc cho bất kỳ ai thông thạo tiếng Anh. Giống như hầu hết các chú thích mà tôi đã nói chuyện, Joe không hề hay biết cho đến khi tôi nói với anh ấy rằng Remotasks là công ty con hướng tới công nhân của một công ty có tên là Scale AI, một nhà cung cấp dữ liệu trị giá hàng tỷ đô la ở Thung lũng Silicon, coi OpenAI và quân đội Hoa Kỳ là khách hàng của họ. Cả trang web của Remotasks hay Scale đều không đề cập đến trang web kia.
Phần lớn phản ứng của công chúng đối với các mô hình ngôn ngữ như ChatGPT của OpenAI đã tập trung vào tất cả các công việc mà chúng có vẻ sẵn sàng tự động hóa. Nhưng đằng sau cả hệ thống AI ấn tượng nhất là con người — một số lượng lớn người dán nhãn dữ liệu để huấn luyện và làm rõ dữ liệu khi bị nhầm lẫn. Chỉ những công ty có đủ khả năng mua dữ liệu này mới có thể cạnh tranh và những công ty có được dữ liệu đó có động lực cao để giữ bí mật. Kết quả là, với một vài ngoại lệ, người ta biết rất ít về thông tin định hình hành vi của các hệ thống này và thậm chí còn ít thông tin hơn về những người thực hiện việc định hình.
Đối với các sinh viên của Joe, đó là công việc bị tước bỏ mọi thứ thông thường: lịch trình, đồng nghiệp, kiến
thức về những gì họ đang làm hoặc họ đang làm việc cho ai. Trên thực tế, họ hiếm khi gọi đó là công việc - chỉ là “nhiệm vụ”. Họ là những người làm nhiệm vụ.
Nhà nhân chủng học David Graeber định nghĩa “những công việc nhảm nhí” là việc làm không có ý nghĩa hay mục đích, công việc lẽ ra phải được tự động hóa nhưng vì lý do quan liêu, địa vị hoặc quán tính thì không. Những công việc AI này là cặp song sinh kỳ lạ của chúng: công việc mà mọi người muốn tự động hóa và thường nghĩ rằng đã được tự động hóa, nhưng vẫn cần có sự thay thế của con người. Các công việc có một mục đích; chỉ là công nhân thường không biết nó là gì.
Sự bùng nổ AI hiện nay — những chatbot nghe có vẻ giống con người một cách thuyết phục, tác phẩm nghệ thuật có thể được tạo ra từ những gợi ý đơn giản và mức định giá hàng tỷ đô la của các công ty đứng sau những công nghệ này — đã bắt đầu với một kỳ tích chưa từng có về lao động tẻ nhạt và lặp đi lặp lại.
Năm 2007, nhà nghiên cứu AI Fei-Fei Li, khi đó là giáo sư tại Princeton, đã nghi ngờ chìa khóa để cải thiện mạng thần kinh nhận dạng hình ảnh, một phương pháp học máy đã mòn mỏi trong nhiều năm, là đào tạo trên nhiều dữ liệu hơn - hàng triệu hình ảnh được dán nhãn. chứ không phải hàng chục ngàn. Vấn đề là phải mất nhiều thập kỷ và hàng triệu đô la để nhóm sinh viên chưa tốt nghiệp của cô dán nhãn cho nhiều bức ảnh đó.
Li đã tìm được hàng nghìn công nhân trên Mechanical Turk, nền tảng cung cấp dịch vụ cộng đồng của Amazon, nơi mọi người trên khắp thế giới hoàn thành các nhiệm vụ nhỏ với giá rẻ. Tập dữ liệu có chú thích thu được, được gọi là ImageNet, đã tạo ra những bước đột phá trong học máy giúp hồi sinh lĩnh vực này và mở ra một thập kỷ tiến bộ.
Chú thích vẫn là một phần cơ bản của việc tạo ra AI, nhưng các kỹ sư thường có cảm giác rằng đó là một điều kiện tiên quyết tạm thời, bất tiện đối với công việc xây dựng mô hình hấp dẫn hơn. Bạn thu thập càng nhiều dữ liệu được gắn nhãn càng tốt để đào tạo mô hình của mình với giá rẻ nhất có thể và nếu nó hoạt động, ít nhất là trên lý thuyết, thì bạn không còn cần đến các chú thích nữa. Nhưng chú thích không bao giờ thực sự kết thúc. Các hệ thống máy học được các nhà nghiên cứu gọi là "dễ gãy", dễ bị lỗi khi gặp phải thứ gì đó không được thể hiện tốt trong dữ liệu đào tạo của họ. Những thất bại này, được gọi là "trường hợp cạnh", có thể gây ra hậu quả nghiêm trọng. Vào năm 2018, một chiếc xe thử nghiệm tự lái của Uber đã giết chết một phụ nữ vì mặc dù được lập trình để tránh người đi xe đạp và người đi bộ, nhưng nó không biết phải làm gì khi có người đi xe đạp băng qua đường. Càng nhiều hệ thống AI được đưa ra thế giới để cung cấp tư vấn pháp lý và trợ giúp y tế, chúng sẽ càng gặp phải nhiều trường hợp khó khăn hơn và càng cần nhiều con người hơn để giải quyết chúng. Hiện tại, điều này đã tạo ra một ngành công nghiệp toàn cầu được điều hành bởi những người như Joe, những người sử dụng khả năng đặc biệt của con người để hỗ trợ máy móc.
Trong sáu tháng qua, tôi đã nói chuyện với hơn hai chục người chú thích từ khắp nơi trên thế giới và trong khi nhiều người trong số họ đang đào tạo các chatbot tiên tiến, thì cũng như nhiều người đang làm công việc thủ công thông thường cần thiết để duy trì hoạt động của AI. Có những người phân loại nội dung cảm xúc của video TikTok, các biến thể mới của thư rác email và mức độ khiêu khích tình dục chính xác của quảng cáo trực tuyến. Những người khác đang xem xét các giao dịch thẻ tín dụng và tìm hiểu xem chúng liên quan đến loại mua hàng nào hoặc kiểm tra các đề xuất thương mại điện tử và quyết định xem chiếc áo sơ mi đó có thực sự là thứ bạn có thể thích sau khi mua chiếc áo sơ mi kia hay không. Con người đang sửa chữa các chatbot dịch vụ khách hàng, lắng nghe các yêu cầu của Alexa và phân loại cảm xúc của mọi người trong các cuộc gọi điện video. Họ đang dán nhãn thực phẩm để tủ lạnh thông minh không bị nhầm lẫn bởi bao bì mới, kiểm tra camera an ninh tự động trước khi phát âm thanh báo động và xác định ngô cho máy kéo tự động có vách ngăn.
Sonam Jindal, trưởng nhóm nghiên cứu và chương trình của Tổ chức đối tác phi lợi nhuận về AI cho biết: “Có cả một chuỗi cung ứng. “Nhận thức chung trong ngành là công việc này không phải là một phần quan trọng của quá trình phát triển và sẽ không cần thiết lâu dài. Tất cả sự phấn khích đều xoay quanh việc xây dựng trí thông minh nhân tạo và một khi chúng tôi xây dựng nó, nó sẽ không còn cần thiết nữa, vậy tại sao phải nghĩ về nó? Nhưng đó là cơ sở hạ tầng cho AI. Trí thông minh của con người là nền tảng của trí tuệ nhân tạo và chúng ta cần coi đây là những công việc thực sự trong nền kinh tế AI sẽ tồn tại trong một thời gian.”
Các nhà cung cấp dữ liệu đằng sau những cái tên quen thuộc như OpenAI, Google và Microsoft có nhiều dạng khác nhau. Có những công ty gia công phần mềm tư nhân có văn phòng giống như trung tâm cuộc gọi, chẳng hạn như CloudFactory có trụ sở tại Kenya và Nepal, nơi Joe đã chú thích với giá 1,2 đô la một giờ trước khi chuyển sang Remotasks. Ngoài ra còn có các trang web "làm việc cộng đồng" như Mechanical Turk và Clickworker, nơi mọi người có thể đăng ký để thực hiện các nhiệm vụ. Ở giữa là các dịch vụ như Scale AI. Bất cứ ai cũng có thể đăng ký, nhưng mọi người đều phải vượt qua các kỳ thi kiểm tra trình độ, các khóa đào tạo và trải qua quá trình giám sát hiệu suất. Chú thích là kinh doanh lớn. Scale, được thành lập vào năm 2016 bởi Alexandr Wang, lúc đó 19 tuổi, được định giá vào năm 2021 ở mức 7,3 tỷ đô la, khiến anh được Forbes gọi là “tỷ phú tự thân trẻ nhất”, mặc dù tạp chí này đã lưu ý trong một hồ sơ gần đây rằng cổ phần của anh có giảm trên thị trường thứ cấp kể từ đó.
Chuỗi cung ứng rối rắm này cố tình khó lập bản đồ. Theo những người trong ngành, các công ty mua dữ liệu yêu cầu bảo mật nghiêm ngặt. (Đây là lý do Scale trích dẫn để giải thích tại sao Remotasks có tên khác.) Chú thích tiết lộ quá nhiều về các hệ thống đang được phát triển và số lượng công nhân khổng lồ cần thiết khiến việc rò rỉ khó ngăn chặn. Những người chú thích được cảnh báo nhiều lần không được nói với bất kỳ ai về công việc của họ, kể cả bạn bè và đồng nghiệp của họ, nhưng bí danh công ty, tên mã dự án và điều quan trọng là sự phân công lao động khắc nghiệt đảm bảo họ không có đủ thông tin về họ để nói chuyện ngay cả khi họ muốn. (Hầu hết công nhân đều yêu cầu bút danh vì sợ bị loại khỏi nền tảng.) Do đó, không có ước tính chi tiết về số lượng người làm công việc chú thích, nhưng con số này rất nhiều và đang tăng lên. Một bài báo Nghiên cứu gần đây của Google đã đưa ra một con số theo thứ tự cường độ là “triệu” với khả năng trở thành “tỷ”.
Tự động hóa thường diễn ra theo những cách không ngờ tới. Erik Duhaime, Giám đốc điều hành của công ty chú thích dữ liệu y tế Centaur Labs, nhớ lại cách đây vài năm, các kỹ sư máy học nổi tiếng đã dự đoán AI sẽ khiến công việc của bác sĩ X quang trở nên lỗi thời. Khi điều đó không xảy ra, sự khôn ngoan thông thường đã chuyển sang các bác sĩ X quang sử dụng AI làm công cụ. Cả hai điều đó đều không phải là những gì anh ấy thấy đang xảy ra. Duhaime cho biết, AI rất giỏi trong các nhiệm vụ cụ thể và điều đó dẫn đến việc chia nhỏ và phân phối công việc trên một hệ thống các thuật toán chuyên biệt và cho những con người chuyên biệt như nhau. Ông nói, một hệ thống AI có thể có khả năng phát hiện ra ung thư, đồng thời đưa ra một ví dụ giả định, nhưng chỉ trong một loại hình ảnh nhất định từ một loại máy nhất định; vì vậy, bây giờ, bạn cần một người kiểm tra xem AI có đang được cung cấp đúng loại dữ liệu hay không và có thể một người khác kiểm tra công việc của nó trước khi chuyển nó cho một AI khác viết báo cáo, rồi chuyển cho một người khác, v.v. Ông nói: “AI không thay thế công việc. “Nhưng nó thay đổi cách tổ chức công việc.”
Bạn có thể bỏ lỡ điều này nếu bạn tin rằng AI là một cỗ máy thông minh, biết suy nghĩ. Nhưng nếu bạn kéo bức màn ra sau dù chỉ một chút, thì nó trông quen thuộc hơn, phiên bản mới nhất của sự phân công lao động đặc biệt ở Thung lũng Silicon, trong đó tia sáng tương lai của các công nghệ mới che giấu một bộ máy sản xuất ngổn ngang và những người vận hành nó. Duhaime đã lùi xa hơn để so sánh, một phiên bản kỹ thuật số của quá trình chuyển đổi từ thợ thủ công sang sản xuất công nghiệp: các quy trình nhất quán được chia thành các nhiệm vụ và sắp xếp theo dây chuyền lắp ráp với một số bước do máy móc thực hiện và một số do con người thực hiện nhưng không có bước nào giống với những bước trước đây.
Những lo lắng về sự gián đoạn do AI gây ra thường được phản bác bằng lập luận rằng AI tự động hóa các nhiệm vụ chứ không phải công việc và những nhiệm vụ này sẽ là những nhiệm vụ buồn tẻ, khiến mọi người phải theo đuổi công việc của con người và thỏa mãn hơn. Nhưng rất có thể, sự trỗi dậy của AI sẽ giống như các công nghệ tiết kiệm lao động trong quá khứ, có thể giống như điện thoại hoặc máy đánh chữ, loại bỏ sự vất vả của việc gửi tin nhắn và viết tay nhưng lại tạo ra rất nhiều thư từ, thương mại và giấy tờ mới mà các văn phòng mới phải thuê nhân viên. các loại công nhân mới - thư ký, kế toán, nhân viên đánh máy - được yêu cầu quản lý nó. Khi AI đến với công việc của bạn, bạn có thể không mất nó, nhưng nó có thể trở nên xa lạ hơn, cô lập hơn, tẻ nhạt hơn.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top