Edwin Chen - Từ thiên tài toán học đến ông trùm dữ liệu đứng sau các “gã khổng lồ AI”

Đoàn Thúy Hà
Đoàn Thúy Hà
Phản hồi: 0

Đoàn Thúy Hà

Editor
Thành viên BQT
Ở tuổi 37, Edwin Chen đã đạt được điều mà phần lớn giới công nghệ chỉ dám mơ ước: sở hữu khối tài sản 18 tỷ USD và điều hành một công ty được định giá 240 tỷ USD, tất cả chỉ nhờ một lĩnh vực tưởng chừng bình thường đến tầm thường: dán nhãn dữ liệu.

Trong thời điểm mà những thành tựu AI ngày càng được tôn vinh, khi các mô hình ngôn ngữ lớn như GPT hay Claude chiếm lĩnh sân khấu, ít ai chú ý rằng phía sau ánh đèn đó là một công việc bền bỉ, âm thầm nhưng thiết yếu: xử lý và làm sạch dữ liệu. Edwin Chen chọn ở lại phía sau sân khấu, và chính sự lựa chọn đó đã đưa anh trở thành một trong những doanh nhân công nghệ thành công nhất nước Mỹ.
1760110343530.png

Từ cậu bé trong nhà hàng gia đình đến sinh viên ba chuyên ngành tại MIT

Sinh ra và lớn lên tại thị trấn nhỏ Crystal River, bang Florida, Edwin Chen không xuất phát từ gia đình giàu có hay có nền tảng công nghệ. Bố mẹ anh, những người nhập cư gốc Đài Loan, điều hành một nhà hàng nhỏ mang phong cách Trung–Thái, nơi Chen dành phần lớn tuổi thơ phụ giúp công việc và quan sát khách hàng. Chính trong không gian chật hẹp đầy mùi khói dầu và tiếng va chạm của chén đĩa, một trí tuệ phi thường đã được hình thành.

Không có điều kiện học thêm hay môi trường học thuật lý tưởng, Chen dựa vào chính mình. Khi bạn bè còn học phép cộng, cậu bé đã tự nghiên cứu giải tích. Anh được nhận vào Choate Rosemary Hall, một trong những trường nội trú hàng đầu của Mỹ, nơi từng đào tạo nhiều đời tổng thống và nhà lãnh đạo kinh tế. Ở tuổi 17, anh đỗ vào Học viện Công nghệ Massachusetts (MIT), không chỉ theo đuổi một chuyên ngành mà cùng lúc ba lĩnh vực: toán học, khoa học máy tính và ngôn ngữ học.

Ba ngành học tưởng chừng không liên quan lại tạo nên một nền tảng lý tưởng: khả năng tư duy logic, hiểu sâu về cấu trúc dữ liệu và sự nhạy cảm với ngôn ngữ. Về sau, chính sự giao thoa này đã trở thành lợi thế cạnh tranh độc nhất giúp Chen nhận ra điều mà cả ngành AI đã bỏ quên.

Một lỗ hổng lớn trong ngành AI, và người duy nhất nhìn thấy nó

Sau khi rời MIT, Chen không khởi nghiệp ngay mà trải qua thời gian làm việc tại một quỹ đầu cơ hàng đầu Phố Wall và sau đó là các vị trí tại Twitter, Google và Facebook. Tại đây, anh phụ trách những dự án quan trọng liên quan đến tối ưu hóa mô hình AI và xử lý dữ liệu lớn.

Chính trong môi trường tưởng như hoàn hảo ấy, Chen nhận ra một nghịch lý: các công ty công nghệ sẵn sàng đầu tư hàng tỷ USD để phát triển mô hình AI, nhưng lại coi nhẹ giai đoạn quan trọng nhất, dữ liệu đầu vào. Trong một dự án, nhóm của anh cần gắn nhãn khoảng 50.000 đoạn văn. Dù mất tới nửa năm và sử dụng một đơn vị gia công lớn, kết quả cuối cùng vẫn không thể sử dụng: các từ lóng, tiếng lóng mạng và thẻ tag bị dán nhãn sai hoàn toàn. Mô hình không thể học được gì từ dữ liệu nhiễu đó.

Khi cả thế giới đổ xô làm chip, mô hình, thuật toán, Chen lựa chọn lặng lẽ đi vào phần nền móng bị coi nhẹ nhất: dữ liệu. Anh hiểu rằng một mô hình AI dù tiên tiến đến đâu cũng sẽ vô dụng nếu được "nuôi dưỡng" bằng dữ liệu sai.

Surge AI: Bắt đầu từ căn hộ nhỏ, vươn đến đỉnh cao ngành dữ liệu
1760110333419.png

Năm 2020, Edwin Chen đưa ra quyết định táo bạo nhất trong sự nghiệp. Anh rời bỏ vị trí lãnh đạo tại Big Tech, không gọi vốn, không chuẩn bị chiến lược truyền thông hay bài thuyết trình đầu tư, mà bắt đầu công ty mới của mình từ một căn hộ nhỏ tại San Francisco. Tên công ty là Surge AI. Mục tiêu: xây dựng nền tảng gắn nhãn dữ liệu chất lượng cao nhất thế giới.

Thay vì chạy theo xu hướng chi phí thấp và quy mô lớn, Surge AI tập trung vào những bài toán phức tạp nhất: dữ liệu ngôn ngữ có sắc thái, văn hóa, đạo đức, thậm chí pháp lý. Dữ liệu về lời nói thù ghét, ngôn ngữ nhạy cảm, y khoa, luật, những thứ mà ngay cả AI hiện đại cũng dễ nhầm lẫn, lại chính là chuyên môn mà Surge theo đuổi.

Trong thời gian đầu, Chen một mình đảm nhiệm mọi vai trò, từ CEO đến lập trình viên, nhân viên hỗ trợ kỹ thuật, bán hàng và chăm sóc khách hàng. Khách hàng đầu tiên đến hoàn toàn tình cờ, sau một buổi trò chuyện trên đường leo núi với một giám đốc công nghệ. Khi biết về khả năng gắn nhãn chính xác mà Surge đang phát triển, đối phương lập tức đồng ý dùng thử, và không lâu sau trở thành khách hàng chính thức.

Sản phẩm đầu tiên của Surge ra mắt trong vòng một tháng. Chưa đầy một năm sau, công ty đã đạt doanh thu hàng chục triệu USD, trước khi bước vào giai đoạn tăng trưởng phi mã cùng với sự bùng nổ của các mô hình ngôn ngữ lớn như ChatGPT hay Claude.

Khi các “ông lớn” AI đều phải dùng chung một cổng dữ liệu

Surge AI không xây dựng mô hình AI, không phát triển chip xử lý. Nhưng bất kỳ mô hình AI tiên tiến nào, từ OpenAI đến Anthropic, Google đến Microsoft, đều cần dữ liệu được xử lý qua Surge.

Ngày nay, danh sách khách hàng của công ty bao gồm gần như toàn bộ những tên tuổi lớn nhất trong ngành: OpenAI, Anthropic, Google, Microsoft, Meta. Một công ty trong số đó được cho là đã chi hơn 150 triệu USD chỉ trong một năm để mua dịch vụ gắn nhãn toàn diện của Surge.

Điều đáng nói là Surge AI đạt được tất cả điều đó mà không cần nhận bất kỳ khoản đầu tư bên ngoài nào. Chen sử dụng vốn cá nhân để duy trì công ty, và đến nay vẫn giữ khoảng 75% cổ phần, tương đương 18 tỷ USD, đưa anh trở thành một trong những tỷ phú công nghệ trẻ nhất nước Mỹ.

Không dừng lại ở đỉnh cao: Dán nhãn bằng AI và tham vọng đa ngành

Chen không giấu tham vọng đưa Surge AI tiến xa hơn nữa. Theo kế hoạch, công ty sẽ phát triển các công cụ dán nhãn bán tự động sử dụng chính AI để hỗ trợ con người, giảm đáng kể thời gian và chi phí xử lý dữ liệu. Đây không chỉ là cải tiến vận hành, mà còn là bước đi chiến lược để chiếm lĩnh các lĩnh vực đặc thù như chăm sóc y tế, pháp luật, xe tự lái, nơi đòi hỏi độ chính xác dữ liệu gần như tuyệt đối.

Trong thế giới AI đang phát triển với tốc độ chưa từng có, Edwin Chen không tạo ra thuật toán thông minh nhất, cũng không chế tạo con chip nhanh nhất. Nhưng anh đã làm điều mà ít ai nghĩ đến: tạo ra chuẩn mực mới cho dữ liệu đầu vào, thứ duy trì sự sống cho cả một ngành công nghệ.

Giữa những làn sóng AI, khi người người nói về mô hình, token và inference, Edwin Chen lặng lẽ khẳng định rằng: đôi khi, tương lai được xây dựng không phải bằng những công nghệ hào nhoáng, mà bắt đầu từ việc nhìn thấy những gì người khác bỏ qua.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2Vkd2luLWNoZW4tdHUtdGhpZW4tdGFpLXRvYW4taG9jLWRlbi1vbmctdHJ1bS1kdS1saWV1LWR1bmctc2F1LWNhYy1nYS1raG9uZy1sby1haS43MTAyNC8=
Top