Làm sao sinh viên Đại học Thanh Hoa, từng từ chối DeepSeek, lại trở thành người đứng sau hạ tầng cốt lõi của ChatGPT?

Trường Sơn
Trường Sơn
Phản hồi: 0
Weng Jiayi là một kỹ sư người Trung Quốc, hiện làm việc tại OpenAI và là một trong những người trực tiếp tham gia xây dựng hệ thống huấn luyện cho GPT-3.5, GPT-4 và các thế hệ tiếp theo. Trong một podcast dài hơn hai giờ, lần đầu tiên anh kể lại toàn bộ hành trình của mình, từ một học sinh tỉnh lẻ ở Phúc Kiến đến vị trí “người bán xẻng” quan trọng bậc nhất trong guồng máy AI của OpenAI.

Anh tự gọi mình là “người bán xẻng tiếp xúc với khách hàng nhiều nhất”. Ý anh rất rõ: không phải người nghĩ ra ý tưởng, cũng không phải người đứng trên sân khấu, mà là người xây nền móng kỹ thuật để hàng trăm nhà nghiên cứu phía trên có thể thử nghiệm, sai, sửa và lặp lại với tốc độ cao. Nếu hạ tầng không ổn, mọi ý tưởng đều vô nghĩa.
1768989437642.png

Tại OpenAI, hầu như mỗi lần có mô hình lớn ra mắt, tên của Weng Jiayi đều xuất hiện trong danh sách phát hành. Lý do đơn giản: toàn bộ hệ thống hậu huấn luyện, đặc biệt là RLHF, đều chạy trên hạ tầng do anh phụ trách. Không có nó, ChatGPT không thể vận hành theo cách người dùng đang thấy hôm nay.

Anh không đến với AI theo con đường “hào nhoáng”. Thời trung học, Weng Jiayi là dân Olympic Tin học. Năm đó, cả đội tuyển tỉnh Phúc Kiến chỉ giành được đúng một huy chương đồng, và người giành được nó chính là anh. Nhờ thành tích này, anh được tuyển thẳng vào Đại học Thanh Hoa. Anh gọi đó là một chiến thắng rất sít sao.

Vào đại học, thay vì giữ kín tài liệu như nhiều sinh viên khác, anh công khai toàn bộ bài tập, đề cũ và ghi chú học tập lên GitHub. Lý do rất đơn giản: anh ghét bất đối xứng thông tin. Anh từng đùa rằng, sinh viên có thể không biết ai quyên tiền xây tòa nhà, nhưng chắc chắn biết anh là ai vì “ai cũng từng dùng bài tập của tôi”.

Anh bén duyên với học tăng cường một cách khá tình cờ, ban đầu tưởng là làm xử lý ảnh, hóa ra là… huấn luyện AI chơi game. Càng làm, anh càng nhận ra một vấn đề lớn: không phải thuật toán quá kém, mà là hạ tầng thử nghiệm quá tệ. Môi trường rối rắm, chỉ số đánh giá mù mờ, điều chỉnh tham số giống như luyện đan, dựa vào kinh nghiệm nhiều hơn khoa học.

Từ đó, anh chuyển hẳn sang xây công cụ. Trong kỳ nghỉ Tết năm 2020, anh viết TianShou, một framework học tăng cường gọn nhẹ, dễ dùng, dễ sửa, tập trung vào nhu cầu thật của người làm nghiên cứu. Dự án này nhanh chóng được cộng đồng sử dụng rộng rãi. Song song, anh còn làm “Tuixue Online”, một công cụ theo dõi lịch hẹn visa theo thời gian thực, từng thu hút hơn 10 triệu lượt truy cập trong thời gian ngắn. Anh gọi hai dự án này là “làm từ thiện”, không kiếm tiền, nhưng mang lại cảm giác rất đã.

Sau đó, anh sang học thạc sĩ tại Đại học Carnegie Mellon, đúng thời điểm đại dịch bùng phát. Việc học từ xa, xin việc khó khăn, áp lực so sánh với bạn bè khiến anh từng rơi vào giai đoạn nghi ngờ bản thân. Cuối cùng, anh nhận được nhiều lời mời, trong đó có cả DeepSeek, Nvidia, TikTok, Google. Nhưng anh chọn OpenAI.

Lý do rất rõ ràng: anh không muốn làm “nhà giả kim” thử tham số, mà muốn làm kỹ sư hệ thống đúng nghĩa. OpenAI và DeepMind khi đó là hai nơi hiếm hoi coi học tăng cường là một bài toán công nghiệp, không phải đồ chơi phòng thí nghiệm.

Anh được John Schulman, đồng sáng lập OpenAI, trực tiếp phỏng vấn và tuyển dụng. Bài test chỉ có một câu hỏi mở, cho ba giờ. Anh làm xong trong hai giờ và sửa được lỗi ngay tại chỗ. Anh tin rằng điều khiến Schulman gật đầu không phải là bằng cấp, mà là GitHub.

Tại OpenAI, anh chứng kiến sự ra đời của ChatGPT từ hậu trường. Trước ngày ra mắt, hệ thống RLHF do anh xây đã được dùng để huấn luyện hàng loạt mô hình. Ngày ChatGPT bùng nổ, máy chủ liên tục quá tải. Với anh, đó là khoảnh khắc xác nhận: hướng đi này là đúng.

Anh cho rằng lý do OpenAI thành công không phải vì thiên tài cá nhân, mà vì hai thứ: tốc độ lặp lại cực cao và ban lãnh đạo thật sự hiểu công nghệ. Sam Altman hiểu nguồn lực, Greg Brockman hiểu từng module kỹ thuật. Với anh, quản lý công ty giống như quản lý mã nguồn: chỉ cần lệch một chỗ, cả hệ thống sẽ khập khiễng.

Về tranh cãi “OpenAI có còn mở không”, anh nhìn rất thực tế. Mở không có nghĩa là tung hết mã nguồn. Mở là làm cho công cụ mạnh trở nên dễ dùng với người bình thường. ChatGPT miễn phí, có giọng nói, theo anh, còn “mở” hơn việc ném cho cộng đồng một đống trọng số mà không ai dùng được.

Anh không tin AI sẽ sớm thay thế con người. Theo anh, quá trình đó sẽ rất chậm. Thứ khó nhất không phải ý tưởng, mà là thực thi ổn định trong thời gian dài. Nếu OpenAI tránh được việc tự bắn vào chân mình, thế là đủ.

Khi được hỏi về tương lai, anh không đưa ra kế hoạch lớn. Anh chỉ nói mình muốn tiếp tục đầu tư vào tương lai, giữ quyền lựa chọn, và làm những thứ có ích thật sự. Anh thừa nhận: trước đây từng nghĩ mình biết rõ mình muốn gì, nhưng càng đi xa, câu hỏi đó càng mở.

Và có lẽ, chính sự không chắc chắn đó mới là động lực khiến anh tiếp tục xây những “cái xẻng” mà cả thế giới AI đang dùng mỗi ngày.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2xhbS1zYW8tc2luaC12aWVuLWRhaS1ob2MtdGhhbmgtaG9hLXR1bmctdHUtY2hvaS1kZWVwc2Vlay1sYWktdHJvLXRoYW5oLW5ndW9pLWR1bmctc2F1LWhhLXRhbmctY290LWxvaS1jdWEtY2hhdGdwdC43NzgxNC8=
Top