Làm sao sinh viên Đại học Thanh Hoa, từng từ chối DeepSeek, lại trở thành người đứng sau hạ tầng cốt lõi của ChatGPT?

Trường Sơn · 21/01/2026

Weng Jiayi là một kỹ sư người Trung Quốc, hiện làm việc tại OpenAI và là một trong những người trực tiếp tham gia xây dựng hệ thống huấn luyện cho GPT-3.5, GPT-4 và các thế hệ tiếp theo. Trong một podcast dài hơn hai giờ, lần đầu tiên anh kể lại toàn bộ hành trình của mình, từ một học sinh tỉnh lẻ ở Phúc Kiến đến vị trí “người bán xẻng” quan trọng bậc nhất trong guồng máy AI của OpenAI.

Anh tự gọi mình là “người bán xẻng tiếp xúc với khách hàng nhiều nhất”. Ý anh rất rõ: không phải người nghĩ ra ý tưởng, cũng không phải người đứng trên sân khấu, mà là người xây nền móng kỹ thuật để hàng trăm nhà nghiên cứu phía trên có thể thử nghiệm, sai, sửa và lặp lại với tốc độ cao. Nếu hạ tầng không ổn, mọi ý tưởng đều vô nghĩa.

Tại OpenAI, hầu như mỗi lần có mô hình lớn ra mắt, tên của Weng Jiayi đều xuất hiện trong danh sách phát hành. Lý do đơn giản: toàn bộ hệ thống hậu huấn luyện, đặc biệt là RLHF, đều chạy trên hạ tầng do anh phụ trách. Không có nó, ChatGPT không thể vận hành theo cách người dùng đang thấy hôm nay.

Anh không đến với AI theo con đường “hào nhoáng”. Thời trung học, Weng Jiayi là dân Olympic Tin học. Năm đó, cả đội tuyển tỉnh Phúc Kiến chỉ giành được đúng một huy chương đồng, và người giành được nó chính là anh. Nhờ thành tích này, anh được tuyển thẳng vào Đại học Thanh Hoa. Anh gọi đó là một chiến thắng rất sít sao.

Vào đại học, thay vì giữ kín tài liệu như nhiều sinh viên khác, anh công khai toàn bộ bài tập, đề cũ và ghi chú học tập lên GitHub. Lý do rất đơn giản: anh ghét bất đối xứng thông tin. Anh từng đùa rằng, sinh viên có thể không biết ai quyên tiền xây tòa nhà, nhưng chắc chắn biết anh là ai vì “ai cũng từng dùng bài tập của tôi”.

Anh bén duyên với học tăng cường một cách khá tình cờ, ban đầu tưởng là làm xử lý ảnh, hóa ra là… huấn luyện AI chơi game. Càng làm, anh càng nhận ra một vấn đề lớn: không phải thuật toán quá kém, mà là hạ tầng thử nghiệm quá tệ. Môi trường rối rắm, chỉ số đánh giá mù mờ, điều chỉnh tham số giống như luyện đan, dựa vào kinh nghiệm nhiều hơn khoa học.

Từ đó, anh chuyển hẳn sang xây công cụ. Trong kỳ nghỉ Tết năm 2020, anh viết TianShou, một framework học tăng cường gọn nhẹ, dễ dùng, dễ sửa, tập trung vào nhu cầu thật của người làm nghiên cứu. Dự án này nhanh chóng được cộng đồng sử dụng rộng rãi. Song song, anh còn làm “Tuixue Online”, một công cụ theo dõi lịch hẹn visa theo thời gian thực, từng thu hút hơn 10 triệu lượt truy cập trong thời gian ngắn. Anh gọi hai dự án này là “làm từ thiện”, không kiếm tiền, nhưng mang lại cảm giác rất đã.

Sau đó, anh sang học thạc sĩ tại Đại học Carnegie Mellon, đúng thời điểm đại dịch bùng phát. Việc học từ xa, xin việc khó khăn, áp lực so sánh với bạn bè khiến anh từng rơi vào giai đoạn nghi ngờ bản thân. Cuối cùng, anh nhận được nhiều lời mời, trong đó có cả DeepSeek, Nvidia, TikTok, Google. Nhưng anh chọn OpenAI.

Lý do rất rõ ràng: anh không muốn làm “nhà giả kim” thử tham số, mà muốn làm kỹ sư hệ thống đúng nghĩa. OpenAI và DeepMind khi đó là hai nơi hiếm hoi coi học tăng cường là một bài toán công nghiệp, không phải đồ chơi phòng thí nghiệm.

Anh được John Schulman, đồng sáng lập OpenAI, trực tiếp phỏng vấn và tuyển dụng. Bài test chỉ có một câu hỏi mở, cho ba giờ. Anh làm xong trong hai giờ và sửa được lỗi ngay tại chỗ. Anh tin rằng điều khiến Schulman gật đầu không phải là bằng cấp, mà là GitHub.

Tại OpenAI, anh chứng kiến sự ra đời của ChatGPT từ hậu trường. Trước ngày ra mắt, hệ thống RLHF do anh xây đã được dùng để huấn luyện hàng loạt mô hình. Ngày ChatGPT bùng nổ, máy chủ liên tục quá tải. Với anh, đó là khoảnh khắc xác nhận: hướng đi này là đúng.

Anh cho rằng lý do OpenAI thành công không phải vì thiên tài cá nhân, mà vì hai thứ: tốc độ lặp lại cực cao và ban lãnh đạo thật sự hiểu công nghệ. Sam Altman hiểu nguồn lực, Greg Brockman hiểu từng module kỹ thuật. Với anh, quản lý công ty giống như quản lý mã nguồn: chỉ cần lệch một chỗ, cả hệ thống sẽ khập khiễng.

Về tranh cãi “OpenAI có còn mở không”, anh nhìn rất thực tế. Mở không có nghĩa là tung hết mã nguồn. Mở là làm cho công cụ mạnh trở nên dễ dùng với người bình thường. ChatGPT miễn phí, có giọng nói, theo anh, còn “mở” hơn việc ném cho cộng đồng một đống trọng số mà không ai dùng được.

Anh không tin AI sẽ sớm thay thế con người. Theo anh, quá trình đó sẽ rất chậm. Thứ khó nhất không phải ý tưởng, mà là thực thi ổn định trong thời gian dài. Nếu OpenAI tránh được việc tự bắn vào chân mình, thế là đủ.

Khi được hỏi về tương lai, anh không đưa ra kế hoạch lớn. Anh chỉ nói mình muốn tiếp tục đầu tư vào tương lai, giữ quyền lựa chọn, và làm những thứ có ích thật sự. Anh thừa nhận: trước đây từng nghĩ mình biết rõ mình muốn gì, nhưng càng đi xa, câu hỏi đó càng mở.

Và có lẽ, chính sự không chắc chắn đó mới là động lực khiến anh tiếp tục xây những “cái xẻng” mà cả thế giới AI đang dùng mỗi ngày.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Làm sao sinh viên Đại học Thanh Hoa, từng từ chối DeepSeek, lại trở thành người đứng sau hạ tầng cốt lõi của ChatGPT?

Trường Sơn

Writer

Trường Sơn

Sốc: YouTube đã xóa các kênh có video AI với tổng lượt xem hơn 4,7 tỷ lượt!

Từ ngày 1/6/2026, ngoài xăng E10, người dùng xe còn lựa chọn nào khác?

Lợn hoang tại vùng phóng xạ hạt nhân Fukushima Nhật Bản trở thành "X-Lợn", đẻ ngày càng nhiều

Toki Thành Thỏ dùng AI chế ảnh gì mà vừa phải xin lỗi dài như sớ?

CHẤM DỨT KỶ NGUYÊN "XÀI CHÙA" TIN BÀI: NGHỊ ĐỊNH 174/2026 VÀ BƯỚC TIẾN BẢO VỆ NỀN BÁO CHÍ MINH BẠCH

Chẳng riêng gì Việt Nam: Đến Châu Âu cũng "quay cuồng" vì nóng, London ghi nhận nóng nhất thế kỷ

1,3 tỷ mật khẩu bị rò rỉ, đẩy hàng triệu tài khoản trực tuyến vào nguy hiểm

LANDFALL: Biến ảnh gửi qua WhatsApp thành vũ khí tấn công người dùng Samsung

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Top 10 xu hướng tấn công mạng được các hacker 'vô cùng yêu thích' trong năm 2026

Đánh giá nổi bật