Tiểu sử ấn tượng của Lương Văn Phong, nhà sáng lập DeepSeek

Sóng AI
Sóng AI
Phản hồi: 0

Sóng AI

Writer
Y9KK5D59lv0HW9LwNt3C.jpg

  • Liang Wenfeng sinh năm 1985 tại làng Mililing, Quảng Đông, con trai cô giáo tiểu học, xuất thân nghèo khó. Khi sinh ra, GDP đầu người Trung Quốc chỉ khoảng 300 USD.
  • Năm 2002, đạt thủ khoa kỳ thi đại học toàn khu vực Trạm Giang. Vào học Đại học Chiết Giang danh giá, nơi từng đào tạo nhiều tỷ phú công nghệ.
  • Chuyên ngành kỹ thuật điện tử, sau đó học lên thạc sĩ về machine vision, tốt nghiệp năm 2010 với đề tài về thuật toán theo dõi vật thể cho camera. Kết hợp cùng bạn học Xu Jin, người sau này trở thành đồng sáng lập.
  • Từ năm 2008, bắt đầu giao dịch chứng khoán bằng thuật toán, dùng 80.000 nhân dân tệ và đạt mức sinh lời hơn 100% mỗi năm suốt 7 năm, trở thành tỷ phú.
  • Năm 2015, cùng Xu Jin sáng lập High-Flyer Quant, quỹ giao dịch định lượng hàng đầu Trung Quốc, quản lý trên 100 tỷ nhân dân tệ. Năm 2021, đầu tư 1 tỷ nhân dân tệ xây trung tâm tính toán với 10.000 card đồ họa Nvidia.
  • Đối mặt kiểm soát từ các cơ quan chức năng, High-Flyer chuyển hướng nghiên cứu AI, lập phòng thí nghiệm AI năm 2019. Đầu 2023, DeepSeek tách ra hoạt động độc lập, tập trung phát triển LLM (mô hình ngôn ngữ lớn).
  • DeepSeek gây sốc giới công nghệ với model nguồn mở V3 và model lập luận R1, khiến các đối thủ lớn trong và ngoài nước phải dừng phát triển mô hình riêng như 01.AI của Lý Khai Phục.
  • DeepSeek thu hút hơn 100 nhà khoa học trẻ, phát triển nhanh nhờ hiệu quả chi phí, mô hình nguồn mở. Được các tập đoàn lớn như Alibaba, Tencent tìm cách tích hợp vào sản phẩm.
  • Lương kiệm lời, không xuất hiện trên mạng xã hội và hiếm khi phát biểu công khai. Từ chối tiếp xúc báo chí, nhà đầu tư, và cả các quan chức địa phương.
  • DeepSeek thúc đẩy làn sóng ứng dụng AI trên toàn Trung Quốc, dù vẫn gặp khó khăn về nguồn chip tiên tiến do Mỹ hạn chế xuất khẩu.
  • Mục tiêu tham vọng của Lương là đạt tới AGI (AI tổng quát), tin rằng LLM là con đường khả thi nhất.
  • Câu chuyện vươn lên của Lương trở thành đề tài truyền cảm hứng cho học sinh, xuất hiện trên áp phích tại trường cấp hai nơi từng học, là hình mẫu về kiên trì, nỗ lực và đổi mới.
📌 Lương Văn Phong từ làng quê nghèo đã trở thành tỷ phú, nhà sáng lập DeepSeek – start-up AI nguồn mở gây rúng động thế giới khi vượt qua Big Tech Mỹ trong lĩnh vực AI lý luận. DeepSeek thu hút hơn 100 nhà khoa học, mô hình nguồn mở hiệu quả giúp giảm chi phí, kéo theo làn sóng ứng dụng AI khắp Trung Quốc dù vẫn đối mặt thách thức chip Mỹ.



Từ học sinh xuất sắc đến anh hùng AI, nhà sáng lập DeepSeek Liang Wenfeng truyền cảm hứng cho cả dân tộc​

Xuất thân từ một làng quê hẻo lánh ở miền nam Trung Quốc, Liang Wenfeng đã vươn lên từ nguồn gốc khiêm tốn để trở thành một cái tên nổi tiếng
Coco Feng tại Mililing, tỉnh Guangdong
Đăng ngày: 11:00 sáng, 19/4/2025

Không lâu trước đây, ít người ở Trung Quốc từng nghe nói về Mililing, một ngôi làng yên tĩnh nằm trong một góc hẻo lánh của tỉnh Guangdong phía nam. Nhưng mọi thứ đã thay đổi vào đầu năm nay khi hàng trăm du khách đến mỗi ngày để bày tỏ lòng kính trọng đối với Liang Wenfeng, nhà sáng lập 40 tuổi của công ty khởi nghiệp trí tuệ nhân tạo (AI) DeepSeek, người đã nổi lên như một anh hùng khi mang lại cho đất nước lợi thế trong cuộc cạnh tranh công nghệ với Mỹ.
Người dân trong làng, nhiều người có cùng họ Liang, đã dựng quầy gần nhà thời thơ ấu của ông để bán đồ lưu niệm và đồ uống, bao gồm nước mía zhuangyuan - một sự tri ân đến danh hiệu cổ xưa dành cho những người đứng đầu kỳ thi khoa cử triều đình. Giống như Liang, nhiều học giả trong quá khứ đã vươn lên từ xuất thân khiêm tốn để đạt được danh tiếng và sự giàu có thông qua sự xuất sắc về trí tuệ.
Kể từ khi DeepSeek gây chấn động cho cả Thung lũng Silicon và Phố Wall với mô hình lập luận mạnh mẽ vào tháng 1, Liang đã trở thành một trong những nhân vật có ảnh hưởng nhất của Trung Quốc, tương tự như các nhà khoa học hạt nhân và tên lửa của những năm 1950 và 1960, những người đã giúp thúc đẩy lợi thế chiến lược của quốc gia. Trên toàn cầu, Liang được xem như một doanh nhân công nghệ đáng gờm, với tiềm năng làm lu mờ các nhà lãnh đạo Mỹ như nhà sáng lập OpenAI Sam Altman và định hình lại sự cạnh tranh Mỹ-Trung.
"Trung Quốc không thể luôn là người đi sau," Liang nói trong một cuộc phỏng vấn với cơ quan truyền thông Trung Quốc 36Kr vào năm 2024.
Một người bán hàng kể với phóng viên Post rằng Liang đã trở về làng trong dịp Tết Nguyên đán vào cuối tháng 1, có cảnh sát vũ trang đi cùng, nhấn mạnh tầm quan trọng then chốt của ông đối với đất nước.
Một quầy ******** mía zhuangyuan tại làng Mililing. Ảnh: Coco Feng
Khi Liang được sinh ra bởi một giáo viên tiểu học vào năm 1985, Trung Quốc vẫn chưa thoát khỏi cái bóng của nền kinh tế kế hoạch. Nước này có tổng sản phẩm quốc nội (GDP) đầu người là 300 USD, dịch vụ tài chính hạn chế và không có thị trường chứng khoán. Mililing vẫn còn là một cộng đồng nông thôn truyền thống nơi mọi người dường như đều biết nhau.
Trong một bản tin quyên góp địa phương, có ghi nhận rằng "Wenfeng" đã đóng góp 3.000 nhân dân tệ (41 USD) để hỗ trợ người cao tuổi Trung Quốc, cùng với hơn 100 người dân làng khác có cùng họ, theo một báo cáo đầu tháng này từ tờ báo Hàn Quốc Chosun Ilbo. Đây là một truyền thống bộ tộc phổ biến trên khắp đất nước. Năm ngoái, thông tin cho thấy Zhang Yiming, nhà sáng lập công ty mẹ của TikTok là ByteDance, đã quyên góp 2 triệu nhân dân tệ cho một đền thờ tổ tiên ở làng Kongfu thuộc tỉnh Fujian ở đông nam.
Liang đã xuất sắc trong hệ thống giáo dục công của Trung Quốc, vốn nhấn mạnh vào toán học và vật lý. Vào năm 2002, năm Trung Quốc ghi nhận GDP đầu người đạt 1.150 USD sau khi gia nhập Tổ chức Thương mại Thế giới một năm trước đó, chàng trai 17 tuổi đã đạt điểm cao nhất trong kỳ thi đại học quốc gia ở khu vực Zhanjiang của Guangdong.
Thành tích học tập xuất sắc đã giúp ông được nhận vào trường Đại học Zhejiang danh tiếng ở Hangzhou, thủ phủ bên hồ của tỉnh Zhejiang phía đông, nơi Jack Ma 38 tuổi đang phấn đấu phát triển công ty khởi nghiệp thương mại điện tử mang tên Alibaba.
Lớp 1999 tại bộ phận trung học cơ sở của Trường Trung học Số 1 Wuchuan. Liang Wenfeng ngồi ở hàng trên cùng, thứ 6 từ phải sang. Ảnh: Coco Feng
Đại học Zhejiang được cho là cạnh tranh với Đại học Thanh Hoa và Đại học Bắc Kinh trong việc sản sinh ra các tỷ phú. Cựu sinh viên bao gồm Colin Huang Zheng, nhà sáng lập gã khổng lồ mua sắm trực tuyến PDD Holdings, có tài sản cá nhân ước tính 34 tỷ USD. Sự bùng nổ kinh tế của Trung Quốc vào đầu những năm 2000 đã tạo ra nhiều câu chuyện đi lên từ nghèo khó, nhấn mạnh sức mạnh chuyển đổi của công nghệ trong một nền kinh tế thị trường phát triển nhanh chóng.
Liang học kỹ thuật điện tử và tham gia chương trình sau đại học ba năm về thị giác máy tính vào năm 2007. Ông tốt nghiệp vào năm 2010 với luận văn về thuật toán theo dõi đối tượng cho máy ảnh. Trong bài báo, ông đã cảm ơn người hướng dẫn và 5 bạn cùng lớp. Một trong số họ, Xu Jin, đã trở thành đối tác kinh doanh thân thiết, tương tự như sự hợp tác của Zhang với bạn cùng phòng đại học Liang Rubo, người đồng sáng lập ByteDance.
Thời gian của Liang ở Hangzhou trùng với một thời kỳ phấn khích kinh tế, biến động thị trường chứng khoán, và việc áp dụng nhanh chóng các công nghệ internet bắt nguồn từ sự phổ biến của điện thoại thông minh.
Mặc dù bằng cấp danh giá mang lại nhiều cơ hội việc làm trả lương cao, Liang đã chọn con đường riêng. Thực tập là bắt buộc trong một số chương trình học. Liang là người duy nhất trong nhóm thực tập yêu cầu không đến văn phòng công ty, theo một người trực tiếp tham gia, người từ chối nêu tên.
Sau khi tốt nghiệp, Liang chuyển đến Chengdu, thủ phủ của tỉnh Sichuan phía tây nam, nổi tiếng với lối sống nhẹ nhàng. Tại đó, ông làm việc trên một dự án sử dụng thuật toán cho giao dịch chứng khoán, lấy cảm hứng từ nhà đầu tư quỹ đầu cơ Mỹ huyền thoại James Simons. Liang đã viết lời tựa cho phiên bản tiếng Trung của tiểu sử Simons, tự tin khẳng định rằng sẽ có cách phát triển các mô hình có thể dự đoán giá cả.
Vào năm 2015, Liang đồng sáng lập High-Flyer Quant với Xu. Một bài đăng tuyển dụng ban đầu đã gợi ý về thành công của Liang: bài đăng nói rằng vào năm 2008, một "ông L" bắt đầu giao dịch cổ phiếu bằng thuật toán với khoản đầu tư ban đầu là 80.000 nhân dân tệ; trong 7 năm tiếp theo, ông đã đạt được lợi nhuận hàng năm trên 100% để trở thành tỷ phú.
High-Flyer nhanh chóng nổi lên như một trong bốn quỹ giao dịch lượng tử hàng đầu của Trung Quốc, với tài sản quản lý vượt quá 100 tỷ nhân dân tệ khi các nhà đầu tư tranh nhau gửi tiền cho Liang. Dòng chảy nguồn lực đã cho phép ông xây dựng một trung tâm điện toán khổng lồ để phân tích dữ liệu và lựa chọn cổ phiếu.
Vào năm 2021, High-Flyer đã đầu tư 1 tỷ nhân dân tệ để phát triển một trung tâm điện toán được trang bị 10.000 card đồ họa Nvidia, công ty cho biết.
Tuy nhiên, thành công mang đến thách thức. Giao dịch lượng tử, mặc dù được chấp nhận, bị các cơ quan quản lý Trung Quốc nhìn nhận với sự hoài nghi, khiến Liang lo sợ sự giám sát, theo một nguồn tin gần gũi với công ty. Vào năm 2022, High-Flyer đã giảm tài sản quản lý bằng cách trả lại tiền cho các nhà đầu tư và mua cổ phiếu trong thời điểm thị trường suy thoái.
Khi nguồn lực điện toán của High-Flyer vượt quá nhu cầu giao dịch hàng ngày, Liang đã chuyển hướng nỗ lực sang nghiên cứu AI. Vào năm 2019, ông thành lập một phòng thí nghiệm AI. Đầu năm 2023, chỉ vài tháng sau khi OpenAI ra mắt ChatGPT, ông đã chuyển phòng thí nghiệm thành một tổ chức độc lập có tên DeepSeek, tập trung vào phát triển mô hình ngôn ngữ lớn (LLM).
Giữa bối cảnh LLM đông đúc, DeepSeek nổi lên như một nhà đổi mới thực sự, làm lu mờ cả các công ty công nghệ lớn và vô số công ty khởi nghiệp. Việc phát hành mô hình cơ sở V3 mã nguồn mở vào tháng 12 và mô hình lập luận R1 vào tháng 1 đã cách mạng hóa thị trường AI trong nước. Lee Kai-fu, nhà sáng lập và CEO của công ty khởi nghiệp 01.AI, đã nói trong một cuộc phỏng vấn với Post vào tháng 3 rằng công ty của ông đã ngừng phát triển các mô hình riêng trước thành công của DeepSeek.
DeepSeek, công ty thuê hơn 100 nhà khoa học trẻ, đang ở vị thế đạt được nhiều bước đột phá hơn nữa. Với việc nâng cấp gần đây của V3, công ty khởi nghiệp đã thể hiện cam kết tiến bộ kỹ thuật mặc dù đã đạt được danh tiếng sớm.
"Đội ngũ DeepSeek đang cải thiện sản phẩm của họ, đồng thời giữ sự phô trương ở mức tối thiểu có thể," Petri Kuittinen, giảng viên công nghệ thông tin và truyền thông tại Đại học Khoa học Ứng dụng Häme ở Phần Lan cho biết.
Các mô hình của DeepSeek cũng tiết kiệm chi phí và mã nguồn mở, cung cấp một giải pháp thay thế khả thi cho các mô hình phát triển ở Mỹ. Điều này trái ngược với OpenAI, mặc dù có tên như vậy, nhưng hoạt động với mô hình mã nguồn đóng và giữ bí mật các đổi mới, Kuittinen nói.
Mặc dù có nhiều lời khen ngợi, Liang vẫn giữ hồ sơ thấp. Sự xuất hiện đáng chú ý duy nhất của ông là tại một hội thảo cấp cao do Chủ tịch Trung Quốc Tập Cận Bình chủ trì vào tháng 2. Liang không phát biểu, không giống như những người tham dự khác như nhà sáng lập Huawei Technologies Ren Zhengfei và nhà sáng lập Xiaomi Lei Jun, theo một video từ Đài Truyền hình Trung ương Trung Quốc.
Liang từ chối lời mời phát biểu tại Hội nghị Thượng đỉnh Hành động về AI ở Paris trong cùng tháng và nhiều lần từ chối các yêu cầu phỏng vấn, ngay cả khi hàng loạt phóng viên tụ tập bên ngoài trụ sở của DeepSeek trong một tòa nhà văn phòng cao cấp ở Hangzhou. Nguồn tin cho biết ông cũng từ chối các cuộc gặp với các nhà đầu tư tiềm năng và quan chức chính quyền địa phương.
Đáng chú ý, Liang không có sự hiện diện trên mạng xã hội công khai, một thành tích phi thường ngay cả theo tiêu chuẩn của các doanh nhân công nghệ Trung Quốc kín tiếng. Bằng chứng duy nhất về sự tham gia của ông vào DeepSeek là tên ông xuất hiện trong các bài báo nghiên cứu do công ty khởi nghiệp công bố. Sự kín tiếng của ông tương phản rõ rệt với Altman, người tích cực quảng bá sản phẩm của OpenAI trên toàn cầu.
Sự nổi lên của Liang làm phức tạp vấn đề cho Altman, thúc đẩy OpenAI đánh giá lại chiến lược mã nguồn mở và vị thế thị trường, theo Kevin Zhou, nhà sáng lập tổ chức truyền thông công nghệ Pandaily và tác giả của tiểu sử đầu tiên bằng tiếng Trung về Altman. Altman đã nói đầu tháng này trên X rằng OpenAI sẽ phát hành "một mô hình ngôn ngữ mã nguồn mở mạnh mẽ với khả năng lập luận trong những tháng tới".
Liang dự đoán năm ngoái rằng các nhà phát triển mô hình AI khác cuối cùng sẽ vượt qua OpenAI, ngay cả khi nhà sản xuất ChatGPT giữ sản phẩm của mình ở dạng mã nguồn đóng.
Với những tiến bộ trong kỹ thuật như kiến trúc "hỗn hợp chuyên gia" và sự chú ý tiềm ẩn đa đầu, DeepSeek đã giảm đáng kể chi phí đào tạo AI. Quan trọng hơn, các mô hình của công ty được phát triển bởi các nhà khoa học Trung Quốc. Công ty khởi nghiệp đã thúc đẩy làn sóng quốc gia trong việc áp dụng công nghệ AI trên các lĩnh vực khác nhau. Mặc dù DeepSeek không thể đáp ứng tất cả nhu cầu, các gã khổng lồ công nghệ Trung Quốc, bao gồm Alibaba và Tencent Holdings, đều háo hức tích hợp các mô hình của DeepSeek vào sản phẩm của riêng họ.
"Đổi mới không chỉ là kỹ thuật; nó còn mang tính chiến lược," Sujan Sarkar, đồng sáng lập AITools.xyz, một trang web theo dõi độ phổ biến của các dịch vụ AI, cho biết.
Tuy nhiên, DeepSeek, hoạt động giống như một phòng thí nghiệm hơn là một công ty truyền thống, đang đối mặt với những thách thức ngày càng tăng trong việc duy trì đà phát triển. Kỳ vọng rất cao cho mô hình tiếp theo của công ty, tuy nhiên công ty gặp khó khăn với việc tiếp cận hạn chế đối với các chip tiên tiến từ Mỹ.
"Liệu nó có thể hoàn toàn thoát khỏi quy luật mở rộng không?" một nguồn tin gần gũi với các nhà phát triển tại DeepSeek hỏi, đề cập đến nguyên tắc rằng dữ liệu đào tạo lớn hơn và tham số mô hình nâng cao trí thông minh của mô hình. "Câu trả lời vẫn chưa được biết."
Liang đã nói rằng mục tiêu cuối cùng của DeepSeek là đạt được trí tuệ nhân tạo tổng quát (AGI), một giai đoạn mà AI có thể phù hợp hoặc vượt quá khả năng nhận thức của con người. "LLM sở hữu một số đặc điểm sơ bộ của AGI và có khả năng là con đường duy nhất dẫn đến AGI," ông nói. "Chúng tôi sẽ bắt đầu từ đây và làm việc với thị giác sau."
Mặc dù vẫn chưa rõ liệu DeepSeek có thể tiếp tục đổi mới hay không, Liang, người được đào tạo hoàn toàn ở Trung Quốc, đã trở thành nguồn cảm hứng cho thế hệ trẻ của quốc gia.
Câu chuyện của Liang được trưng bày trong một áp phích tại trường tiểu học của ông, cho biết ông bắt đầu học toán cấp đại học trong thời gian học trung học cơ sở. Tại Trường Trung học Số 1 Wuchuan, nơi Liang học trong sáu năm, học sinh chọn giữa các hướng khoa học và nghệ thuật ở lớp 10, với 20 trong số 28 lớp ở lớp 11 tập trung vào các môn khoa học như toán học, vật lý và hóa học.
Giáo viên thường trích dẫn Liang như một ví dụ động viên cho học sinh chăm chỉ. Về phần học sinh viết bài luận như một phần của kỳ thi văn học Trung Quốc năm nay, nhiều em nói rằng chắc chắn sẽ sử dụng nhà sáng lập DeepSeek như một ví dụ để minh họa các chủ đề về sự kiên trì, cống hiến và vượt qua nghịch cảnh.
Nguồn: Songai.vn
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top