Mạnh Quân
Writer
Gần đây, DeepSeek đã trở nên phổ biến trên thế giới, và người sáng lập Lương Văn Phong đã trở thành tâm điểm chú ý.
Đêm giao thừa Tết Nguyên đán, quê hương Lương Văn Phong, thôn Mililing, thành phố Ngô Xuyên, thành phố Trạm Giang, tỉnh Quảng Đông, nhộn nhịp hơn những năm trước. Khi "thần đồng" trước đây là Lương Văn Phong bước về quê hương, một biểu ngữ treo cao ở lối vào làng có dòng chữ "Nhiệt liệt chào mừng Văn Phong, niềm tự hào và hy vọng của quê hương!", và cổng vòm hạnh phúc kép trên phố có dòng chữ "Văn Phong trở về quê hương để truyền bá thành tựu của mình!, góp phần thúc đẩy công cuộc đổi mới nông thôn”.
Con đường đến sự giác ngộ
Năm 1985, Lương Văn Phong sinh ra trong một gia đình giáo viên bình thường ở Trạm Giang, Quảng Đông. Cả cha và mẹ anh đều là giáo viên tiếng Trung tiểu học.
Lương Văn Phong là học sinh giỏi của trường từ khi còn nhỏ và thể hiện năng khiếu toán học tuyệt vời. Vào năm lớp 6 tiểu học, Lương Văn Phong đã đỗ vào trường Trung học cơ sở số 1 Vũ Xuyên. Anh tự học toán phổ thông ở trường trung học cơ sở và cũng bắt đầu học toán đại học.
Năm 2002, Lương Văn Phong, 17 tuổi, đã trúng tuyển vào chuyên ngành kỹ thuật thông tin điện tử của Đại học Chiết Giang với điểm cao nhất trong kỳ thi tuyển sinh đại học tại Trường trung học cơ sở số 1 và tiếp tục theo học chương trình thạc sĩ về kỹ thuật thông tin và truyền thông.
Trong thời gian học tại Đại học Chiết Giang, Lương Văn Phong không chỉ đạt thành tích học tập xuất sắc mà còn là người tham gia tích cực và đạt thành tích cao trong nhiều cuộc thi học thuật và hoạt động câu lạc bộ.
Năm 2008, cuộc khủng hoảng tài chính toàn cầu nổ ra. Lương Văn Phong đã dẫn dắt nhóm của mình khám phá tiềm năng ứng dụng của công nghệ máy học trong giao dịch định lượng hoàn toàn tự động, đặt "hạt giống" cho tinh thần kinh doanh trong tương lai.
Con đường khởi nghiệp: từ đầu tư định lượng đến AI
Sau khi tốt nghiệp cao học, Lương Văn Phong đã tích lũy được nhiều kinh nghiệm thực tế tại các công ty Internet như NetEase và Alibaba. Tuy nhiên, không giống như những người xung quanh, anh không làm lập trình viên tại một công ty lớn mà chọn cách khởi nghiệp kinh doanh riêng.
Năm 2013, Lương Văn Phong và bạn học tại Đại học Chiết Giang là Xu Jin đã đồng sáng lập Công ty TNHH Quản lý Đầu tư Jacobi Hàng Châu.
Năm 2015, anh thành lập Công ty TNHH Công nghệ Hàng Châu Huanfang (tức là Huanfang Quantitative) ,chuyên về đầu tư định lượng thông qua toán học và trí tuệ nhân tạo. Đến năm 2021, quy mô quản lý tài sản của công ty đã vượt quá 100 tỷ nhân dân tệ, trở thành một trong "4 "Thiên Vương" của vốn tư nhân định lượng trong nước”.
Đầu tư định lượng (Quantitative Investing) là một phương pháp đầu tư dựa trên phân tích dữ liệu và thuật toán để đưa ra quyết định mua, bán chứng khoán. Thay vì dựa vào trực giác hay đánh giá chủ quan của con người, phương pháp này sử dụng các mô hình toán học, thống kê và trí tuệ nhân tạo để xác định cơ hội đầu tư.
Trải nghiệm này không chỉ chứng minh tầm nhìn vượt trội của Lương Văn Phong trong lĩnh vực công nghệ tài chính mà còn tích lũy được nhiều kinh nghiệm và vốn liếng cho quá trình chuyển đổi sau này của ông sang lĩnh vực trí tuệ nhân tạo.
Vào năm 2022, OpenAI đã phát hành ChatGPT khiến cả thế giới chấn động. Lương Văn Phong đã nắm bắt cơ hội này một cách nhạy bén và quyết đoán bước vào lĩnh vực trí tuệ nhân tạo tổng quát (AGI) vào năm 2023 và thành lập DeepSeek.
Trong Tết Nguyên đán năm nay, DeepSeek đã đứng đầu bảng xếp hạng tải xuống APP miễn phí trên các cửa hàng ứng dụng ở Trung Quốc đại lục và Hoa Kỳ, thu hút sự chú ý rộng rãi từ cộng đồng công nghệ toàn cầu.
Điều thậm chí còn đáng ngạc nhiên hơn là DeepSeek chỉ mất hơn một năm kể từ khi thành lập để trở thành “thế lực bí ẩn của phương Đông”. Nhóm R&D chỉ gồm 140 người, sử dụng 2048 GPU cấp thấp và đầu tư 5,576 triệu đô la Mỹ (khoảng 40 triệu nhân dân tệ) trong hai tháng để phát triển thành công một mô hình lớn gây chấn động thế giới.
Khi phát triển mô hình DeepSeek-V2, nhóm đã phải đối mặt với thách thức làm thế nào để giảm chi phí nhưng vẫn đảm bảo hiệu suất của mô hình. Lương Văn Phong đã dẫn đầu nhóm tiến hành vô số thí nghiệm và thử nghiệm nhiều sự kết hợp kỹ thuật khác nhau.
Sau một tháng làm việc chăm chỉ, nhóm đã tối ưu hóa thành công mô hình, không chỉ giảm chi phí suy luận xuống chỉ còn 1 nhân dân tệ cho một triệu token, chỉ bằng khoảng 1/70 của GPT-4 Turbo, mà còn đạt được những cải thiện đáng kể về hiệu suất.
Cùng lúc đó, DeepSeek công bố ra mắt và mã nguồn mở đồng thời của mô hình DeepSeek-V3, đồng thời phát hành 53 trang tài liệu đào tạo và thông tin kỹ thuật.
Dữ liệu tính toán mô hình cho thấy mặc dù DeepSeek-V3 hoạt động tương đối kém trong các tác vụ tạo văn bản, nhưng khả năng mã hóa, suy luận logic và suy luận toán học của nó lại thuộc loại tốt nhất.
Vào tối ngày 20 tháng 1, DeepSeek chính thức phát hành mô hình DeepSeek-R1, có hiệu suất tương đương với phiên bản chính thức GPT-4 của OpenAI trong các tác vụ như toán học, mã hóa và suy luận ngôn ngữ tự nhiên. Đồng thời, nó cũng mở nguồn các trọng số của mô hình và công bố công nghệ đào tạo để thúc đẩy công nghệ. Giao tiếp cộng đồng và hợp tác sáng tạo.
Con đường đột phá: Đổi mới của Trung Quốc đã phát triển từ "hái trái cây" thành "trồng cây"
Ngày 26 tháng 1, Feng Ji, nhà sản xuất của Black Myth: Wukong, cho biết DeepSeek có thể là một thành tựu khoa học "cấp quốc gia". Ông hào hứng nói:
"Tôi thật may mắn! Tôi thật hạnh phúc! Một bước đột phá gây sốc như vậy đến từ một công ty hoàn toàn của Trung Quốc. Quyền bình đẳng về kiến thức và thông tin đã có thêm một bước tiến vững chắc."
Đối mặt với đánh giá này, Lương Văn Phong, người sáng lập DeepSeek, đã trả lời vào đêm giao thừa: “Sử dụng mã như gạch và ngói, và thuật toán như thanh thép, chúng tôi đã xây dựng một cây cầu đến tương lai từ vết nứt giữa vốn và sự nghi ngờ”. Trong một Bài viết dài trên tài khoản Weibo đã chia sẻ chi tiết câu chuyện đằng sau bước đột phá này, được ca ngợi là bước đột phá "cấp độ vận mệnh quốc gia".
Lương Văn Phong cho biết nhóm DeepSeek luôn ủng hộ cộng đồng nguồn mở và nỗ lực thúc đẩy tiến bộ công nghệ của các mô hình lớn trong nước.
Anh đã chia sẻ cụ thể một số chi tiết: ví dụ, chức năng hỗ trợ tìm kiếm trực tuyến xuất phát từ nhật ký lỗi do người dùng thử nghiệm nội bộ gửi vào lúc 3 giờ sáng ngày thứ 30; một nhà phát triển khiếm thị đã sử dụng API của DeepSeek để phát triển ứng dụng "điều hướng bằng mùi" cho phép chúng ta phải nhận thức sâu sắc rằng ý nghĩa thực sự của công nghệ không chỉ nằm ở sự đổi mới mà còn ở sự đóng góp và thay đổi của nó đối với xã hội.
Trong một cuộc phỏng vấn khác, Lương Văn Phong đã thẳng thắn nói rằng: "Nhiều người ngạc nhiên khi DeepSeek có thể nổi bật giữa vô vàn những đổi mới ở Thung lũng Silicon. Trên thực tế, trong số lượng lớn các đổi mới diễn ra hàng ngày ở Hoa Kỳ, thành tích của chúng tôi có thể không gây ngạc nhiên".
Nhưng điểm quan trọng là đây là một công ty Trung Quốc tham gia vào cuộc chơi toàn cầu với tư cách là đơn vị thực sự đóng góp vào sự đổi mới. Hầu hết các công ty Trung Quốc thường đi theo thay vì tự sáng tạo ra những ý tưởng mới.
Tác động sâu xa hơn có thể là DeepSeek đã chọn con đường "phản lẽ thường" - biến công nghệ cốt lõi của mình thành mã nguồn mở.
Đây không chỉ là chiến lược kinh doanh mà còn là tuyên bố về văn hóa: trong khi Thung lũng Silicon đang xây dựng hào nước với hệ sinh thái nguồn đóng thì các công ty Trung Quốc đang cố gắng tái thiết sức mạnh diễn ngôn công nghệ thông qua chia sẻ mở.
Như Lương Văn Phong đã đề cập, trong vài thập kỷ qua, thành công của Trung Quốc trong lĩnh vực CNTT chủ yếu đến từ sự lặp lại nhanh chóng của lớp ứng dụng, chẳng hạn như thanh toán di động, thương mại điện tử xã hội, v.v., nhưng công nghệ cơ bản luôn dựa vào "vay mượn".
Con đường quán tính này đã khiến các công ty Trung Quốc tập trung nhiều hơn vào thương mại hóa ngắn hạn và bỏ bê việc tích lũy công nghệ dài hạn. Mô hình này không chỉ khiến các công ty Trung Quốc rơi vào thế bị động về mặt sáng tạo mà còn làm sâu sắc thêm định kiến “thiếu vốn đổi mới sáng tạo”.
Ngoài ra, việc Trung Quốc phụ thuộc lâu dài vào công nghệ phương Tây đã dẫn đến tình trạng thiếu niềm tin vào sự đổi mới và hệ sinh thái công nghệ bị chia cắt. Lấy CUDA của NVIDIA làm ví dụ. Nhiều thập kỷ tích lũy công nghệ và hợp tác đã giúp công ty này thống trị thế giới, trong khi ngành công nghiệp chip và nghiên cứu và phát triển thuật toán của Trung Quốc lại thiếu một hệ sinh thái chuỗi hoàn chỉnh.
Sự đột phá của DeepSeek chắc chắn là một thử nghiệm "không điển hình" của Trung Quốc.
DeepSeek đã chọn con đường niềm tin công nghệ > KPI thương mại, dồn hết tâm huyết vào đổi mới cơ bản của các mô hình lớn thay vì chạy theo xu hướng để triển khai chúng trong ngành. Đây không phải là một loại "xa xỉ" sao?
Cho đến nay, trong số bảy công ty khởi nghiệp quy mô lớn của Trung Quốc, đây là công ty duy nhất từ bỏ con đường "cả hai" và tập trung vào nghiên cứu và công nghệ, không tham gia vào các ứng dụng C.
Chúng ta có thể hiểu được phần nào lý do đằng sau sự lựa chọn này thông qua bài phát biểu của Lương Văn Phong:
"Trong nhiều năm, các công ty Trung Quốc đã quen với việc những người khác tạo ra những đổi mới công nghệ và sau đó sử dụng chúng để kiếm tiền từ các ứng dụng, nhưng đây không phải là vấn đề tất nhiên. Trong làn sóng này, điểm khởi đầu của chúng tôi không phải là tận dụng cơ hội để tạo ra tài sản, nhưng việc đạt tới vị trí hàng đầu về công nghệ sẽ thúc đẩy sự phát triển của toàn bộ hệ sinh thái."
Mặt khác, DeepSeek là công ty mô hình duy nhất trong số bảy công ty lớn chưa cân nhắc đầy đủ đến việc thương mại hóa, kiên quyết chọn con đường nguồn mở và thậm chí còn chưa huy động được vốn.
Việc thay thế "thuế nguồn đóng" bằng "chia sẻ mở" chỉ xác nhận rằng hào nước mà nhóm của Lương Văn Phong đề cập không nằm trong mã, mà nằm trong tâm trí mọi người. Trước công nghệ đột phá, hào nước do nguồn đóng tạo ra sẽ tồn tại trong thời gian ngắn. Không có bí mật nào trong công nghệ, nhưng việc thiết lập lại nó cần thời gian và chi phí.
"Chúng tôi đã lựa chọn một nhóm người thiếu kinh nghiệm nhưng có tiềm năng, và có cơ cấu tổ chức và văn hóa doanh nghiệp cho phép sự đổi mới diễn ra". Đây chính là bí quyết giúp mô hình khởi nghiệp lớn của Lương Văn Phong có thể cạnh tranh với các công ty lớn.
Jack Clark, cựu giám đốc chính sách tại OpenAI và là đồng sáng lập của Anthropic, tin rằng DeepSeek đã tuyển dụng được một nhóm thiên tài không thể hiểu nổi. Nhưng Lương Văn Phong nói:
"Không có thiên tài bí ẩn nào cả. Họ đều là những sinh viên mới tốt nghiệp từ các trường đại học hàng đầu, là thực tập sinh năm thứ tư, năm thứ năm của chương trình tiến sĩ, và một số người trẻ mới tốt nghiệp cách đây vài năm".
"Tiêu chí tuyển chọn của chúng tôi luôn là đam mê và tò mò. Mô hình V2 không có người trở về từ nước ngoài, chỉ có người bản xứ. 50 tài năng hàng đầu có thể không ở Trung Quốc, nhưng có thể chúng tôi có thể tự tạo ra những người như vậy".
Lương Văn Phong đã thành công trong việc tạo ra bầu không khí tràn ngập văn hóa đổi mới thông qua chiến lược tuyển dụng độc đáo, kết hợp sự phát triển sáng tạo từ dưới lên với phân bổ nguồn lực từ trên xuống, đồng thời thúc đẩy công ty duy trì đà phát triển mạnh mẽ và tính linh hoạt trong đổi mới công nghệ.
Tầm quan trọng của DeepSeek có thể vượt xa sự thành công hay thất bại của một công ty. Nó xác minh một đề xuất lớn hơn: Liệu Trung Quốc có thể phát triển từ "người tiêu dùng công nghệ" thành "người sáng tạo công nghệ" không?
Sau khi DeepSeek quyết định mở mã nguồn, DeepSeek-R1 đã được đưa vào chương trình giảng dạy của 47 trường đại học hàng đầu trên thế giới và có hơn 3.000 dự án phái sinh trên GitHub. "Sự lây lan công nghệ" này đang ươm mầm cho cộng đồng công nghệ AI tiếp theo, đây là bước đột phá và khởi đầu mới cho khoa học và công nghệ Trung Quốc.
Sự trỗi dậy của DeepSeek không chỉ thúc đẩy Trung Quốc suy nghĩ về sự đổi mới công nghệ mà còn khiến OpenAI phải xem xét lại chiến lược nguồn mở.
Trong buổi hỏi đáp trực tuyến trên Reddit gần đây, CEO của OpenAI Altman đã công khai thừa nhận rằng chúng ta đang đi sai hướng trong các mô hình AI có trọng số nguồn mở và nhận ra rằng nguồn đóng không phải là cách duy nhất để duy trì vị thế dẫn đầu.
Ngay sau đó, OpenAI đã khẩn trương ra mắt mô hình o3-mini, người dùng miễn phí cũng có thể sử dụng. Đồng thời, Altman cũng tuyên bố rằng OpenAI đang cân nhắc chiến lược nguồn mở nội bộ và sẽ tiếp tục phát triển các mô hình, nhưng lợi thế dẫn đầu của OpenAI sẽ không còn lớn như trước.
Có thể thấy, DeepSeek do Lương Văn Phong lãnh đạo, "cá trê" này vẫn đang tiếp tục khuấy động cộng đồng công nghệ toàn cầu. #DeepSeek
Đêm giao thừa Tết Nguyên đán, quê hương Lương Văn Phong, thôn Mililing, thành phố Ngô Xuyên, thành phố Trạm Giang, tỉnh Quảng Đông, nhộn nhịp hơn những năm trước. Khi "thần đồng" trước đây là Lương Văn Phong bước về quê hương, một biểu ngữ treo cao ở lối vào làng có dòng chữ "Nhiệt liệt chào mừng Văn Phong, niềm tự hào và hy vọng của quê hương!", và cổng vòm hạnh phúc kép trên phố có dòng chữ "Văn Phong trở về quê hương để truyền bá thành tựu của mình!, góp phần thúc đẩy công cuộc đổi mới nông thôn”.
Con đường đến sự giác ngộ
Năm 1985, Lương Văn Phong sinh ra trong một gia đình giáo viên bình thường ở Trạm Giang, Quảng Đông. Cả cha và mẹ anh đều là giáo viên tiếng Trung tiểu học.
Lương Văn Phong là học sinh giỏi của trường từ khi còn nhỏ và thể hiện năng khiếu toán học tuyệt vời. Vào năm lớp 6 tiểu học, Lương Văn Phong đã đỗ vào trường Trung học cơ sở số 1 Vũ Xuyên. Anh tự học toán phổ thông ở trường trung học cơ sở và cũng bắt đầu học toán đại học.
Năm 2002, Lương Văn Phong, 17 tuổi, đã trúng tuyển vào chuyên ngành kỹ thuật thông tin điện tử của Đại học Chiết Giang với điểm cao nhất trong kỳ thi tuyển sinh đại học tại Trường trung học cơ sở số 1 và tiếp tục theo học chương trình thạc sĩ về kỹ thuật thông tin và truyền thông.
Trong thời gian học tại Đại học Chiết Giang, Lương Văn Phong không chỉ đạt thành tích học tập xuất sắc mà còn là người tham gia tích cực và đạt thành tích cao trong nhiều cuộc thi học thuật và hoạt động câu lạc bộ.
Năm 2008, cuộc khủng hoảng tài chính toàn cầu nổ ra. Lương Văn Phong đã dẫn dắt nhóm của mình khám phá tiềm năng ứng dụng của công nghệ máy học trong giao dịch định lượng hoàn toàn tự động, đặt "hạt giống" cho tinh thần kinh doanh trong tương lai.
Con đường khởi nghiệp: từ đầu tư định lượng đến AI
Sau khi tốt nghiệp cao học, Lương Văn Phong đã tích lũy được nhiều kinh nghiệm thực tế tại các công ty Internet như NetEase và Alibaba. Tuy nhiên, không giống như những người xung quanh, anh không làm lập trình viên tại một công ty lớn mà chọn cách khởi nghiệp kinh doanh riêng.
Năm 2013, Lương Văn Phong và bạn học tại Đại học Chiết Giang là Xu Jin đã đồng sáng lập Công ty TNHH Quản lý Đầu tư Jacobi Hàng Châu.
Năm 2015, anh thành lập Công ty TNHH Công nghệ Hàng Châu Huanfang (tức là Huanfang Quantitative) ,chuyên về đầu tư định lượng thông qua toán học và trí tuệ nhân tạo. Đến năm 2021, quy mô quản lý tài sản của công ty đã vượt quá 100 tỷ nhân dân tệ, trở thành một trong "4 "Thiên Vương" của vốn tư nhân định lượng trong nước”.
Đầu tư định lượng (Quantitative Investing) là một phương pháp đầu tư dựa trên phân tích dữ liệu và thuật toán để đưa ra quyết định mua, bán chứng khoán. Thay vì dựa vào trực giác hay đánh giá chủ quan của con người, phương pháp này sử dụng các mô hình toán học, thống kê và trí tuệ nhân tạo để xác định cơ hội đầu tư.
Trải nghiệm này không chỉ chứng minh tầm nhìn vượt trội của Lương Văn Phong trong lĩnh vực công nghệ tài chính mà còn tích lũy được nhiều kinh nghiệm và vốn liếng cho quá trình chuyển đổi sau này của ông sang lĩnh vực trí tuệ nhân tạo.
Vào năm 2022, OpenAI đã phát hành ChatGPT khiến cả thế giới chấn động. Lương Văn Phong đã nắm bắt cơ hội này một cách nhạy bén và quyết đoán bước vào lĩnh vực trí tuệ nhân tạo tổng quát (AGI) vào năm 2023 và thành lập DeepSeek.
Trong Tết Nguyên đán năm nay, DeepSeek đã đứng đầu bảng xếp hạng tải xuống APP miễn phí trên các cửa hàng ứng dụng ở Trung Quốc đại lục và Hoa Kỳ, thu hút sự chú ý rộng rãi từ cộng đồng công nghệ toàn cầu.
Điều thậm chí còn đáng ngạc nhiên hơn là DeepSeek chỉ mất hơn một năm kể từ khi thành lập để trở thành “thế lực bí ẩn của phương Đông”. Nhóm R&D chỉ gồm 140 người, sử dụng 2048 GPU cấp thấp và đầu tư 5,576 triệu đô la Mỹ (khoảng 40 triệu nhân dân tệ) trong hai tháng để phát triển thành công một mô hình lớn gây chấn động thế giới.
Khi phát triển mô hình DeepSeek-V2, nhóm đã phải đối mặt với thách thức làm thế nào để giảm chi phí nhưng vẫn đảm bảo hiệu suất của mô hình. Lương Văn Phong đã dẫn đầu nhóm tiến hành vô số thí nghiệm và thử nghiệm nhiều sự kết hợp kỹ thuật khác nhau.
Sau một tháng làm việc chăm chỉ, nhóm đã tối ưu hóa thành công mô hình, không chỉ giảm chi phí suy luận xuống chỉ còn 1 nhân dân tệ cho một triệu token, chỉ bằng khoảng 1/70 của GPT-4 Turbo, mà còn đạt được những cải thiện đáng kể về hiệu suất.
Cùng lúc đó, DeepSeek công bố ra mắt và mã nguồn mở đồng thời của mô hình DeepSeek-V3, đồng thời phát hành 53 trang tài liệu đào tạo và thông tin kỹ thuật.
Dữ liệu tính toán mô hình cho thấy mặc dù DeepSeek-V3 hoạt động tương đối kém trong các tác vụ tạo văn bản, nhưng khả năng mã hóa, suy luận logic và suy luận toán học của nó lại thuộc loại tốt nhất.
Vào tối ngày 20 tháng 1, DeepSeek chính thức phát hành mô hình DeepSeek-R1, có hiệu suất tương đương với phiên bản chính thức GPT-4 của OpenAI trong các tác vụ như toán học, mã hóa và suy luận ngôn ngữ tự nhiên. Đồng thời, nó cũng mở nguồn các trọng số của mô hình và công bố công nghệ đào tạo để thúc đẩy công nghệ. Giao tiếp cộng đồng và hợp tác sáng tạo.
Con đường đột phá: Đổi mới của Trung Quốc đã phát triển từ "hái trái cây" thành "trồng cây"
Ngày 26 tháng 1, Feng Ji, nhà sản xuất của Black Myth: Wukong, cho biết DeepSeek có thể là một thành tựu khoa học "cấp quốc gia". Ông hào hứng nói:
"Tôi thật may mắn! Tôi thật hạnh phúc! Một bước đột phá gây sốc như vậy đến từ một công ty hoàn toàn của Trung Quốc. Quyền bình đẳng về kiến thức và thông tin đã có thêm một bước tiến vững chắc."
Đối mặt với đánh giá này, Lương Văn Phong, người sáng lập DeepSeek, đã trả lời vào đêm giao thừa: “Sử dụng mã như gạch và ngói, và thuật toán như thanh thép, chúng tôi đã xây dựng một cây cầu đến tương lai từ vết nứt giữa vốn và sự nghi ngờ”. Trong một Bài viết dài trên tài khoản Weibo đã chia sẻ chi tiết câu chuyện đằng sau bước đột phá này, được ca ngợi là bước đột phá "cấp độ vận mệnh quốc gia".
Lương Văn Phong cho biết nhóm DeepSeek luôn ủng hộ cộng đồng nguồn mở và nỗ lực thúc đẩy tiến bộ công nghệ của các mô hình lớn trong nước.
Anh đã chia sẻ cụ thể một số chi tiết: ví dụ, chức năng hỗ trợ tìm kiếm trực tuyến xuất phát từ nhật ký lỗi do người dùng thử nghiệm nội bộ gửi vào lúc 3 giờ sáng ngày thứ 30; một nhà phát triển khiếm thị đã sử dụng API của DeepSeek để phát triển ứng dụng "điều hướng bằng mùi" cho phép chúng ta phải nhận thức sâu sắc rằng ý nghĩa thực sự của công nghệ không chỉ nằm ở sự đổi mới mà còn ở sự đóng góp và thay đổi của nó đối với xã hội.
Trong một cuộc phỏng vấn khác, Lương Văn Phong đã thẳng thắn nói rằng: "Nhiều người ngạc nhiên khi DeepSeek có thể nổi bật giữa vô vàn những đổi mới ở Thung lũng Silicon. Trên thực tế, trong số lượng lớn các đổi mới diễn ra hàng ngày ở Hoa Kỳ, thành tích của chúng tôi có thể không gây ngạc nhiên".
Nhưng điểm quan trọng là đây là một công ty Trung Quốc tham gia vào cuộc chơi toàn cầu với tư cách là đơn vị thực sự đóng góp vào sự đổi mới. Hầu hết các công ty Trung Quốc thường đi theo thay vì tự sáng tạo ra những ý tưởng mới.
Tác động sâu xa hơn có thể là DeepSeek đã chọn con đường "phản lẽ thường" - biến công nghệ cốt lõi của mình thành mã nguồn mở.
Đây không chỉ là chiến lược kinh doanh mà còn là tuyên bố về văn hóa: trong khi Thung lũng Silicon đang xây dựng hào nước với hệ sinh thái nguồn đóng thì các công ty Trung Quốc đang cố gắng tái thiết sức mạnh diễn ngôn công nghệ thông qua chia sẻ mở.
Như Lương Văn Phong đã đề cập, trong vài thập kỷ qua, thành công của Trung Quốc trong lĩnh vực CNTT chủ yếu đến từ sự lặp lại nhanh chóng của lớp ứng dụng, chẳng hạn như thanh toán di động, thương mại điện tử xã hội, v.v., nhưng công nghệ cơ bản luôn dựa vào "vay mượn".
Con đường quán tính này đã khiến các công ty Trung Quốc tập trung nhiều hơn vào thương mại hóa ngắn hạn và bỏ bê việc tích lũy công nghệ dài hạn. Mô hình này không chỉ khiến các công ty Trung Quốc rơi vào thế bị động về mặt sáng tạo mà còn làm sâu sắc thêm định kiến “thiếu vốn đổi mới sáng tạo”.
Ngoài ra, việc Trung Quốc phụ thuộc lâu dài vào công nghệ phương Tây đã dẫn đến tình trạng thiếu niềm tin vào sự đổi mới và hệ sinh thái công nghệ bị chia cắt. Lấy CUDA của NVIDIA làm ví dụ. Nhiều thập kỷ tích lũy công nghệ và hợp tác đã giúp công ty này thống trị thế giới, trong khi ngành công nghiệp chip và nghiên cứu và phát triển thuật toán của Trung Quốc lại thiếu một hệ sinh thái chuỗi hoàn chỉnh.
Sự đột phá của DeepSeek chắc chắn là một thử nghiệm "không điển hình" của Trung Quốc.
DeepSeek đã chọn con đường niềm tin công nghệ > KPI thương mại, dồn hết tâm huyết vào đổi mới cơ bản của các mô hình lớn thay vì chạy theo xu hướng để triển khai chúng trong ngành. Đây không phải là một loại "xa xỉ" sao?
Cho đến nay, trong số bảy công ty khởi nghiệp quy mô lớn của Trung Quốc, đây là công ty duy nhất từ bỏ con đường "cả hai" và tập trung vào nghiên cứu và công nghệ, không tham gia vào các ứng dụng C.
Chúng ta có thể hiểu được phần nào lý do đằng sau sự lựa chọn này thông qua bài phát biểu của Lương Văn Phong:
"Trong nhiều năm, các công ty Trung Quốc đã quen với việc những người khác tạo ra những đổi mới công nghệ và sau đó sử dụng chúng để kiếm tiền từ các ứng dụng, nhưng đây không phải là vấn đề tất nhiên. Trong làn sóng này, điểm khởi đầu của chúng tôi không phải là tận dụng cơ hội để tạo ra tài sản, nhưng việc đạt tới vị trí hàng đầu về công nghệ sẽ thúc đẩy sự phát triển của toàn bộ hệ sinh thái."
Mặt khác, DeepSeek là công ty mô hình duy nhất trong số bảy công ty lớn chưa cân nhắc đầy đủ đến việc thương mại hóa, kiên quyết chọn con đường nguồn mở và thậm chí còn chưa huy động được vốn.
Việc thay thế "thuế nguồn đóng" bằng "chia sẻ mở" chỉ xác nhận rằng hào nước mà nhóm của Lương Văn Phong đề cập không nằm trong mã, mà nằm trong tâm trí mọi người. Trước công nghệ đột phá, hào nước do nguồn đóng tạo ra sẽ tồn tại trong thời gian ngắn. Không có bí mật nào trong công nghệ, nhưng việc thiết lập lại nó cần thời gian và chi phí.
"Chúng tôi đã lựa chọn một nhóm người thiếu kinh nghiệm nhưng có tiềm năng, và có cơ cấu tổ chức và văn hóa doanh nghiệp cho phép sự đổi mới diễn ra". Đây chính là bí quyết giúp mô hình khởi nghiệp lớn của Lương Văn Phong có thể cạnh tranh với các công ty lớn.
Jack Clark, cựu giám đốc chính sách tại OpenAI và là đồng sáng lập của Anthropic, tin rằng DeepSeek đã tuyển dụng được một nhóm thiên tài không thể hiểu nổi. Nhưng Lương Văn Phong nói:
"Không có thiên tài bí ẩn nào cả. Họ đều là những sinh viên mới tốt nghiệp từ các trường đại học hàng đầu, là thực tập sinh năm thứ tư, năm thứ năm của chương trình tiến sĩ, và một số người trẻ mới tốt nghiệp cách đây vài năm".
"Tiêu chí tuyển chọn của chúng tôi luôn là đam mê và tò mò. Mô hình V2 không có người trở về từ nước ngoài, chỉ có người bản xứ. 50 tài năng hàng đầu có thể không ở Trung Quốc, nhưng có thể chúng tôi có thể tự tạo ra những người như vậy".
Lương Văn Phong đã thành công trong việc tạo ra bầu không khí tràn ngập văn hóa đổi mới thông qua chiến lược tuyển dụng độc đáo, kết hợp sự phát triển sáng tạo từ dưới lên với phân bổ nguồn lực từ trên xuống, đồng thời thúc đẩy công ty duy trì đà phát triển mạnh mẽ và tính linh hoạt trong đổi mới công nghệ.
Tầm quan trọng của DeepSeek có thể vượt xa sự thành công hay thất bại của một công ty. Nó xác minh một đề xuất lớn hơn: Liệu Trung Quốc có thể phát triển từ "người tiêu dùng công nghệ" thành "người sáng tạo công nghệ" không?
Sau khi DeepSeek quyết định mở mã nguồn, DeepSeek-R1 đã được đưa vào chương trình giảng dạy của 47 trường đại học hàng đầu trên thế giới và có hơn 3.000 dự án phái sinh trên GitHub. "Sự lây lan công nghệ" này đang ươm mầm cho cộng đồng công nghệ AI tiếp theo, đây là bước đột phá và khởi đầu mới cho khoa học và công nghệ Trung Quốc.
Sự trỗi dậy của DeepSeek không chỉ thúc đẩy Trung Quốc suy nghĩ về sự đổi mới công nghệ mà còn khiến OpenAI phải xem xét lại chiến lược nguồn mở.
Trong buổi hỏi đáp trực tuyến trên Reddit gần đây, CEO của OpenAI Altman đã công khai thừa nhận rằng chúng ta đang đi sai hướng trong các mô hình AI có trọng số nguồn mở và nhận ra rằng nguồn đóng không phải là cách duy nhất để duy trì vị thế dẫn đầu.
Ngay sau đó, OpenAI đã khẩn trương ra mắt mô hình o3-mini, người dùng miễn phí cũng có thể sử dụng. Đồng thời, Altman cũng tuyên bố rằng OpenAI đang cân nhắc chiến lược nguồn mở nội bộ và sẽ tiếp tục phát triển các mô hình, nhưng lợi thế dẫn đầu của OpenAI sẽ không còn lớn như trước.
Có thể thấy, DeepSeek do Lương Văn Phong lãnh đạo, "cá trê" này vẫn đang tiếp tục khuấy động cộng đồng công nghệ toàn cầu. #DeepSeek