Phạm Thanh Bình
Writer
Các nhà sản xuất AI của Trung Quốc đã học được cách xây dựng các mô hình AI mạnh mẽ, có hiệu suất kém hơn so với đối thủ tiên tiến nhất của Hoa Kỳ trong khi sử dụng ít tiền, chip và năng lượng hơn nhiều.
Tại sao điều này quan trọng: Các chính sách của Hoa Kỳ hạn chế dòng chất bán dẫn AI cao cấp và bí quyết công nghệ vào Trung Quốc có thể đã giúp duy trì vị thế dẫn đầu ngắn hạn của Hoa Kỳ ở vùng xa của đường cong hiệu suất AI — nhưng chúng cũng thúc đẩy tiến độ của Trung Quốc trong việc xây dựng AI cao cấp hiệu quả hơn.
Vào cuối tháng 12, DeepSeek có trụ sở tại Hàng Châu đã phát hành V3, một mô hình ngôn ngữ lớn nguồn mở có hiệu suất trong nhiều bài kiểm tra chuẩn mực ngang bằng với 4o của OpenAI và Claude 3.5 Sonnet của Anthropic.
Đó là những mô hình AI tiên tiến nhất mà các công ty này hiện đang cung cấp cho công chúng, mặc dù cả OpenAI và Anthropic đều có các mô hình thế hệ tiếp theo đang trong quá trình phát triển.
Thống kê đáng kinh ngạc: Theo công ty, chi phí đào tạo V3 của DeepSeek vào khoảng 5,6 triệu đô la.
OpenAI, Google và Anthropic được cho là đã chi hàng trăm triệu đô la để xây dựng và đào tạo các mô hình hiện tại của họ và dự kiến sẽ chi hàng tỷ đô la trong tương lai.
Người tiên phong về AI Andrej Karpathy gọi khoản đầu tư của DeepSeek là "một trò đùa về ngân sách" và mô tả kết quả là "một màn trình diễn vô cùng ấn tượng về nghiên cứu và kỹ thuật trong điều kiện hạn chế về nguồn lực".
Trong một cuộc phỏng vấn năm ngoái, Giám đốc điều hành của DeepSeek, Liang Wenfeng cho biết: "Tiền chưa bao giờ là vấn đề đối với chúng tôi; lệnh cấm vận chuyển chip tiên tiến mới là vấn đề".
Mô hình V3 được đào tạo trên chip Nvidia H800, một phiên bản chip yếu hơn mà Hoa Kỳ đã cấm xuất khẩu sang Trung Quốc vào năm 2022. Việc xuất khẩu H800 sau đó cũng bị cấm khi Hoa Kỳ thắt chặt kiểm soát trở lại vào năm sau.
Một số quan chức Hoa Kỳ đã đưa ra lập luận để hạn chế hơn nữa quyền tiếp cận chip AI tiên tiến của Trung Quốc với hy vọng làm chậm quá trình phát triển công nghệ của nước này. Vào thứ Hai vừa qua, chính quyền Biden đã công bố một đợt kiểm soát xuất khẩu lớn khác nhằm mục đích ngăn chặn nguồn cung cấp chip cho Trung Quốc thông qua các quốc gia thứ ba.
Những tiến bộ như V3 và mô hình "lý luận" mới mạnh mẽ của OpenAI, o3, đã củng cố thêm những tuyên bố gần đây của Giám đốc điều hành OpenAI Sam Altman và các nhà lãnh đạo khác trong ngành, những người dự đoán ngành này đang tiến gần đến trí tuệ nhân tạo tổng quát (AGI) một cách nhanh chóng. (Nhiều nhà quan sát khác vẫn còn hoài nghi.)
AGI — hay AI có thể giải quyết vấn đề và thực hiện nhiệm vụ ở cấp độ con người hoặc siêu con người — là mục tiêu phấn đấu của các nhà nghiên cứu AI, và nhiều người trong ngành và chính phủ Hoa Kỳ tin rằng nhà phát triển đầu tiên của công nghệ này sẽ giành được lợi thế lớn về kinh tế, khoa học và an ninh.
Các biện pháp kiểm soát xuất khẩu mới nhất của Biden đã khiến một số nhà quan sát kết luận rằng chính phủ cũng chia sẻ nhận định ngày càng tăng rằng AGI đang đến gần.
Gregory Allen, giám đốc Trung tâm AI Wadhwani tại Trung tâm Nghiên cứu Chiến lược và Quốc tế, chia sẻ: "Đây là chính sách 'phòng ngừa trường hợp khẩn cấp' và chính quyền Biden xác định rằng trường hợp khẩn cấp là AGI chỉ còn cách chúng ta vài năm nữa".
Đúng vậy, nhưng: AGI cũng chưa được định nghĩa rõ ràng và cả những người lạc quan lẫn bi quan đều phàn nàn rằng nó đã trở thành một cột mốc di động.
Nguồn: Axios
Tại sao điều này quan trọng: Các chính sách của Hoa Kỳ hạn chế dòng chất bán dẫn AI cao cấp và bí quyết công nghệ vào Trung Quốc có thể đã giúp duy trì vị thế dẫn đầu ngắn hạn của Hoa Kỳ ở vùng xa của đường cong hiệu suất AI — nhưng chúng cũng thúc đẩy tiến độ của Trung Quốc trong việc xây dựng AI cao cấp hiệu quả hơn.
Vào cuối tháng 12, DeepSeek có trụ sở tại Hàng Châu đã phát hành V3, một mô hình ngôn ngữ lớn nguồn mở có hiệu suất trong nhiều bài kiểm tra chuẩn mực ngang bằng với 4o của OpenAI và Claude 3.5 Sonnet của Anthropic.
Đó là những mô hình AI tiên tiến nhất mà các công ty này hiện đang cung cấp cho công chúng, mặc dù cả OpenAI và Anthropic đều có các mô hình thế hệ tiếp theo đang trong quá trình phát triển.
Thống kê đáng kinh ngạc: Theo công ty, chi phí đào tạo V3 của DeepSeek vào khoảng 5,6 triệu đô la.
OpenAI, Google và Anthropic được cho là đã chi hàng trăm triệu đô la để xây dựng và đào tạo các mô hình hiện tại của họ và dự kiến sẽ chi hàng tỷ đô la trong tương lai.
Người tiên phong về AI Andrej Karpathy gọi khoản đầu tư của DeepSeek là "một trò đùa về ngân sách" và mô tả kết quả là "một màn trình diễn vô cùng ấn tượng về nghiên cứu và kỹ thuật trong điều kiện hạn chế về nguồn lực".
Trong một cuộc phỏng vấn năm ngoái, Giám đốc điều hành của DeepSeek, Liang Wenfeng cho biết: "Tiền chưa bao giờ là vấn đề đối với chúng tôi; lệnh cấm vận chuyển chip tiên tiến mới là vấn đề".
Mô hình V3 được đào tạo trên chip Nvidia H800, một phiên bản chip yếu hơn mà Hoa Kỳ đã cấm xuất khẩu sang Trung Quốc vào năm 2022. Việc xuất khẩu H800 sau đó cũng bị cấm khi Hoa Kỳ thắt chặt kiểm soát trở lại vào năm sau.
Một số quan chức Hoa Kỳ đã đưa ra lập luận để hạn chế hơn nữa quyền tiếp cận chip AI tiên tiến của Trung Quốc với hy vọng làm chậm quá trình phát triển công nghệ của nước này. Vào thứ Hai vừa qua, chính quyền Biden đã công bố một đợt kiểm soát xuất khẩu lớn khác nhằm mục đích ngăn chặn nguồn cung cấp chip cho Trung Quốc thông qua các quốc gia thứ ba.
Những tiến bộ như V3 và mô hình "lý luận" mới mạnh mẽ của OpenAI, o3, đã củng cố thêm những tuyên bố gần đây của Giám đốc điều hành OpenAI Sam Altman và các nhà lãnh đạo khác trong ngành, những người dự đoán ngành này đang tiến gần đến trí tuệ nhân tạo tổng quát (AGI) một cách nhanh chóng. (Nhiều nhà quan sát khác vẫn còn hoài nghi.)
AGI — hay AI có thể giải quyết vấn đề và thực hiện nhiệm vụ ở cấp độ con người hoặc siêu con người — là mục tiêu phấn đấu của các nhà nghiên cứu AI, và nhiều người trong ngành và chính phủ Hoa Kỳ tin rằng nhà phát triển đầu tiên của công nghệ này sẽ giành được lợi thế lớn về kinh tế, khoa học và an ninh.
Các biện pháp kiểm soát xuất khẩu mới nhất của Biden đã khiến một số nhà quan sát kết luận rằng chính phủ cũng chia sẻ nhận định ngày càng tăng rằng AGI đang đến gần.
Gregory Allen, giám đốc Trung tâm AI Wadhwani tại Trung tâm Nghiên cứu Chiến lược và Quốc tế, chia sẻ: "Đây là chính sách 'phòng ngừa trường hợp khẩn cấp' và chính quyền Biden xác định rằng trường hợp khẩn cấp là AGI chỉ còn cách chúng ta vài năm nữa".
Đúng vậy, nhưng: AGI cũng chưa được định nghĩa rõ ràng và cả những người lạc quan lẫn bi quan đều phàn nàn rằng nó đã trở thành một cột mốc di động.
Nguồn: Axios