Hoàng Anh
Writer
Công ty Trung Quốc DeepSeek chuyên nghiên cứu trí tuệ nhân tạo AI vừa công bố phiên bản thử nghiệm của DeepSeek-R1, mô hình trí tuệ nhân tạo mới nhất của họ, được thiết kế để cạnh tranh trực tiếp với mô hình ChatGPT o1 của OpenAI.
Tương tự o1, DeepSeek-R1 sử dụng phương pháp lý luận để thực hiện các nhiệm vụ, lập kế hoạch trước và thực hiện các chuỗi hành động phức tạp nhằm đưa ra câu trả lời. Tùy thuộc vào độ phức tạp của câu hỏi, DeepSeek-R1 có thể mất đến vài chục giây để "suy nghĩ" trước khi đưa ra phản hồi.
Theo DeepSeek, phiên bản thử nghiệm DeepSeek-R1-Lite-Preview có hiệu suất ngang bằng với o1-preview của OpenAI trên hai bộ đánh giá AI phổ biến: AIME và MATH. AIME sử dụng các mô hình AI khác để đánh giá hiệu suất, trong khi MATH kiểm tra khả năng giải quyết các bài toán ngôn từ. Tuy nhiên, DeepSeek-R1 không phải là hoàn hảo. Một số người dùng trên mạng xã hội X chỉ ra rằng mô hình này gặp khó khăn với các trò chơi logic đơn giản như tic-tac-toe, điều mà o1 cũng mắc phải.
Ngoài ra, DeepSeek-R1 từ chối trả lời các câu hỏi liên quan đến các vấn đề chính trị nhạy cảm. Khi được hỏi về Chủ tịch Trung Quốc Tập Cận Bình, sự kiện Thiên An Môn, hoặc kịch bản Trung Quốc xâm lược Đài Loan, mô hình đã từ chối phản hồi.
Hành vi này được cho là kết quả từ áp lực của chính phủ Trung Quốc đối với các dự án AI. Các mô hình tại đây phải trải qua quá trình đánh giá từ cơ quan quản lý Internet của Trung Quốc để đảm bảo nội dung phản hồi tuân thủ “các giá trị xã hội cốt lõi.” Chính phủ thậm chí được cho là đã đề xuất một danh sách đen các nguồn dữ liệu không được phép sử dụng để huấn luyện mô hình AI. Điều này dẫn đến việc nhiều hệ thống AI Trung Quốc tránh trả lời các chủ đề có thể gây phản ứng từ các cơ quan quản lý.
Xu hướng này thúc đẩy các phòng thí nghiệm AI lớn tìm kiếm những cách tiếp cận mới. Một trong số đó là “tính toán thời gian thực” (test-time compute), nền tảng của các mô hình như o1 và DeepSeek-R1. Phương pháp này cho phép mô hình dành thêm thời gian xử lý trong quá trình suy luận để hoàn thành nhiệm vụ.
CEO Microsoft Satya Nadella gần đây đã phát biểu tại hội nghị Ignite của công ty rằng, “Chúng ta đang chứng kiến sự xuất hiện của một quy luật mở rộng quy mô mới,” ám chỉ tầm quan trọng của test-time compute trong sự phát triển của AI.
DeepSeek trước đó đã gây áp lực lên các đối thủ lớn như ByteDance, Baidu và Alibaba khi ra mắt DeepSeek-V2, một mô hình phân tích văn bản và hình ảnh đa năng. Điều này buộc các công ty trên phải giảm giá hoặc thậm chí cung cấp miễn phí một số mô hình của họ.
High-Flyer tự xây dựng các cụm máy chủ để huấn luyện mô hình, cụm mới nhất sử dụng 10.000 GPU Nvidia A100 với chi phí lên tới 1 tỷ yên (~138 triệu USD). Doanh nghiệp này, do Liang Wenfeng - một cựu sinh viên khoa học máy tính - sáng lập, đặt mục tiêu đạt được AI “siêu thông minh” thông qua tổ chức DeepSeek.
DeepSeek-R1: Bước tiến trong khả năng lý luận
DeepSeek-R1 được mô tả là một mô hình lý luận tiên tiến, nổi bật với khả năng "tự kiểm chứng" thông qua việc dành nhiều thời gian hơn để xử lý câu hỏi hoặc truy vấn. Điều này giúp mô hình tránh được các sai sót phổ biến mà nhiều hệ thống AI khác thường gặp phải.Tương tự o1, DeepSeek-R1 sử dụng phương pháp lý luận để thực hiện các nhiệm vụ, lập kế hoạch trước và thực hiện các chuỗi hành động phức tạp nhằm đưa ra câu trả lời. Tùy thuộc vào độ phức tạp của câu hỏi, DeepSeek-R1 có thể mất đến vài chục giây để "suy nghĩ" trước khi đưa ra phản hồi.
Theo DeepSeek, phiên bản thử nghiệm DeepSeek-R1-Lite-Preview có hiệu suất ngang bằng với o1-preview của OpenAI trên hai bộ đánh giá AI phổ biến: AIME và MATH. AIME sử dụng các mô hình AI khác để đánh giá hiệu suất, trong khi MATH kiểm tra khả năng giải quyết các bài toán ngôn từ. Tuy nhiên, DeepSeek-R1 không phải là hoàn hảo. Một số người dùng trên mạng xã hội X chỉ ra rằng mô hình này gặp khó khăn với các trò chơi logic đơn giản như tic-tac-toe, điều mà o1 cũng mắc phải.
Những thách thức và hạn chế
Bên cạnh những điểm mạnh, DeepSeek-R1 dễ dàng bị "jailbreak," tức bị khai thác để bỏ qua các biện pháp bảo vệ. Một người dùng đã thành công trong việc khiến mô hình cung cấp công thức chi tiết để sản xuất ma túy methamphetamine.Ngoài ra, DeepSeek-R1 từ chối trả lời các câu hỏi liên quan đến các vấn đề chính trị nhạy cảm. Khi được hỏi về Chủ tịch Trung Quốc Tập Cận Bình, sự kiện Thiên An Môn, hoặc kịch bản Trung Quốc xâm lược Đài Loan, mô hình đã từ chối phản hồi.
Hành vi này được cho là kết quả từ áp lực của chính phủ Trung Quốc đối với các dự án AI. Các mô hình tại đây phải trải qua quá trình đánh giá từ cơ quan quản lý Internet của Trung Quốc để đảm bảo nội dung phản hồi tuân thủ “các giá trị xã hội cốt lõi.” Chính phủ thậm chí được cho là đã đề xuất một danh sách đen các nguồn dữ liệu không được phép sử dụng để huấn luyện mô hình AI. Điều này dẫn đến việc nhiều hệ thống AI Trung Quốc tránh trả lời các chủ đề có thể gây phản ứng từ các cơ quan quản lý.
Thay đổi trong cách phát triển AI
Sự chú ý đến các mô hình lý luận như DeepSeek-R1 đang gia tăng trong bối cảnh "quy luật mở rộng quy mô" - lý thuyết cho rằng cung cấp nhiều dữ liệu và sức mạnh tính toán hơn sẽ làm tăng đáng kể khả năng của AI - đang bị đặt câu hỏi. Nhiều báo cáo gần đây cho thấy hiệu suất của các mô hình từ OpenAI, Google và Anthropic không còn cải thiện nhanh chóng như trước.Xu hướng này thúc đẩy các phòng thí nghiệm AI lớn tìm kiếm những cách tiếp cận mới. Một trong số đó là “tính toán thời gian thực” (test-time compute), nền tảng của các mô hình như o1 và DeepSeek-R1. Phương pháp này cho phép mô hình dành thêm thời gian xử lý trong quá trình suy luận để hoàn thành nhiệm vụ.
CEO Microsoft Satya Nadella gần đây đã phát biểu tại hội nghị Ignite của công ty rằng, “Chúng ta đang chứng kiến sự xuất hiện của một quy luật mở rộng quy mô mới,” ám chỉ tầm quan trọng của test-time compute trong sự phát triển của AI.
Hậu thuẫn tài chính mạnh mẽ
DeepSeek dự kiến sẽ mở mã nguồn DeepSeek-R1 và cung cấp API trong tương lai gần. Công ty này nhận được sự hỗ trợ từ High-Flyer Capital Management, một quỹ đầu tư định lượng của Trung Quốc sử dụng AI để đưa ra các quyết định giao dịch.DeepSeek trước đó đã gây áp lực lên các đối thủ lớn như ByteDance, Baidu và Alibaba khi ra mắt DeepSeek-V2, một mô hình phân tích văn bản và hình ảnh đa năng. Điều này buộc các công ty trên phải giảm giá hoặc thậm chí cung cấp miễn phí một số mô hình của họ.
High-Flyer tự xây dựng các cụm máy chủ để huấn luyện mô hình, cụm mới nhất sử dụng 10.000 GPU Nvidia A100 với chi phí lên tới 1 tỷ yên (~138 triệu USD). Doanh nghiệp này, do Liang Wenfeng - một cựu sinh viên khoa học máy tính - sáng lập, đặt mục tiêu đạt được AI “siêu thông minh” thông qua tổ chức DeepSeek.