Nhai kỹ sống chậm
Writer
xAI vừa công bố Grok 3. Đây là mọi thứ bạn cần biết 
Elon Musk và ba kỹ sư xAI tại buổi ra mắt Grok-3 sáng nay giờ Việt Nam (18/2/2025).
Elon đề cập rằng Grok 3 có khả năng mạnh mẽ hơn Grok 2 rất nhiều.
Tổng số GPU: 200K. Công suất đã tăng gấp đôi trong 92 ngày!
Toàn bộ quá trình tính toán này đã được sử dụng để cải thiện Grok -- dẫn đến Grok 3.
Grok 3 liên quan đến việc đào tạo nhiều hơn Grok 2 gấp 10 lần! Grok đã hoàn thành quá trình đào tạo trước vào đầu tháng 1!
Mô hình vẫn đang được đào tạo.
Sau đây là các số liệu benchmark: Grok 3 vượt trội hơn hẳn các mẫu khác trong cùng loại như Gemini 2 Pro và GPT-4o. Ngay cả Grok-3 mini cũng cho thấy khả năng cạnh tranh.
Kết quả của Grok 3 ban đầu trong Chatbot Arena (LMSYS). Nó đạt điểm Elo là 1400 mà không có mô hình nào khác đạt được.
Điểm của mô hình tiếp tục được cải thiện.
Grok 3 cũng có khả năng suy luận RL nữa! Nhóm Grok đã thử nghiệm những khả năng này mà họ đã mở khóa bằng RL. Mô hình này tốt, đặc biệt là trong mã hóa.
Ví dụ Grok 3 viết mã: Dấu vết suy nghĩ được tạo ra khi mô hình cố gắng giải quyết vấn đề. Elon xác nhận rằng các bước suy nghĩ đã bị che khuất để tránh bị sao chép.
Grok 3 cũng rất xuất sắc trong việc lập trình sáng tạo như tạo ra các trò chơi mới lạ và sáng tạo.
Elon nhấn mạnh khả năng sáng tạo mới nổi của Grok 3. Bạn cũng có thể sử dụng chế độ Big Brain để sử dụng nhiều tính toán và lý luận hơn với Grok 3.
Hiệu suất của Grok 3 Reasoning:
Kết quả tương ứng với phiên bản beta của Grok-3 Reasoning. Nó vượt trội hơn o1 và DeepSeek-R1 khi được cung cấp nhiều thời gian tính toán thử nghiệm hơn (cho phép nó suy nghĩ lâu hơn). Mô hình Grok 3 mini Reasoning cũng rất có khả năng.
Hiệu suất Grok 3 Reasoning Beta trên AIME 2025.
Grok 3 cho thấy khả năng khái quát hóa. Nó không chỉ thực hiện mã hóa và giải quyết vấn đề toán học mà còn có thể thực hiện các nhiệm vụ sáng tạo và hữu ích khác trong thế giới thực.
Một trong những kết quả được tạo ra bằng Grok 3 mini.
Bejeweled Tetris được tạo ra bởi Grok 3.
Grok 3 không chỉ có thể mở khóa khả năng tính toán thời gian thử nghiệm mà còn cho phép các tác nhân có năng lực.
Những khả năng này đã dẫn đến một sản phẩm mới có tên là DeepSearch. "Thế hệ tác nhân tìm kiếm tiếp theo để hiểu vũ trụ"
Thêm thông tin về DeepSearch:
- mô hình có thể suy nghĩ sâu sắc về ý định của người dùng
- những sự kiện nào cần xem xét
- có bao nhiêu trang web để duyệt
- nó có thể xác thực chéo các nguồn khác nhau
DeepSearch cũng tiết lộ các bước cần thực hiện để tiến hành tìm kiếm.
Theo nhóm, các cải tiến sẽ diễn ra nhanh chóng và hầu như hàng ngày. Cũng sẽ có một ứng dụng giọng nói do Grok cung cấp nữa -- khoảng một tuần nữa!
Phương pháp mã nguồn mở:
Phiên bản cuối cùng sẽ được mã nguồn mở khi phiên bản mới nhất được phát hành hoàn toàn.
Sau khi phiên bản ổn định của Grok 3 được phát hành, rất có thể Grok 2 sẽ được mã nguồn mở. (trong vòng vài tháng) #Grok3


Elon Musk và ba kỹ sư xAI tại buổi ra mắt Grok-3 sáng nay giờ Việt Nam (18/2/2025).
Elon đề cập rằng Grok 3 có khả năng mạnh mẽ hơn Grok 2 rất nhiều.

Tổng số GPU: 200K. Công suất đã tăng gấp đôi trong 92 ngày!
Toàn bộ quá trình tính toán này đã được sử dụng để cải thiện Grok -- dẫn đến Grok 3.

Grok 3 liên quan đến việc đào tạo nhiều hơn Grok 2 gấp 10 lần! Grok đã hoàn thành quá trình đào tạo trước vào đầu tháng 1!
Mô hình vẫn đang được đào tạo.

Sau đây là các số liệu benchmark: Grok 3 vượt trội hơn hẳn các mẫu khác trong cùng loại như Gemini 2 Pro và GPT-4o. Ngay cả Grok-3 mini cũng cho thấy khả năng cạnh tranh.

Kết quả của Grok 3 ban đầu trong Chatbot Arena (LMSYS). Nó đạt điểm Elo là 1400 mà không có mô hình nào khác đạt được.
Điểm của mô hình tiếp tục được cải thiện.

Grok 3 cũng có khả năng suy luận RL nữa! Nhóm Grok đã thử nghiệm những khả năng này mà họ đã mở khóa bằng RL. Mô hình này tốt, đặc biệt là trong mã hóa.
Ví dụ Grok 3 viết mã: Dấu vết suy nghĩ được tạo ra khi mô hình cố gắng giải quyết vấn đề. Elon xác nhận rằng các bước suy nghĩ đã bị che khuất để tránh bị sao chép.

Grok 3 cũng rất xuất sắc trong việc lập trình sáng tạo như tạo ra các trò chơi mới lạ và sáng tạo.
Elon nhấn mạnh khả năng sáng tạo mới nổi của Grok 3. Bạn cũng có thể sử dụng chế độ Big Brain để sử dụng nhiều tính toán và lý luận hơn với Grok 3.

Hiệu suất của Grok 3 Reasoning:
Kết quả tương ứng với phiên bản beta của Grok-3 Reasoning. Nó vượt trội hơn o1 và DeepSeek-R1 khi được cung cấp nhiều thời gian tính toán thử nghiệm hơn (cho phép nó suy nghĩ lâu hơn). Mô hình Grok 3 mini Reasoning cũng rất có khả năng.

Hiệu suất Grok 3 Reasoning Beta trên AIME 2025.
Grok 3 cho thấy khả năng khái quát hóa. Nó không chỉ thực hiện mã hóa và giải quyết vấn đề toán học mà còn có thể thực hiện các nhiệm vụ sáng tạo và hữu ích khác trong thế giới thực.

Một trong những kết quả được tạo ra bằng Grok 3 mini.

Bejeweled Tetris được tạo ra bởi Grok 3.

Grok 3 không chỉ có thể mở khóa khả năng tính toán thời gian thử nghiệm mà còn cho phép các tác nhân có năng lực.
Những khả năng này đã dẫn đến một sản phẩm mới có tên là DeepSearch. "Thế hệ tác nhân tìm kiếm tiếp theo để hiểu vũ trụ"

Thêm thông tin về DeepSearch:
- mô hình có thể suy nghĩ sâu sắc về ý định của người dùng
- những sự kiện nào cần xem xét
- có bao nhiêu trang web để duyệt
- nó có thể xác thực chéo các nguồn khác nhau

DeepSearch cũng tiết lộ các bước cần thực hiện để tiến hành tìm kiếm.

Theo nhóm, các cải tiến sẽ diễn ra nhanh chóng và hầu như hàng ngày. Cũng sẽ có một ứng dụng giọng nói do Grok cung cấp nữa -- khoảng một tuần nữa!
Phương pháp mã nguồn mở:
Phiên bản cuối cùng sẽ được mã nguồn mở khi phiên bản mới nhất được phát hành hoàn toàn.
Sau khi phiên bản ổn định của Grok 3 được phát hành, rất có thể Grok 2 sẽ được mã nguồn mở. (trong vòng vài tháng) #Grok3