Con voi còi
Writer
Google vừa đóng gói luôn "cách dùng AI đúng cách" thành một gói cài đặt một dòng lệnh.
Đó là gemma-skills, bộ kỹ năng sẵn có dành cho AI agent vừa được Google phát hành lần đầu.
Thay vì tự đọc tài liệu rồi hướng dẫn lại cho công cụ lập trình, bạn chỉ cần nạp skill này vào agent. Agent sẽ tự hiểu cách làm việc đúng với các mô hình Gemma của Google, không cần cấu hình thêm.
Cách cài cũng rất gọn. Google thông báo bạn có thể nạp toàn bộ skill bằng một dòng lệnh duy nhất, qua hai nền tảng là Vercel hoặc Context7.
Sau khi cài, agent được trang bị ba khả năng chính. Một là dùng MTP để tăng tốc độ xử lý. Hai là tự chọn đúng kích thước mô hình phù hợp với từng nhu cầu. Ba là tra đúng tài liệu và tài nguyên mới nhất thay vì dựa vào thông tin cũ.
Điểm đáng chú ý nhất là MTP, tức Multi-Token Prediction. Thông thường, mô hình AI sinh ra từng từ một theo thứ tự. MTP cho phép mô hình dự đoán trước nhiều từ cùng lúc rồi kiểm tra lại trong một lượt. Google cho biết kỹ thuật này giúp Gemma 4 chạy nhanh hơn khoảng ba lần mà không làm giảm chất lượng. Với những ai xây agent cần lập kế hoạch nhiều bước hay ứng dụng chạy trực tiếp trên thiết bị, đây là con số đáng kể.
gemma-skills dành cho ai? Chủ yếu là lập trình viên và người xây dựng AI agent. Tuy nhiên, nó phản ánh một xu hướng rộng hơn: các hãng công nghệ không chỉ phát hành mô hình AI mà còn đóng gói luôn cách dùng đúng vào trong đó. Người dùng bớt phải mò mẫm tài liệu, agent được trang bị sẵn từ đầu.
Đó là gemma-skills, bộ kỹ năng sẵn có dành cho AI agent vừa được Google phát hành lần đầu.
Thay vì tự đọc tài liệu rồi hướng dẫn lại cho công cụ lập trình, bạn chỉ cần nạp skill này vào agent. Agent sẽ tự hiểu cách làm việc đúng với các mô hình Gemma của Google, không cần cấu hình thêm.
Cách cài cũng rất gọn. Google thông báo bạn có thể nạp toàn bộ skill bằng một dòng lệnh duy nhất, qua hai nền tảng là Vercel hoặc Context7.
Sau khi cài, agent được trang bị ba khả năng chính. Một là dùng MTP để tăng tốc độ xử lý. Hai là tự chọn đúng kích thước mô hình phù hợp với từng nhu cầu. Ba là tra đúng tài liệu và tài nguyên mới nhất thay vì dựa vào thông tin cũ.
Điểm đáng chú ý nhất là MTP, tức Multi-Token Prediction. Thông thường, mô hình AI sinh ra từng từ một theo thứ tự. MTP cho phép mô hình dự đoán trước nhiều từ cùng lúc rồi kiểm tra lại trong một lượt. Google cho biết kỹ thuật này giúp Gemma 4 chạy nhanh hơn khoảng ba lần mà không làm giảm chất lượng. Với những ai xây agent cần lập kế hoạch nhiều bước hay ứng dụng chạy trực tiếp trên thiết bị, đây là con số đáng kể.
gemma-skills dành cho ai? Chủ yếu là lập trình viên và người xây dựng AI agent. Tuy nhiên, nó phản ánh một xu hướng rộng hơn: các hãng công nghệ không chỉ phát hành mô hình AI mà còn đóng gói luôn cách dùng đúng vào trong đó. Người dùng bớt phải mò mẫm tài liệu, agent được trang bị sẵn từ đầu.