Sự khác biệt của Macbook so với những chiếc máy tính AI khác

Homelander The Seven
Homelander The Seven
Phản hồi: 0

Homelander The Seven

I will laser every f****** one of you!
Apple gần đây đã ra mắt hai sản phẩm Mac, một ở phân khúc cao cấp và một ở phân khúc phổ thông. MacBook Air là dòng Mac nhập môn, từ lâu đã là chiếc Mac bán chạy nhất. Nó có mức giá dành cho sinh viên và giáo viên, dễ tiếp cận, chú trọng đến chất lượng trải nghiệm, đóng vai trò là cửa ngõ vào thế giới máy tính của Apple. Mặt khác, Mac Studio là một sản phẩm có hiệu năng tương đương với máy tính để bàn dạng tháp (tower) dù có kích thước nhỏ gọn, nhưng lần này, đặc biệt có một phiên bản với bộ nhớ thống nhất 512GB.

Cả hai sản phẩm đều có nhiều cải tiến và điểm nhấn bán hàng mới, nhưng điểm chung của hai sản phẩm ở hai thái cực này là đều theo đuổi "hiệu năng AI cao". Việc hai sản phẩm có vị trí hoàn toàn khác nhau được công bố cùng lúc và có chung một điểm độc đáo không phải là ngẫu nhiên. Bởi vì Apple có thể phát huy thế mạnh cốt lõi của chip Apple silicon (bộ xử lý M) do hãng tự phát triển trong lĩnh vực xử lý AI.

M4 trên MacBook Air mới có tốc độ xử lý CPU đa lõi (multi-core) nhanh hơn khoảng 1,5 lần so với M2 hai thế hệ trước, một sự cải thiện đáng kể. Trong xử lý Photoshop, nó vượt trội hơn một chút so với M3 Pro, và xử lý GPU cũng nhanh hơn, cho thấy hiệu suất cao hơn 43% so với M2 trong phần mềm chỉnh sửa video DaVinci Resolve.

1741944120971.png


Có thể kể đến các tính năng tiêu biểu như siêu phân giải và nhận dạng đối tượng trong ứng dụng chỉnh sửa ảnh, nhận dạng đối tượng và tự động tạo khung hình trong ứng dụng chỉnh sửa video, chức năng chuyển giọng nói thành văn bản. Các chức năng AI đã bắt đầu đến tay chúng ta theo nhiều cách khác nhau, ngay cả trước khi chúng được tích hợp vào hệ điều hành.

Ngay cả khi so sánh với M2 MacBook Air có thiết kế bên ngoài giống hệt, hiệu năng cũng được cải thiện đáng kể. Geekbench ML (tên đã được đổi thành Geekbench AI trước và sau khi thử nghiệm, nhưng về cơ bản là giống nhau) đo lường hiệu suất của các tác vụ học tập và suy luận trong AI, có thể đo lường trên các mạch xử lý khác nhau như CPU, GPU và Neural Engine.

CPU và GPU cũng có thông lượng xử lý được cải thiện, nhưng điều này có thể được coi là nằm trong phạm vi tiến hóa bình thường của công nghệ bán dẫn. Tuy nhiên, khi nhìn vào điểm số của Neural Engine, kết quả tính toán ở độ chính xác tiêu chuẩn chỉ khác biệt một chút do tần số xung nhịp tăng lên một chút, nhưng sự khác biệt trở nên rõ ràng hơn khi độ chính xác giảm xuống một nửa, và điểm số khi lượng tử hóa (quantization) là 51205 điểm trên M4, so với 29019 điểm trên M2, một sự cải thiện đáng kể gần 1,8 lần.

Khi thực hiện xử lý siêu phân giải trong Pixelmator Pro, kết quả cho thấy sự cải thiện gần tương đương với con số này. Neural Engine được cho là đã tăng tốc gấp đôi để phù hợp với Apple Intelligence, nhưng có vẻ như việc cải thiện hiệu suất trên dữ liệu lượng tử hóa là chìa khóa cho sự cải tiến này.

1741944128696.png


Việc cải tiến để xử lý dữ liệu lượng tử hóa nhanh hơn có thể sẽ có hiệu quả trong việc tăng tốc không chỉ các mô hình ngôn ngữ trên thiết bị như Apple Intelligence, mà còn cả việc nhận dạng đối tượng, vốn cũng dựa vào việc tham chiếu các mô hình AI. Neural Engine mới, với khả năng xử lý dữ liệu lượng tử hóa được cải thiện, không có trên M3, và là một phần đáng mong đợi trên các máy Mac được trang bị dòng M4 trở lên.

Có thể nói điều này với Copilot+ PC do Microsoft thúc đẩy, nhưng chìa khóa để tích hợp các chức năng AI trên thiết bị là việc cải tiến các công cụ suy luận này là không thể thiếu. Mặt khác, Mac Studio được công bố cùng lúc, ngoài M4 Max đã được trang bị cho MacBook Pro, còn có mẫu M3 Ultra.

M4 Max là một chip cao cấp, tiết kiệm điện, đáp ứng hiệu năng cần thiết cho các nhà sáng tạo chỉ với một chip, nhưng như đã thấy trong bối cảnh cho đến nay, nó cũng đã được cải thiện hiệu năng về mặt AI trên thiết bị, chẳng hạn như Neural Engine mới xử lý dữ liệu lượng tử hóa nhanh hơn.

Tuy nhiên, như đã thấy trong bối cảnh cho đến nay, Neural Engine được trang bị trong M3 không phải là loại tăng cường tốc độ xử lý dữ liệu lượng tử hóa, mà là thiết kế của thế hệ trước. Về mặt giá cả, các cấu hình tương tự cũng rẻ hơn trên các mẫu được trang bị M4 Max, và theo lẽ thường, không có nhiều lý do để chọn M3 Ultra.

1741944140520.png


Ngay cả đối với những nhà sáng tạo đang tìm kiếm hiệu năng cao cấp, nếu bộ nhớ lên đến 128GB là đủ, tôi khuyên dùng M4 Max. Nhân tiện, điểm số lượng tử hóa trong Geekbench ML của M3 Ultra là 32679 điểm, không bằng M4. Tuy nhiên, M3 Ultra có thể được trang bị nhiều bộ nhớ hơn, lên đến 512GB. Nói cách khác, có thể nói rằng M3 Ultra tồn tại cho các thể loại có thể tận dụng dung lượng bộ nhớ này.

Vậy, đó là thể loại nào?

Đó là trường hợp sử dụng LM Studio để chạy các mô hình ngôn ngữ lớn trên một máy tính cục bộ. Vì thời gian chạy suy luận hoạt động bằng GPU, việc Neural Engine thuộc thế hệ cũ không phải là vấn đề, và tính song song của GPU 80 lõi phát huy tác dụng.

Nếu chỉ so sánh hiệu suất xử lý AI, silicon của NVIDIA vượt trội hơn Apple. Tuy nhiên, khi so sánh các máy tính cá nhân đơn lẻ, bộ nhớ được trang bị trong một GPU duy nhất tối đa là 24GB. Nói cách khác, dung lượng của mô hình AI được tham chiếu nhỏ hơn thế. Trong trường hợp Mac Studio được trang bị M3 Ultra với bộ nhớ 512GB, bộ nhớ có thể truy cập từ GPU, theo hiển thị của LM Studio, là 384GB. Kích thước của mô hình AI mà GPU có thể truy cập lớn hơn 15 lần so với card GPU cao cấp.

Đối với các mô hình AI đã được đào tạo trước và được công bố tại thời điểm này, mô hình lượng tử hóa 3 bit DeepSeek V3 cấp 600 tỷ tham số là 319GB (mô hình lượng tử hóa 4 bit là 404GB và không hoạt động), mô hình lượng tử hóa 2 bit là 221GB.

Có thể hoạt động thoải mái với tốc độ khoảng 10-18 token mỗi giây với mô hình lượng tử hóa 3 bit của DeepSeek V3, nhưng kích thước ngữ cảnh (context size) (vùng nhớ để ghi nhớ ngữ cảnh) càng lớn thì càng dễ sử dụng. Trên thực tế, gồm cả tốc độ, có lẽ tốt hơn là nên giới hạn ở các mô hình AI cấp 200GB. Tuy nhiên, với một mô hình có quy mô như vậy có thể ứng dụng vào công việc bằng cách chuyên biệt hóa mục đích sử dụng.

1741944150253.png


Việc xử lý kết xuất 3D sử dụng GPU trong Cinema 4D đã đề cập ở trên cũng đã được tăng tốc, nhưng xét về hiệu suất chi phí, M4 Max vượt trội hơn. Tuy nhiên, người ta nói rằng có thể tự động hóa các hoạt động của Cinema 4D bằng cách sử dụng LM Studio để tạo tập lệnh Python. Ví dụ: nếu bạn yêu cầu LLM "Viết tập lệnh C4D để đặt ngẫu nhiên 100 quả cầu có bán kính 10 cm và gán các màu khác nhau cho mỗi quả cầu", mã Python tương ứng cho Cinema 4D sẽ được tạo và nếu bạn ra lệnh cho chuyển động máy ảnh, các cài đặt đó cũng sẽ được thực hiện.

Việc sử dụng LLM để viết mã, tất nhiên, có thể được thực hiện trong các công cụ phát triển như Xcode, nhưng trong thế giới sáng tạo video, người ta cho rằng có những nhà sáng tạo không giỏi lập trình, trên hết, lợi thế của việc có thể tập trung vào sáng tạo thuần túy là rất lớn. Có thể triển khai bộ nhớ lớn như vậy và chia sẻ nó giữa các bộ xử lý khác nhau như CPU và GPU là nhờ bộ nhớ thống nhất (unified memory) độc đáo của Apple, nhưng bằng cách trang bị nhiều bộ nhớ hơn nữa, chúng ta có thể thấy cách sử dụng "LLM cục bộ" + "ứng dụng nghiệp vụ/sáng tạo" cùng tồn tại.

Ví dụ về M3 Ultra có phần hơi cực đoan, nhưng về lâu dài, nó cho thấy xu hướng của thế hệ tiếp theo trong các máy tính cá nhân khác nhau. Khi việc sử dụng AI tiến triển, kích thước của mô hình được tham chiếu sẽ lớn hơn, hoặc các loại mô hình sẽ đa dạng hóa theo mục đích. Khi đó, việc đảm bảo vùng nhớ để tải chúng và làm cho chúng có thể chia sẻ giữa CPU, GPU và công cụ suy luận sẽ trở nên quan trọng hơn trong tương lai.

Có vẻ như các công ty khác nhau đã chuyển hướng theo hướng đó, nhưng các sản phẩm của Intel và AMD, vốn là chiến trường chính của PC, chia sẻ một hệ thống và kiến trúc quá lớn để không thể tích hợp hệ thống bộ nhớ vào bên trong chip, và Qualcomm, vốn là chiến trường chính của điện thoại thông minh, không có nền tảng để mở rộng quy mô. NVIDIA, bá chủ của thời đại AI, có thể sẽ tiếp tục phát triển với nhu cầu trung tâm dữ liệu, nhưng không có nền tảng công nghệ cho máy tính cá nhân.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top