Apple muốn AI chạy trực tiếp trên phần cứng thay vì trên đám mây

Nghiên cứu mới nhất của Apple về việc chạy mô hình ngôn ngữ lớn trên điện thoại thông minh cho thấy họ đang cố gắng đuổi kịp các đối thủ về trí tuệ nhân tạo.
Theo nhóm nghiên cứu của Apple, bài báo có tựa đề "LLM in a Frash" đề xuất giải quyết vấn đề cụ thể của tính toán hiện tại trên các thiết bị di động. Họ mô tả cách tiếp cận của họ là "mở đường" cho việc triển khai mô hình ngôn ngữ lớn hiệu quả trên các thiết bị có bộ nhớ hạn chế. Trong ngữ cảnh này, "suy luận" đề cập đến khả năng mô hình ngôn ngữ lớn xử lý thông tin và đưa ra phản hồi trực tiếp trên điện thoại thông minh, mà thường được thực hiện ở các trung tâm dữ liệu với sức mạnh tính toán lớn hơn.
Bài báo được công bố vào ngày 12 tháng 12, nhưng thu hút sự chú ý rộng rãi sau khi trang web nổi tiếng về trí tuệ nhân tạo, Hugging Face, giới thiệu nó vào cuối ngày thứ Tư. Đây là bài viết thứ hai của Apple về sáng tạo AI trong tháng này, theo sau các nỗ lực trước đó để cho phép các mô hình tạo hình ảnh chạy trên chip tùy chỉnh.
Theo Counterpoint Research, các nhà sản xuất điện thoại thông minh và chip hi vọng rằng tính năng AI mới sẽ giúp phục hồi thị trường điện thoại thông minh, đã trải qua một năm tồi tệ nhất trong thập kỷ với giảm ước tính khoảng 5% về lượng xuất xưởng.
Mặc dù Siri, một trợ lý ảo đầu tiên, đã ra mắt vào năm 2011, Apple vẫn tỏ ra đối lập với làn sóng phấn khích về AI có tính sáng tạo trong Thung lũng Silicon từ khi OpenAI giới thiệu ChatGPT. Mặc dù đã thuê Giám đốc điều hành AI hàng đầu của Google, John Giannandrea, vào năm 2018, Apple vẫn bị coi là tụt hậu so với các đối thủ Big Tech.
Apple muốn AI chạy trực tiếp trên phần cứng thay vì trên đám mây
Trong khi Microsoft và Google tập trung vào cung cấp dịch vụ AI qua Internet từ nền tảng điện toán đám mây, nghiên cứu của Apple cho thấy họ đang tập trung vào AI có thể chạy trực tiếp trên iPhone.
Các đối thủ như Samsung cũng chuẩn bị ra mắt "điện thoại thông minh AI" mới vào năm tới, theo ước tính của Counterpoint, có hơn 100 triệu điện thoại thông minh tập trung vào AI sẽ được xuất xưởng vào năm 2024, với 40% trong số đó cung cấp khả năng như vậy vào năm 2027.
Giám đốc điều hành Qualcomm Cristiano Amon, người đứng đầu nhà sản xuất chip di động lớn nhất thế giới, dự đoán rằng việc tích hợp AI vào điện thoại thông minh sẽ mang lại trải nghiệm mới cho người tiêu dùng và có thể đảo ngược tình trạng sụt giảm doanh số di động.
Ông cho biết trong cuộc phỏng vấn gần đây với Financial Times: "Bạn sẽ thấy các thiết bị mới vào đầu năm 2024 với một số trường hợp sử dụng AI tổng quát". Ông nhấn mạnh rằng việc này sẽ tạo ra những thay đổi đáng kể trong trải nghiệm người dùng và mở đường cho cải tiến mới có thể tạo ra chu kỳ nâng cấp mới cho điện thoại thông minh.
Ngoài ra, ông nhấn mạnh rằng các trợ lý ảo phức tạp hơn sẽ có khả năng dự đoán hành động của người dùng và thực hiện các nhiệm vụ như nhắn tin hoặc lên lịch cuộc họp, cũng như thực hiện các chỉnh sửa ảnh mới.
Google cũng đã tiết lộ rằng một phiên bản Gemini LLM mới sẽ chạy "nguyên bản" trên điện thoại thông minh Pixel trong tháng này.
Việc chạy mô hình AI lớn như ChatGPT hoặc Bard của Google trực tiếp trên thiết bị cá nhân mang lại những thách thức kỹ thuật, do điện thoại thông minh có tài nguyên máy tính và năng lượng hạn chế so với trung tâm dữ liệu. Tuy nhiên, giải quyết vấn đề này có thể đồng nghĩa với việc trợ lý AI phản hồi nhanh hơn và thậm chí hoạt động ngoại tuyến.
Điều quan trọng là đảm bảo rằng các truy vấn được xử lý trên thiết bị cá nhân mà không cần gửi dữ liệu lên đám mây, điều này có thể mang lại lợi ích về quyền riêng tư, một điểm mạnh của Apple trong những năm gần đây.
Nhóm nghiên cứu của Apple nhấn mạnh rằng nghiên cứu của họ không chỉ giải quyết vấn đề tính toán hiện tại mà còn đặt nền tảng cho nghiên cứu trong tương lai. Họ tin rằng khi mô hình ngôn ngữ lớn tiếp tục phát triển, các phương pháp tiếp cận này sẽ trở nên ngày càng quan trọng trong việc khai thác toàn bộ tiềm năng của chúng trong nhiều loại thiết bị và ứng dụng.
Apple chưa có phản hồi về thông tin này.
Nguồn: ArsTechnica
 


Đăng nhập một lần thảo luận tẹt ga
Top