Apple Intelligence và Gemini: Biến Phím tắt iPhone thành siêu ứng dụng chỉ bằng lời nói?

Jinu
Jinu
Phản hồi: 0

Jinu

Intern Writer
Dạo gần đây, Apple lại khiến cả giới công nghệ xôn xao không ngừng với một thương vụ "nóng hổi" cùng Google. Sau khi lỡ mất chuyến tàu AI ban đầu và phải dùng tạm ChatGPT, cuối cùng thì Táo Khuyết cũng đã quyết định đặt Gemini (một phiên bản tùy chỉnh, không mang thương hiệu riêng) vào vị trí "lái trưởng" cho các công nghệ của mình. Mục tiêu chính của động thái này là để cải thiện Siri, nâng cấp Apple Intelligence và toàn bộ gói Foundation Models, hứa hẹn mang đến một trải nghiệm iPhone hoàn toàn mới mẻ cho chúng ta.

Vậy điều này có ý nghĩa gì với các bạn? Trước hết, Siri sẽ trở nên thông minh và "nói chuyện" lưu loát hơn rất nhiều, chẳng kém cạnh gì ChatGPT hay Gemini đâu nhé. Chúng ta sẽ không còn gặp cảnh Siri phải "đẩy" câu hỏi của mình sang ChatGPT nữa. Và hy vọng rằng, trợ lý ảo này cuối cùng sẽ thực sự hiểu và thực hiện được các tác vụ trong những ứng dụng khác. Thật ra, Google cũng vừa làm điều tương tự với tính năng Personal Intelligence của mình, cho thấy khả năng cá nhân hóa đáng kinh ngạc.
Untitled-design-53.jpg

Có một điều khá trớ trêu là Apple từng quảng cáo về một Siri "cá nhân hơn" từ rất lâu trước Google, nhưng sau đó lại gỡ bỏ quảng cáo và nói rằng cần thời gian để hoàn thiện một Siri "biết tuốt". Giờ đây, với sự góp mặt của Gemini, Apple có thể làm được nhiều điều hơn thế, và mình thực sự rất háo hức chờ đợi. Tuy nhiên, điều mình mong muốn nhất lúc này lại là Apple hãy "sửa sang" lại ứng dụng Phím tắt (Shortcuts) đi thôi.

Ứng dụng Phím tắt thực sự là một trong những "viên ngọc ẩn" bị đánh giá thấp trên iPhone của chúng ta. Đây là một công cụ cực kỳ mạnh mẽ, có thể khiến các bạn bất ngờ vì khả năng thực hiện vô vàn tác vụ đa bước phức tạp. Và giờ đây, khi Apple Intelligence đã được tích hợp vào ứng dụng này, nó còn có thể làm được những điều cực kỳ "cool ngầu" nữa cơ.

Chỉ với một cú chạm, mình có thể chụp ảnh màn hình video đang phát, nhận diện bộ phim hoặc chương trình TV đó là gì, và thậm chí còn cho biết mình có thể xem nó ở đâu. Hay chỉ cần một lần chạm nữa là biến một ảnh chụp màn hình thành một "ký ức" trong ứng dụng Ghi chú, với các thẻ tìm kiếm tùy chỉnh, một bản tóm tắt ngắn gọn nội dung và cả URL nguồn nữa.

Những tác vụ được hỗ trợ bởi AI này có thể được xử lý bởi ChatGPT hoặc thậm chí là các mô hình AI chạy trực tiếp trên thiết bị của Apple, hoàn toàn ngoại tuyến. Các bạn thấy tiềm năng khổng lồ của nó rồi chứ? À mà, đó cũng là lúc bức tranh màu hồng kết thúc. Bởi vì việc tạo các phím tắt trong ứng dụng này thực sự là một công việc "đau đầu" đối với những người mới bắt đầu.

Ngay cả với những người dùng chuyên nghiệp, việc tạo ra một quy trình tự động hóa dài cũng đòi hỏi sự kiên nhẫn. Hệ thống kịch bản với các biến số và luồng điều khiển khá mơ hồ, thực sự rất khó hiểu. Các bạn gần như chắc chắn sẽ phải đọc một bài hướng dẫn dài dòng mới có thể nắm bắt được. Và ngay cả sau đó, chúng ta vẫn có thể cảm thấy lạc lõng khi thực sự bắt tay vào xây dựng một phím tắt.

Toàn bộ hệ thống này dựa vào các mã và từ khóa mà đôi khi chúng ta còn không biết chúng tồn tại. Chỉ khi tìm kiếm đúng ứng dụng mà tác vụ cần xử lý, các bạn mới nhận ra "À, có một hành động liên kết ở đây này." Vậy tại sao không dùng ChatGPT để mô tả các bước, rồi chỉ việc lặp lại chúng trong ứng dụng Phím tắt nhỉ?

Ước gì mình có thể nói rằng điều đó hiệu quả. Nhưng thực tế là ChatGPT sẽ khiến các bạn rơi vào một mớ bòng bong phức tạp hơn nữa, với những bước mơ hồ và thường là những hướng dẫn sai lệch, không hề tồn tại trong ứng dụng Phím tắt. Chẳng có gì ngạc nhiên khi số lượng email mình nhận được nhiều nhất lại là về Phím tắt, hỏi về hướng dẫn hoặc chia sẻ liên kết iCloud trực tiếp.

Hãy tưởng tượng chúng ta nói: "Này Siri, tạo một Phím tắt tự động bật chế độ tập trung lúc 4 giờ chiều, tắt tiếng tất cả thông báo trừ Slack, và gửi cho mình bản tóm tắt các cuộc trò chuyện nhóm." Và Siri sẽ tạo phím tắt đó cho các bạn. Nghe có vẻ như một giấc mơ viển vông với tình trạng ứng dụng Phím tắt (và Siri) hiện tại, đúng không?

Nhưng có một tin tốt, điều này lại được xây dựng dựa trên thỏa thuận Gemini cho Siri. Apple đã có một hệ thống cho phép Siri và Apple Intelligence tương tác với các ứng dụng. Nói một cách đơn giản, AI trên thiết bị đã nhận biết được các hành động mà nó có thể thực hiện trong các ứng dụng, mà không cần phải mở các ứng dụng đó lên.

Apple giải thích rằng: "Với Apple Intelligence và những cải tiến đối với App Intents, Siri sẽ đề xuất các hành động của ứng dụng bạn để giúp mọi người khám phá các tính năng của ứng dụng và có khả năng thực hiện hành động trong và giữa các ứng dụng".

Gemini của Google đã có thể làm điều đó, không chỉ trong các ứng dụng của riêng Google (như Gmail hay Lịch), mà còn cả các ứng dụng bên thứ ba như WhatsApp. Các bạn chỉ cần yêu cầu Gemini thực hiện một tác vụ, và nó sẽ xử lý như mô tả. Siri cũng có thể làm được điều tương tự, về mặt kỹ thuật là vậy.

Nhưng điều mình thực sự mong muốn là hệ thống "chuyển đổi cuộc trò chuyện thành hành động" này được áp dụng trong ứng dụng Phím tắt. Hay nói chính xác hơn, hãy để Siri tạo phím tắt trực tiếp bằng mô tả ngôn ngữ tự nhiên. Với một nền tảng đã có sẵn, điều này lẽ ra không phải là một vấn đề lớn.

Mình tin rằng Siri là thách thức lớn hơn cho đến nay, một phần vì khả năng hiểu ngôn ngữ và suy luận của nó còn kém xa so với những gì chúng ta trải nghiệm với ChatGPT hay Gemini. Hoặc, Apple có thể cung cấp một tác nhân AI giúp tạo và sửa đổi phím tắt bằng lệnh văn bản hoặc giọng nói.

Chúng ta đang sống trong thời đại mà các tác nhân AI đã có thể chỉnh sửa video bằng giọng nói trên điện thoại, xây dựng trang web, trò chơi nhỏ và nhiều hơn nữa. Với một nền tảng vững chắc đã được thiết lập, đây là một cơ hội tuyệt vời để Apple cuối cùng cũng mang lại giá trị xứng đáng cho Phím tắt bằng cách đơn giản hóa quy trình làm việc.

Mình vừa đọc được thông báo mới nhất từ Replit. Công ty này đã công bố một công cụ được hỗ trợ bởi AI có thể tạo ra một ứng dụng hoạt động đầy đủ và đẩy nó lên App Store, chỉ với một mô tả bằng văn bản. Nghe cứ như thể chúng ta có thể "ước" một ứng dụng thành hiện thực vậy.

Ý tưởng này rất tham vọng, nhưng không phải người dùng iPhone nào cũng muốn trải qua rắc rối khi phải kiểm duyệt và xuất bản ứng dụng trên cửa hàng của Apple. Tuy nhiên, Phím tắt chắc chắn có thể hưởng lợi từ một điều gì đó tương tự. Hãy nhìn sang Nothing, một "ngôi sao mới nổi" trong giới Android. Công ty này gần đây đã ra mắt một công cụ tên là Playground, một bộ công cụ AI cho phép các bạn chỉ cần mô tả một ứng dụng và xây dựng nó.

Đây là một nền tảng không cần mã hóa, hoạt động hoàn toàn trên điện thoại. Chúng ta không cần phải đối phó với bất kỳ công cụ xây dựng ứng dụng phức tạp nào trên máy tính để bàn. Những ứng dụng nhỏ này có thể được chia sẻ với cộng đồng, và các bạn có thể tự do chọn một cái từ bảng điều khiển công khai và điều chỉnh theo ý thích của mình. Google, mặt khác, cũng cung cấp một công cụ tương tự tên là Opal để xây dựng các ứng dụng dựa trên web bằng Gemini.

Apple hoàn toàn có thể học hỏi ý tưởng đó và cho phép người dùng xây dựng các Phím tắt có thể ngay lập tức biến thành một phiên bản ứng dụng. Ứng dụng Phím tắt đã có một cộng đồng toàn cầu rộng lớn, đặc biệt là nơi người dùng chia sẻ các quy trình tự động hóa hữu ích dưới dạng liên kết iCloud.

Nhưng đối với nhiều người dùng, việc làm cho các phím tắt này hoạt động có thể gặp rắc rối, đặc biệt nếu họ muốn tùy chỉnh chúng. Một Phím tắt được chia sẻ dưới dạng một ứng dụng nhỏ, và cho phép xây dựng (và tùy chỉnh) thông qua đối thoại, có thể là một yếu tố thay đổi cuộc chơi.

Thay vì đặt niềm tin vào các ứng dụng bên thứ ba, chạy trên máy chủ đám mây hoặc bị ràng buộc bởi mô hình đăng ký, người dùng có thể đơn giản hoàn thành công việc bằng cách sử dụng các phím tắt (được ngụy trang thành ứng dụng). Lợi ích quan trọng là các Phím tắt này có thể chạy hoàn toàn ngoại tuyến, hoặc sử dụng tính toán đám mây riêng tư an toàn của Apple cho các tác vụ dựa trên AI.

Với Gemini xuất hiện, khả năng là vô tận. Trải nghiệm iPhone chắc chắn sẽ thay đổi đáng kể, nếu nhìn vào những gì Android đang làm. Nhưng nếu Apple có thể mang đến một cuộc đại tu tương tự được hỗ trợ bởi AI cho ứng dụng Phím tắt, điều đó không chỉ giải quyết một vấn đề dai dẳng mà còn mang lại cho người dùng iPhone một lợi thế độc đáo mà không có ở bất kỳ nơi nào khác trên điện thoại thông minh ở cấp độ gốc.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL2FwcGxlLWludGVsbGlnZW5jZS12YS1nZW1pbmktYmllbi1waGltLXRhdC1pcGhvbmUtdGhhbmgtc2lldS11bmctZHVuZy1jaGktYmFuZy1sb2ktbm9pLjc4MjgxLw==
Top