14/06/2019, 00:00Hà Nội

Cựu giám đốc Siri của Apple: "các trợ lý ảo còn cả một chặng đường dài phía trước"

Dù;đã có những cải tiến đáng kể so với vài năm trước đây trước đây nhưng các trợ lý ảo như Siri hay Google Assistant vẫn còn nhiều việc phải làm để có thể hiểu được hết những yêu cầu từ người dùng.

Trong Hội nghị các nhà phát triển toàn cầu WWDC hồi đầu tháng này, Apple thông báo rằng Siri sẽ mang giọng nói tự nhiên hơn, được phần mềm điều chỉnh hoàn toàn sau khi bản cập nhật iOS 13 cho iPhone phát hành vào cuối năm nay. Trong khi đó, tháng 5 vừa rồi, Google tiết lộ trợ lý ảo sắp tới của công ty có thể hiểu và xử lý các yêu cầu nhanh hơn tới 10 lần, còn Amazon gần đây đã tung ra phiên bản mới của loa thông minh Echo Show tích hợp tính năng Alexa.

"Mặc dù các trợ lý ảo như Siri của Apple, Google Assistant và Alexa của Amazon đã phát triển nhanh chóng trong những năm gần đây, nhưng các công nghệ này vẫn còn cả một chặng đường dài" – trích lời Bill Stasior, người gần đây rời khỏi Apple và gia nhập công ty chẩn đoán gen và phát triển trị liệu Avellino Labs với vai trò là thành viên ủy ban cố vấn điều hành. Stasior làm cho Apple vào năm 2012 và làm trưởng nhóm nghiên cứu cập nhật Siri cho đến khi ông rời công ty vào tháng 5.

Trợ lý ảo ngày nay có thể làm được mọi thứ, từ khởi động máy pha cà phê sau khi bạn tắt báo thức cho đến đặt chỗ tại nhà hàng yêu thích. Tuy nhiên, khả năng được cải thiện vượt trội nhất của trợ lý công nghệ trong vòng 3 – 5 năm tới chỉ là một điều duy nhất: hiểu rõ hơn chúng ta nói những gì.

Trong một cuộc phỏng vấn gần đây, Stasior chia sẻ với trang Business Insider: "Theo tôi, chưa có trợ lý ảo nào thực sự đạt được đúng mục tiêu, là có khả năng hiểu được người dùng một cách tự nhiên như những người bình thường khác. Tôi nghĩ, giờ mọi người đều đã biết những câu lệnh nào có thể áp dụng và những câu lệnh nào không thể áp dụng cho các trợ lý công nghệ. Và trong khi điều đó đang được cải thiện rất nhanh ngay tại thời điểm hiện tại, tôi tin rằng các trợ lý ảo vẫn còn cả một chặng đường dài phía trước để hoàn thiện mình."

Stasior cho biết, một trong những nguyên nhân khiến tính năng trợ giúp khó có thể hiểu lời nói của con người một cách tự nhiên là hầu hết các công nghệ chỉ xử lý được một số tác vụ nhất định. Chúng không có hiểu biết chung về thế giới quan của con người.

Ông khẳng định: "Khi bạn muốn ra lệnh cho trợ lý ảo, bạn đang để ngỏ khả năng đặt ra hầu hết nhiệm vụ hoặc bất kỳ câu hỏi nào. Con người có phạm vi ngôn ngữ và cách thể hiện bản thân vô cùng rộng lớn. Do khả năng bao quát này, tính tương tác giữa con người và công nghệ vẫn còn cách xa."

Tình trạng các tính năng hoạt động dựa trên AI trong các thiết bị được sử dụng ngày nay còn thiếu tính thông minh bao quát là một thiếu sót được lĩnh vực công nghệ nhận thức rất rõ. Các công ty như Google và Facebook đã từng thừa nhận điều này rất nhiều lần. Trưởng bộ phận AI cho ứng dụng Facebook Research, Yann LeCun gần đây đã thảo luận về cách thức ngành công nghệ nghiên cứu sự thúc đẩy việc sử dụng tính năng tự học trong AI – một kỹ thuật giúp máy móc quan sát môi trường rộng hơn thông qua dữ liệu thay vì được lập trình để làm một số nhiệm vụ nhất định.

Google từng thừa nhận rằng khả năng hiểu được người dùng thực sự của Google Assistant bây giờ còn đang khá hạn chế. 2 năm trước, trưởng nhóm phát triển tính cách Google Assistant - Ryan Germick đã nói với tờ TIME: "Đối với tôi, thành tựu sẽ là lúc chúng ta thực sự hiểu được ngôn ngữ con người đến mức gần như mọi điều tôi nói đều được hiểu, ngay cả khi có ẩn ý về cảm xúc hoặc thành ngữ trong câu nói của mình."

Theo báo cáo Bloomberg vào tháng trước, Amazon cũng đang bắt tay làm việc này. Gã khổng lồ bán lẻ trực tuyến đang phát triển công nghệ có khả năng nhận ra trạng thái cảm xúc của người dựa trên âm thanh giọng nói. Khả năng này khó có thể thực hiện vì thậm chí chúng ta đôi khi còn phải xoay sở trong việc để ý âm thanh giọng nói của một người.

Để lấy ví dụ, Stasior đề cập đến việc mọi người đôi lúc bị nhầm thành viên gia đình mình với người khác khi nói chuyện qua điện thoại. Ông chia sẻ: "Tôi nghĩ điều này thật thú vị khi xét đến việc đôi khi chúng ta mong đợi máy móc có thể phân biệt người này với người kia chỉ bằng âm thanh giọng nói. Có thể công nghệ làm điều đó tốt hơn chúng ta. Nhưng đối với công nghệ mới ra mắt không lâu, chúng ta đều biết rằng vì chính con người nhận biết khó khăn, nên đây là một vấn đề nan giải."

Trợ lý ảo thực ra cũng đã trở nên tốt hơn trong việc này. Cả Amazon và Google đều cho ra tính năng cho phép trợ lý ảo xác định được ai với ai chỉ bằng âm thanh giọng nói vào năm 2017. Siri cũng sẽ có khả năng tiếp thu giọng nói của từng cá nhân trên loa thông minh HomePod khi iOS 13 ra mắt vào cuối năm nay.

Mặc dù việc xác định trạng thái cảm xúc của người dùng còn là một thách thức đối với trợ lý ảo, khả năng đó không có nghĩa là bất khả thi. Rốt cuộc, con người có khả năng phân biệt cảm xúc hào hứng hay buồn bã ở một người nhờ âm thanh giọng nói của người đó.

Stasior cho hay: "Giả định của tôi là có dạng dữ liệu về một số cách thức mà chúng ta có thể hiểu được trạng thái cảm xúc của con người chỉ bằng cách lắng nghe. Vì vậy, tôi đoán là máy móc ngày càng tiến bộ để tiến tới mục tiêu trên, giống như việc bạn có thể hiểu lời tôi nói trong khi 40 năm trước máy móc hầu như không thể làm được điều này."

D.N

Cựu giám đốc Siri của Apple: "các trợ lý ảo còn cả một chặng đường dài phía trước"

Chủ đề khác