VnReview
Hà Nội

Bên trong kế hoạch vĩ đại của Facebook: thay thế smartphone bằng kính AR

Thử tưởng tượng chiếc smartphone biến thành một thứ gì đó đeo lên đầu bạn. Thay vì nhìn vào một màn hình tối đen, bạn có thể nhìn xuyên qua nó và tương tác với các vật thể ở thế giới thực.

VnReview lược dịch bài viết trên tạp chí Fast Company.

Giống như rất nhiều công ty công nghệ khác, Facebook đặt cược vào thực tế tăng cường (AR: augmented reality) sẽ là công nghệ thay thế smartphone, trở thành thiết bị điện toán tiếp theo của mỗi người. Đó có vẻ là một viễn cảnh tuyệt vời với gã khổng lồ mạng xã hội. Với Facebook AR, công ty hy vọng ngày nào đó bạn có thể chat với một người bạn ở xa ngay từ trong bếp, hoặc nhận tin nhắn từ một người lạ trên Instagram khi tản bộ ở công viên.

Tầm nhìn của Facebook

Còn hơn cả việc cung cấp một mô hình tương tác mới giữa bạn và mạng xã hội, Facebook coi AR như một cơ hội để kiểm soát toàn bộ trải nghiệm phần cứng lẫn phần mềm, một thứ gì đó mà họ chưa thể đạt tới trước đây. Ở phần cứng, công ty đã bỏ lỡ làn sóng di động. Ứng dụng của họ bị phụ thuộc vào nền tảng do Apple và Google vận hành.

Vẽ lại bản đồ công nghệ của thế giới (ảnh: Facebook)

Với sản phẩm Oculus VR, Facebook hướng tới cơ hội sở hữu toàn bộ hệ thống. Nắm trong tay cơ sở người dùng hơn 2 tỷ trên toàn cầu, dịch vụ quảng cáo hái ra tiền, công ty muốn sở hữu một chiếc kính AR thực sự và tạo nên trải nghiệm ảo mà chúng ta chưa từng có trước đây. Phóng viên của Fast Company đã nói chuyện với trưởng dự án, ông Michael Abrash, để tìm hiểu sâu hơn vào kế hoạch thực tế tăng cường của công ty Mỹ.

Theo ông, chiếc kính này vẫn còn ở rất xa phía trước. Họ cần tạo ra những bước đột phá trong công nghệ màn hình, hệ thống bản đồ có thể tạo ra một thế giới tăng cường dễ sử dụng, nơi mọi người chia sẻ dễ dàng. Thiết bị cũng cần một cơ chế điều khiển mới, hệ thống AI nhúng thật sâu để tiếp nhận dữ liệu về thế giới xung quanh, một bộ xử lý mạnh mẽ nhưng nhỏ gọn, vận hành tất cả. Cuối cùng, nó phải vừa vặn và thoải mái để người dùng có thể đeo càng lâu càng tốt.

Một vấn đề khác nữa là làm sao để tất cả tin tưởng Facebook, sử dụng sản phẩm của công ty mà yên tâm giao phó dữ liệu cá nhân mà chiếc kính thu thập được. Facebook có tiền, nguồn lực và nhiều nhân tài đủ khả năng để vượt qua các rào cản về kỹ thuật, nhưng họ sẽ phải đối đầu với các công ty lớn khác, như Apple hay Google. Nếu cạnh tranh trực diện với Apple, Facebook có thể gặp bất lợi khi người dùng tin tưởng khả năng bảo vệ quyền riêng tư của Táo khuyết hơn.

Facebook luôn bị chỉ trích vì không bảo vệ quyền riêng tư của người dùng (ảnh: The Telegraph)

Trải nghiệm người dùng hoàn toàn mới

Khi công bố sản phẩm, chúng tôi sẽ mang tới một giao diện đồ họa người dùng (GUI) mới mẻ rất khác biệt. Một giao diện người dùng 3D sẽ lớn hơn, chìm đắm hơn một màn hình 2D hiện nay. Do màn hình của kính đặt sát với mắt, bạn sẽ thấy mọi thứ hiện ra xung quanh mình cùng với thế giới thực. Giao diện sẽ xoay theo bạn mỗi khi đổi hướng nhìn. Sẽ có lúc bạn dùng tay để thao tác cử chỉ khi muốn thực hiện một lệnh nào đó. Cũng có lúc bạn dùng giọng nói, đưa ra câu lệnh cho hệ thống.

Tuy nhiên, Abrash cũng chỉ ra một số tình huống xã hội khá khó xử với hướng đi này. Giả sử bạn đang trò chuyện trên phố với một ai đó, chắc chắn bạn sẽ không muốn đưa tay ra chỉ trỏ hay vuốt cái gì, người khác xung quanh sẽ nghĩ rằng bạn bị điên. Hoặc nếu họ nhận thấy bạn đang đeo kính, nỗi lo bị thu thập thông tin trái phép sẽ trỗi dậy.

Đối phó với những tình huống này, Facebook đang nhắm tới công nghệ theo dõi cử chỉ mắt. Hoặc một phương án khác cũng đã được tính đến, đó là điện cơ (EMG). Sử dụng các tín hiệu điện của não bộ để thực thi các chức năng của thiết bị. Công nghệ này đã được phát triển bởi CTRL-labs, một công ty được Facebook mua lại năm 2019. "EMG có độ tin cậy cao, giống như chuột hay bàn phím nhập liệu", Abrash nói.;

Công nghệ này không hoàn toàn đọc suy nghĩ của người dùng, nó phân tích các tín hiệu điện do não sinh ra. Mặc dù vậy, nhiều người lại cho rằng Facebook đang đọc tâm trí họ, lo sợ công ty có thể trở thành một tổ chức phản diện muốn thao túng suy nghĩ người dùng.

Một thế giới mới

Một trong những vấn đề hóc búa nhất trong việc tạo nên trải nghiệm AR thực sự độc đáo, đặc biệt là với loại hình xã hội, đó là tạo ra một bản đồ thế giới địa lý 3D khớp với thế giới thực. Như vậy, tất cả đều có thể thấy những nội dung AR như nhau. Niantic từng làm chuyện đó với Pokémon Go năm 2016, giúp người chơi có thể thấy cùng một con Pokémon tại cùng một địa điểm vật lý.

Với Facebook, bản đồ của họ được gọi là LiveMap, phục vụ như một siêu kiến trúc khổng lồ, nơi mà trải nghiệm xã hội AR hình thành. LiveMap sẽ gồm ba thành phần chính: vị trí, chỉ số và nội dung. Lớp phủ vị trí của môi trường sẽ là một hệ tọa độ, chứa toàn bộ các vị trí nơi mà các đối tượng AR có thể đặt, hoặc những phòng hợp ảo với hình đại diện.

Lớp phủ chỉ số trong LiveMap sẽ ghi lại các thông tin của đối tượng vật lý trong không gian, cùng với các siêu dữ liệu liên quan khác. Ví dụ như cái này để làm gì, làm sao để tương tác nó với các đối tượng khác trong không gian, nó được tạo nên bằng cái gì và di chuyển như thế nào. Đại khái là như một bộ phim khoa học viễn tưởng bạn vẫn hay xem, chỉ vào đâu cũng truy cập được ngay trang Wikipedia của thứ đó.

Nhiều công nghệ trong phim khoa học viễn tưởng đang được phát triển để bước ra đời thực (ảnh: Birmingham Live)

Hệ cơ sở dữ liệu cung cấp cho lớp chỉ số là rất quan trọng. Nó giúp trải nghiệm một xã hội AR trở nên tự nhiên và phù hợp với những quy tắc vật lý khoa học. Nó cũng cần được cập nhật liên tục. Ví dụ khi ta thay đổi môi trường từ phòng khách sang phòng ngủ, lớp vị trí thay thế toàn bộ các vật thể và lớp chỉ số phải cập nhật tương ứng ngay lập tức thông tin của chúng.

Lớp cuối cùng là nội dung, chứa toàn bộ vị trí của những vật thể kỹ thuật số (không tồn tại ở thế giới thực, chỉ là ảnh ảo). Lớp này chứa những mối quan hệ, lịch sử và dự đoán của các thực thể, sự kiện quan trọng với chúng ta. Ví dụ thông tin của các nhà hàng ưa thích, chuyến công tác sắp tới. Lớp phủ này cũng chịu trách nhiệm kết nối tới một biểu đồ nhận thức, xác định các khái niệm "nhà hàng" và "chuyến công tác" mô tả cho thứ gì.

Đây giống như một bối cảnh hay phông nền chứa các khái niệm và các phân mục, cùng thông tin và mối quan hệ của chúng với nhau, từ đó phác họa hình mẫu cuộc sống của bạn. Bất cứ điều gì bạn đã trải qua, đang khao khát,... Kết hợp ba thứ này lại, LiveMap sẽ trở thành một bản đồ cuộc đời của bạn, được cập nhật liên tục dựa trên hành vi của bạn. Một thứ gì đó to lớn và vĩ đại hơn trang cá nhân Facebook hiện nay rất nhiều.

Khi bạn nhìn vào, chiếc kính sẽ nói cho bạn biết thông tin mọi thứ đang tồn tại trước mặt bạn (ảnh: Getty Images)

Một trợ lý cuộc sống

Lớp nội dụng của LiveMap được xây dựng bằng cách thu thập toàn bộ thông tin của camera, cảm biến, microphone trên chiếc kính có từ bạn. Thói quen, sở thích, các mối quan hệ,... bất cứ thứ gì. Cả núi thông tin đó sẽ được nạp vào một mô hình trí tuệ nhân tạo mạnh mẽ, từ đó đưa ra những tham vấn đầy sâu sắc về thông tin mà bạn có thể cần, những việc bạn có thể muốn làm, trong đa dạng bối cảnh khác nhau.

Việc này tạo nên một trợ lý ảo cá nhân biết bạn, hiểu bạn, nắm được bạn thích gì, muốn gì, còn hơn cả chính bạn. Vượt xa các loại hình trợ lý ảo hiện nay. Như trong các bộ phim sci-fic hay Tom & Jerry, một người bạn ngồi lên trên vai và nhìn lại toàn bộ cuộc đời bạn từ góc nhìn vị kỷ cá nhân, sau đó đưa ra lời khuyên cho bạn trong hiện tại. Abrash nói: "Nó sẽ đánh giá lại cuộc đời bạn từ góc nhìn của chính bạn, rồi bất chợt lóe lên một điều gì đó có thể giúp bạn cứu lấy chính mình".

Đối với một chiếc kính AR, trợ lý ảo là thứ quan trọng. Nó là một món đồ rảnh tay - không cần phải dùng tay thao tác để ra lệnh. Bạn có thể đeo chúng và tương tác kể cả khi đang làm việc khác, không cần phải tốn thời gian chỉnh menu hay gõ văn bản nhập liệu hướng dẫn nó phải làm gì. Chiếc kính phải biết về bạn, biết bạn đang làm gì, từ đó cung cấp các thông tin hữu ích cho việc mà bạn đang làm.

Liệu Facebook có quyết định luôn cả cuộc sống của chúng ta? (ảnh: Time)

Kỹ sư trưởng Facebook lấy ví dụ. Bạn đang nhìn chăm chú vào một món hàng, đại loại như ô tô chả hạn. Chiếc kính theo dõi cử động mắt và biết ngay là bạn đang chú ý vào chiếc xe, ngay lập tức nó đề xuất một loạt các thông tin liên quan tới chiếc xe đó.

LiveMap còn hơn cả một bản đồ cuộc đời

Giống như một quản gia biết rất nhiều về thói quen, khẩu vị, lựa chọn, hay kể cả cách bạn giao tiếp với người khác. Abrash nói rằng chiếc kính ghi lại và nhìn lại toàn bộ những gì bạn thấy, bạn làm trong cả ngày. Nó cung cấp ngày một nhiều hơn và ngày một tốt hơn lượng dữ liệu cho trợ lý AI, bỏ xa smartphone vốn nằm trong túi bạn hàng giờ. Đó là một khía cạnh khiến cho kính AR trở thành một loại sản phẩm khác biệt hoàn toàn smartphone.

Tuy nhiên, mọi dữ liệu của LiveMap được lưu trữ ở máy chủ Facebook, và bạn biết rồi đấy, họ là một doanh nghiệp kinh doanh bằng dữ liệu cá nhân. Facebook nói thu thập dữ liệu cá nhân giúp họ cá nhân hóa trải nghiệm mạng xã hội của bạn. Nhưng lý do thực sự cho việc thu thập là để họ nắm rõ bạn, từ đó khoanh vùng thị hiếu và đưa quảng cáo tới đúng người có khẩu vị phù hợp. Thậm chí, có khi Facebook còn biết một sản phẩm hay dịch vụ thích hợp cho bạn còn trước cả lúc bạn nghĩ về những món này.

Khi được hỏi liệu Facebook có ý định điều hướng người dùng như vậy hay không, đại diện của hãng nói rằng bây giờ thì họ vẫn chưa nghĩ tới việc đó.

Dữ liệu người dùng luôn là tâm điểm khiến mọi người sợ hãi quyền lực của Facebook (ảnh: The Verge)

Học hỏi từ những gì có được

Hãng vẫn còn rất nhiều điều phải học để xây dựng hạ tầng LiveMap. Làm thế nào để lập bản đồ và nhập chỉ số cho thế giới, và để đưa vào ngữ nghĩa của các vật thể trong thế giới. Đó là lí do tại sao có hơn 100 nhân viên công ty sẽ sớm đeo sản phẩm AR tại chỗ làm, tại nhà, tại nơi công cộng ở San Francisco và Settle.

Facebook nói đó chỉ là nguyên mẫu cho sản phẩm tương lai và nó không có màn hình. Họ tham gia một dự án gọi là "Project Aria", sử dụng chiếc kính thử nghiệm để thu lại video và âm thanh từ điểm nhìn của người đeo, trong khi đang thu thập dữ liệu từ các cảm biến theo dõi cử động của đôi mắt.

Họ chỉ vừa mới đưa nó ra khỏi phòng thí nghiệm để xem hoạt động trong thực tế như thế nào, với các điều kiện về ánh sáng và thời tiết. Coi dữ liệu được thu về trông sẽ như thế nào nhằm hỗ trợ cho sản phẩm tương lai. Dữ liệu có thể giúp các kỹ sư xác định xem LiveMap sẽ tạo nên loại trải nghiệm AR như thế nào. Thực tế, đây là những viên gạch đầu tiên để xây dựng nên LiveMap, Facebook đang bắt đầu từ hai bàn tay trắng.

Hiện tại, họ không có trong tay bất kỳ dữ liệu nào giúp xác nhận hay cá nhân hóa trải nghiệm AR. Ngay cả khi việc thu thập dữ liệu hoàn tất để tạo nên một LiveMap với ba lớp thành phần, cũng cần phải kiểm soát chặt chẽ để phân loại thông tin công khai, thông tin riêng tư. Việc duy nhất cần được tập trung bây giờ là xây dựng cơ sở dữ liệu để làm việc về sau.

Nhân viên công ty đang thử nghiệm nguyên mẫu kính AR cho hạ tầng của LiveMap (ảnh: Facebook)

Nó giống như câu chuyện con gà và quả trứng. Nếu không có người dùng nạp dữ liệu đầu vào, sẽ không biết phải xây dựng mạng xã hội AR như nào. Nhưng nếu không có những bước đầu tiên để thu thập dữ liệu người dùng, sẽ chẳng có ai cống hiến cho nó cả. Facebook buộc phải bắt đầu quá trình thu thập dữ liệu cho việc lập bản đồ, nhập chỉ số nhằm tạo ra một trải nghiệm sơ khai cho người dùng. Sau đó, họ bắt đầu bổ sung dữ liệu vào hệ thống để cải thiện dần. Cuối cùng, hình thành LiveMap từ con số 0.

Rắc rối với phần cứng

Thách thức lớn nhất với phần cứng là xây dựng một màn hình có thể hiển thị đồ họa 3D, nhưng vẫn phải đủ gọn nhẹ để không tiêu tốn quá nhiều năng lượng. Đồng thời, màn hình phải đủ độ sáng, tương phản, gam màu,... để hiển thị rõ ràng ngoài trời nắng gắt. Hơn nữa, tầm nhìn cũng phải đủ rộng để bao phủ được hết trường nhìn của con người. Cho đến nay, chưa có bất kỳ sản phẩm AR nào thỏa mãn được yêu cầu này.

Một chiếc kính AR có thể rất phức tạp với vô số thành phần, khiến nó khó có thể hình thành một thiết kế mà người dùng đeo thoải mái được cả ngày. Việc tích hợp một bộ xử lý vào kính có thể tỏa nhiều nhiệt khi vận hành, và nó lại đeo ở ngay trên đầu người dùng. Hiện tại, cũng chẳng có hệ thống làm mát nào đủ gọn nhẹ và hiệu quả để giải tỏa nhiệt lượng trong điều kiện như vậy.

Thiết kế cồng kềnh là điểm trừ lớn của nhiều cặp kính AR từng ra mắt 

Tất cả các kỹ sư thiên tài trên thế giới đang làm việc với kính AR, không chỉ riêng nhóm của Facebook, đều đang phải nỗ lực để vượt qua những thách thức này. Một phương án tạm thời đã được tính đến, đó là đưa thành phần chip xử lý và bộ nguồn ra thành một bộ phận rời.

Kính AR của Facebook nếu có thể ra mắt sau 5 năm nữa, rất có thể đi theo hướng này với ba thành phần: chiếc kính đóng vai trò hiển thị môi trường AR, vòng đeo tay để khai thác công nghệ EMG cho việc ra lệnh, và cuối cùng là một phần gắn rời chứa bô xử lý và bộ nguồn.

Cởi mở với vấn đề

Có một lý do rõ ràng cho việc nhóm của Facebook rất thẳng thắn chia sẻ công việc của họ với Fast Company. Công ty cần phải sớm xử lý các mối lo ngại về quyền riêng tư, chắc chắn rằng cả thế giới đều biết về nó. Kính AR có thể là sản phẩm đi sâu vào không gian riêng tư của người dùng hơn bất kỳ thứ gì, hơn cả smartphone. Nó thu thập rất nhiều và không ngừng dữ liệu người đeo, chưa kể những người bên ngoài cũng lo ngại việc bị ghi hình, ghi âm bởi camera và microphone của kính.

Do vậy, một bộ quy tắc đã được Facebook đưa ra song song với dự án nghiên cứu Project Aria. Một trong số các quy tắc là cho phép những người bắt gặp nhân viên Facebook đang đeo sản phẩm thử nghiệm, có thể phàn nàn về việc bị thu thập thông tin. Nhìn vào lịch sử Facebook, công ty không ít lần tung ra những tính năng mới với những lời có cánh, ca ngợi lợi ích của chúng với khách hàng và điều hướng mọi người ra khỏi cái giá thực sự - ảnh hưởng tới quyền riêng tư dữ liệu cá nhân người dùng.

Liệu trong tương lai, một giao diện nửa thực nửa ảo có thể thay thế những màn hình cảm ứng hiện nay? (ảnh: NBC News)

Một chiếc kính AR cách mạng có thể không xuất hiện kịp trong vòng 10 năm tới, nếu nó là thứ thay đổi mô hình giao tiếp của loài người. Một ngày nào đó, cuộc sóng của bạn sẽ chìm vào giao diện nửa hư nửa thực, nửa là thế giới vật chất, nửa kia là đồ họa kỹ thuật số. Chỉ cần những công ty đang theo đuổi nó như Facebook có thể xây dựng nên một công nghệ chu đáo, hoàn thiện, thân thiện với quyền riêng tư của người dùng. Để chúng ta có thể hòa nhập vào nó một cách thoải mái.

Ở một tương lai như vậy, chiếc smartphone hoặc đã tiến hóa đi rất xa, hoặc trở thành một phần của giao diện tương tác mới. Nó không còn là thứ bạn có thể bỏ vào túi áo, rồi nhấc lên áp vào tai, bạn cũng không cần phải chạm vào màn hình nữa. Ai mà còn cần một cái màn hình cảm ứng cơ chứ?

Ambitious Man

Chủ đề khác