Cách Baidu giành chiến thắng trong cuộc đua trí tuệ nhân tạo?

Một công ty có thể sở hữu công nghệ tốt nhất trên thế giới, có những nhân tài giỏi nhất và những ý tưởng sản phẩm tuyệt vời nhất. Nhưng để phát triển các thuật toán mang trí tuệ sẽ biến đổi các thành phố, công ty đó cần có dữ liệu. Hay nói cách khác: Công ty có nhiều dữ liệu nhất sẽ giành chiến thắng.

Nguồn: Bloomberrg/Getty imags

Đó cũng là lý do mà vào đầu năm nay, sau khi rời Microsoft vào mùa thu năm 2016, vị kỹ sư huyền thoại Qi Lu đã tới Bắc Kinh để đảm nhận vị trí giám đốc điều hành của Baidu. Ông từng là phó chủ tịch dưới thời CEO Satya Nadella và phụ trách mảng chiến lược trí tuệ nhân tạo của Microsoft. Rõ ràng Qi Lu đã thấy nhiều cơ hội phát triển hơn tại khu vực Thái Bình Dương: Trung Quốc có 731 triệu người dùng Internet - gần gấp đôi dân số của Mỹ. Theo ông, "Trung Quốc có lợi thế về cấu trúc".

Ngày 26/7, chúng tôi đã có một cuộc phỏng vấn độc quyền với Lu khi ông đến thăm Thung lũng Silicon. Bất ngờ là Lu đã đưa ra những giải thích rất chi tiết về cách thức Baidu giành được vị trí dẫn đầu về trí tuệ nhân tạo tại Trung Quốc. Ông cho biết người dân tại phần lớn các quốc gia trên thế giới và Trung Quốc đều sống trong những căn nhà nhỏ, so với các căn biệt thự rộng lớn ở Bắc Mỹ. Đây có thể là lợi thế lớn nhất của Trung Quốc trong việc đưa trí tuệ nhân tạo ra thị trường toàn cầu. Hiện tại những hãng khổng lồ công nghệ của Mỹ có thể dẫn đầu về nguồn nhân lực nhưng theo ông Baidu đang sở hữu trong tay những yếu tố để chinh phục thế giới.

Sau khi ông đến Baidu, tại công ty này đã diễn ra một cuộc cải tổ. Là một COO (giám đốc điều hành), ông có thể cho biết vai trò của mình tại Baidu?

Ðiều đầu tiên là tôi cộng tác rất chặt chẽ với Robin [Li, CEO của Baidu] để đảm bảo cả hai hoàn toàn thống nhất với nhau. Tôi phụ trách nghiên cứu và phát triển, bán hàng và marketing vì muốn đảm bảo chiến lược chung của chúng tôi là hoàn toàn đồng bộ. Thứ hai, tôi cảm thấy hiện tại chiến lược của chúng tôi đã rõ ràng và tập trung hơn rất nhiều. Thực sự có hai cuộc chiến đang diễn ra. Một là tăng cường các nền tảng di động. Hai là dẫn đầu kỷ nguyên trí tuệ nhân tạo.

Ông có thể mô tả chiến lược trí tuệ nhân tạo của mình?

Chúng tôi tin rằng cách tốt nhất để thương mại hoá công nghệ trí tuệ nhân tạo là xây dựng hệ sinh thái. Về cơ bản, để thúc đẩy các đối tác đẩy nhanh tốc độ đổi mới, việc sử dụng các mô hình kinh tế lành mạnh, ổn định nhằm tạo ra mối quan hệ các bên cùng có lợi bền vững và lâu dài cho các nhà phát triển và đối tác của chúng tôi. Cơ sở của nó là Bộ não Baidu [thuật ngữ Baidu dùng cho tất cả các tài sản trí tuệ nhân tạo của công ty này]. Nó rộng hơn và lớn hơn so với những gì mà Microsoft và Google đang cung cấp ở Mỹ vì đây là một nền tảng. Chúng tôi có một bộ chương trình gồm 60 loại dịch vụ trí tuệ nhân tạo khác nhau và gọi là Bộ não Baidu.

Baidu là công ty lớn đầu tiên có sự tách biệt rõ ràng về tầng cảm nhận và tầng nhận thức. Khả năng cảm nhận và nhận thức có liên quan với nhau, nhưng cũng khá khác nhau. Hầu hết các nền tảng trí tuệ nhân tạo [khác] thường coi chúng là một.

Baidu có sản phẩm tương tự như Siri hay Cortana?

Chúng tôi đang tập trung vào hai nền tảng để kết nối khách hàng với đối tác. Nền tảng đầu tiên có tên DuerOS là nền tảng máy tính dựa trên giao tiếp và ngôn ngữ tự nhiên của con người. Nó rất giống các trợ lý ảo Alexa, Google Now, Siri, hoặc Cortana ở Mỹ. Điểm khác biệt duy nhất là DuerOS vượt trội hơn bất kỳ nền tảng nào khác. DuerOS ở Trung Quốc đã tập hợp được nhiều bộ kỹ năng dựa trên giao tiếp hơn bất cứ sản phẩm nào khác. Baidu có 10 domain chính và hơn 100 domain phụ cho các kỹ năng giao tiếp được chúng tôi phát triển. Một hệ sinh thái cho đối tác mới nổi cũng đang được xây dựng khi các đối tác của công ty ngày càng tạo ra nhiều bộ kỹ năng. Amazon hiện tại có thể hơn Baidu vì công ty này có một hệ sinh thái đối tác lớn hơn ở Mỹ. Nhưng so với hầu hết các công ty khác ở Trung Quốc, rõ ràng Baidu đang là số một.

Thứ hai, chắc chắn Baidu là công ty đi đầu về số lượng các đối tác. DuerOS hiện có mặt trong hơn 100 thương hiệu thiết bị gia dụng cá nhân như là tủ lạnh, máy điều hòa không khí, tivi, máy kể chuyện hoặc loa.

Ông có thể so sánh thị trường công nghệ giọng nói của Mỹ và Trung Quốc?

Môi trường ở Trung Quốc rất khác. Vì chúng ta đang bàn về tương tác qua giọng nói. Môi trường âm thanh, mẫu nhiễu cũng rất khác biệt. Alexa, Echo, và Cortana được tối ưu hóa cho các ngôi nhà ở Mỹ. Theo quan điểm của tôi, nó chỉ áp dụng được ở Bắc Mỹ và có thể là một phần của châu Âu. Về cơ bản, giả định được đưa ra là ngôi nhà của bạn rất rộng với nhiều phòng. Tuy nhiên công nghệ này lại không thích hợp ở Trung Quốc. Mục tiêu của chúng tôi, ngay cả đối với thế hệ trẻ có thu nhập cao, là những căn nhà có diện tích 60 mét vuông, đôi khi 90 mét vuông.

Baidu có ưu thế hơn để toàn cầu hóa DuerOS. Vì sao ư? Một ngôi nhà ở Nhật Bản, Ấn Độ, hoặc ở Braxin, sẽ giống với một ngôi nhà ở Trung Quốc hơn là ở Bắc Mỹ.

Nguồn: BLOOMBERG/GETTY IMAGS

Vậy đó là điểm khác biệt. Còn về điểm tương đồng?

Công nghệ là điểm tương đồng. Công nghệ cốt lõi vẫn là nhận dạng giọng nói, xử lý tín hiệu, hiểu ngôn ngữ tự nhiên và nền tảng. Kiến trúc nền tảng của chúng tôi rất giống với Amazon. Theo tôi, Amazon đang làm rất tốt tuy tôi từng làm việc cho Microsoft. Tôi luôn ủng hộ Microsoft nhưng thật lòng thì Amazon đang dẫn đầu.

Nhưng ông có nghĩ rằng điểm yếu của Amazon nằm ở mảng back-end, công ty này không thể theo kịp công nghệ của Google và Microsoft?

Tôi đã tham gia dự án phát triển Cortana cách đây bốn năm rưỡi. Vào thời điểm đó tất cả chúng tôi đều cho rằng công nghệ của Amazon hoàn toàn tụt hậu. Nhưng tôi đã học được một điều là trong cuộc đua trí tuệ nhân tạo, điều thực sự quan trọng hơn là phải có các kịch bản ứng dụng và hệ sinh thái phù hợp. Google và Microsoft, về mặt công nghệ vượt trội hơn Amazon. Nhưng nếu nhìn vào hiện tại thì hệ sinh thái của Amazon Alexa vượt xa mọi đối thủ ở Mỹ. Lý do là Amazon có kịch bản thích hợp cùng một thiết bị phù hợp. Về cơ bản, Alexa là một thiết bị mà học máy trở thành trung tâm của nền tảng.

Cả Microsoft và Google cùng mắc chung một sai lầm. Chúng tôi tập trung vào Cortana trên điện thoại và máy tính cá nhân, đặc biệt là điện thoại. Theo tôi, điện thoại sẽ được lập trình tối ưu trong hiển thị nội dung và ưu tiên cảm biến vân tay trong tương lai gần. Bạn cần một thiết bị mà học máy là trung tâm của nền tảng để củng cố nền tảng hệ sinh thái mới nổi.

Vai trò của các thiết bị được chú trọng ứng dụng trí tuệ nhân tạo thể hiện rất rõ khi sinh sống ở Trung Quốc. Ðiều này có nghĩa là ngay từ lúc bắt đầu, cách bạn tương tác với công nghệ đã rất khác. Có thể qua nhận dạng giọng nói hoặc hình ảnh, nhận dạng khuôn mặt từ những tương tác đầu tiên. Màn hình hoặc thao tác chạm có thể được dùng nhưng chỉ là thứ yếu.

Tại trụ sở Baidu, nhận dạng khuôn mặt được ứng dụng ở khắp mọi nơi. Với máy bán hàng tự động tại Baidu, bạn có thể mua đồ qua giọng nói và khuôn mặt. Chúng tôi cũng đang phát triển một dự án cửa hàng tự phục vụ với mục tiêu khi bạn đi đến cửa hàng đó, bạn có thể mang đồ ăn rời đi.

Về mặt kỹ thuật, điều này có thể thực hiện được ở rất nhiều nơi, nhưng không có nghĩa là mọi người đều đón nhận đó.

Công nghệ không phải là tất cả mà là cấu trúc môi trường - văn hoá, chế độ chính sách. Đây là lý do tại sao trí tuệ nhân tạo và Trung Quốc với tôi là một cơ hội thú vị. Sự khác nhau giữa các nền văn hoá, các chế độ chính sách và một môi trường khác biệt.

Vậy còn hệ quả đạo đức của các công cụ mà chúng ta đang tạo ra thì sao? Giao tiếp của mọi người ở Baidu có giống với Microsoft không?

Giống nhau. Bảo vệ sự riêng tư là điều tối quan trọng đối với Baidu. Cuối cùng, người dùng tin tưởng vào công nghệ của chúng tôi. Vì vậy, đây sẽ là điều mà chúng ta sẽ đề cập nhiều. Baidu sẽ tiếp tục đầu tư nghiêm túc vào việc đảm bảo quyền riêng tư của các dịch vụ mà người dùng có thể tin cậy. Ví dụ, chúng ta đã nói về tương tác bằng giọng nói. Baidu đang nghiên cứu các công nghệ ngăn cản việc kích hoạt điện thoại thông minh không chủ định. Vì chúng ta đều biết rằng người dùng không muốn các cuộc trò chuyện của họ được chuyển tới Cloud. Có thể tôi có cuộc trò chuyện rất riêng tư trong phòng khách. [Nhưng thỉnh thoảng] các loa trong phòng nghĩ rằng bạn đang điều khiển chúng, và sau đó gửi những thông tin này lên Cloud.

Ông có nghĩ rằng người tiêu dùng Trung Quốc dành nhiều quan tâm đến điều này hay họ mong đợi một điều khác vì họ sống trong môi trường chính trị khác biệt?

Giả thiết của chúng tôi là mọi người sẽ quan tâm đến điều này. Cuối cùng, chúng tôi tin rằng mọi người đều đưa ra quyết định hợp lý. Nếu có lợi ích hấp dẫn, mọi người sẽ cân nhắc hậu quả và sau đó đưa ra lựa chọn. Tôi nghĩ rằng điều này mang tính chất toàn cầu.

Baidu đã công bố một sáng kiến đầy tham vọng về xe tự lái Apollo vào mùa xuân năm 2017, và cho đến nay ông đã công bố có 50 đối tác. Tại sao ông tăng cường đầu tư vào ô tô?

Nếu bạn muốn thực sự xây dựng trí thông minh số để có thể tiếp nhận kiến thức, ra quyết định và thích ứng với môi trường, bạn cần phải xây dựng các hệ thống tự động. Trong các hệ thống đó, xe hơi là ứng dụng thương mại chính đầu tiên được đưa vào sử dụng.

Nó giống như hệ sinh thái điện thoại hiện nay. Hệ sinh thái điện thoại là hệ sinh thái phần mềm silicon lớn nhất. Tôi tin rằng điều tương tự cũng sẽ xảy ra với hệ thống tự động. Xe hơi sẽ xây dựng một hệ sinh thái lớn hơn. Và cùng một bộ năng lực - phần cứng, cảm biến, bộ chip, phần mềm - được dùng để xây dựng ngành công nghiệp robot, robot trong các hộ gia đình. Chúng tôi mong rằng hàng trăm công ty và trường đại học tham gia xây dựng một hệ sinh thái lớn. Sau đó, chúng ta có thể tạo ra các robot, máy bay không người lái, và tất cả các hệ thống tự động. Vì vậy, đối với tôi, tự động là chìa khóa của vấn đề.

Ông đóng vai trò quan trọng trong việc phát triển Apollo phải không?

Tôi là COO của công ty nhưng trực tiếp điều hành kinh doanh. Trong ba tháng cuối cùng, có lẽ tôi đã dành khoảng 40% thời gian của mình vào sản phẩm công nghệ xe tự lái - trao đổi với khách hàng và đối tác. Về cơ bản, với tình hình hiện tại, để đạt được một tương lai tự động hoàn toàn, con đường cơ bản cho công nghệ xe tự lái là tốc độ lặp lại.

Tốc độ này phụ thuộc vào điều gì?

Về cơ bản, phụ thuộc vào việc bạn có thể nhận được bao nhiêu dữ liệu. Để lái xe trên đường, bạn phải lái trên nhiều loại đường trong các điều kiện khác nhau - ánh sáng, thời tiết, áp suất vật lý lên lốp xe. Với Apollo, Baidu có thể tập hợp tất cả các nguồn lực, đặc biệt là các nguồn dữ liệu, khiến cho mọi người cảm thấy thoải mái hơn.

Chúng tôi đã viết một bản tuyên ngôn cho Apollo. Về cơ bản, có bốn nguyên tắc và mỗi nguyên tắc đều quan trọng. Thứ nhất là tính chất mở. Tại Baidu, chúng tôi cung cấp miễn phí mã nguồn, các dịch vụ, dữ liệu - cho tất cả các đối tác. Điều này đặc biệt hiệu quả ở Trung Quốc vì thị trường Trung Quốc hiện đang bị phân mảnh rõ rệt. Có hơn 250 nhà sản xuất xe hơi [nhà sản xuất thiết bị gốc], không giống như Mỹ có một ngành công nghiệp tập trung cao. Không có nhà xuất xe hơi nào kể trên có đủ năng lực để nghiên cứu và phát triển chuyên sâu. Dựa vào cơ sở mã nguồn được chúng tôi phát hành vào ngày 5/7, một người có thể lắp ráp một chiếc xe tự lái trong ba ngày dù còn hạn chế về hình thức cũng như mới nghiên cứu và phát triển.

Thứ hai là chia sẻ tài nguyên. Về cơ bản, thiết kế Apollo có hai tầng. Bạn có thể sử dụng mã và khả năng Apollo và một số bộ dữ liệu. Tầng thứ hai cho phép bạn sử dụng tất cả dữ liệu mà Baidu cung cấp - bản đồ chất lượng cao, dữ liệu đào tạo - nhưng chúng tôi yêu cầu bạn phải đóng góp dữ liệu của mình. Tuy nhiên, có một nguyên tắc chính. Bạn càng đóng góp nhiều, bạn càng có nhiều cơ hội được chia sẻ.

Nguyên tắc thứ ba là tốc độ đổi mới. Về cơ bản, vì có thể tập hợp nhiều dữ liệu hơn, chúng tôi sẽ đạt được nhiều thành công hơn trong các công cụ mô phỏng. Nói chung chúng tôi cho phép tất cả mọi người sáng tạo với tốc độ nhanh hơn nhiều.

Và nguyên tắc thứ tư là duy trì quan hệ các bên cùng có lợi mà trong đó Baidu là mô hình lớn nhất. Nguyên tắc này tập trung vào việc cung cấp dịch vụ cao cấp, dịch vụ có giá trị cao, bản đồ chất lượng cao, [và] các dịch vụ bảo mật. Chúng tôi không cạnh tranh với bất cứ ai. Chúng tôi khuyến khích mỗi nhà sản xuất thiết bị gốc, cho dù đó là các hãng Bosch, Continental, hay Nvidia, có thể thực hiện được nhiều điều hơn nữa.

Đây cũng là lý do tôi mở chi nhánh tại Mỹ, Apollo US cũng như Apollo Singapore. Quan điểm của chính phủ Singapore cơ bản là "Wow…Chỉ cần đến Singapore. Tôi đã sẵn sàng để đầu tư".

Nguồn: BLOOMBERG/GETTY IMAGS

Những nhân tố nào thúc đẩy các loại xe tự lái hoàn toàn ở Trung Quốc?

Một mình công nghệ sẽ không thúc đẩy xe tự lái trong thời gian dài. Tôi sẽ đưa ra một ví dụ đơn giản. Có một sự cố đường bộ trong thành phố, cảnh sát đến mà không thấy có người nào. Vì vậy họ chỉ có thể để lại tin nhắn trên giấy yêu cầu tốc độ lưu thông dưới 8 km một giờ và chú ý khi lái xe. Tờ giấy sẽ được kẹp trên xe và cần phải có công nghệ đọc chữ viết tay và hiểu ngôn ngữ của con người để thực hiện điều này. Vì vậy sẽ mất rất nhiều thời gian.

Để tạo điều kiện cho xe tự lái hoàn toàn, thứ nhất cần có luật pháp và quy định mới. Thứ hai, sau khi làm việc với tất cả các đối tác, chúng tôi thực sự phát hiện có rất nhiều thứ thương mại hóa, sớm hơn rất nhiều so với xe tự lái hoàn toàn. Audi 8 là ví dụ tuyệt vời. Về cơ bản, xe tự động chạy theo các dòng lưu thông khi tình trạng kẹt xe trầm trọng diễn ra. Kẹt xe là vấn đề phổ biến ở Bắc Kinh, Thượng Hải và Vùng Vịnh (Mỹ). Lái xe có thể để xe chạy tự động trong khi làm những việc khác như đọc sách. Ngoài ra, còn có nhiều kịch bản khác nữa.

Lần đầu tiên chúng ta gặp mặt, ông đang làm việc cho Microsoft. Ông đã rời Microsoft nhiều tháng trước đến Baidu. Ông có thể cho biết lý do?

Tôi bị gãy chân vào tháng 10/2016 và trải qua hai ca mổ. Bill, Satya và tôi vẫn rất thân thiết, vì vậy khi đến Seattle tôi thường đến chơi nhà Satya cùng Bill. Tôi đã hứa là cố vấn cá nhân của họ.

Dường như năm 2017 là một năm phát triển mạnh mẽ của trí tuệ nhân tạo ở Trung Quốc. Năm nay sẽ có gì nổi bật?

Đó là sự kết hợp giữa sự sẵn sàng của công nghệ và số ngành công nghệ dọc mà trí tuệ nhân tạo có thể thương mại hóa. Ở quy mô toàn cầu, tôi thấy Trung Quốc và Mỹ đều có thể là những động lực thúc đẩy sự phát triển thế giới. Tôi có thể chịu ảnh hưởng từ Bill Gates. Bill luôn nói về nền kinh tế thế giới hiện nay, vì mục đích thực tế, là một nền kinh tế phát triển đơn lẻ. Mỹ chiếm 5% dân số thế giới, nhưng đóng góp khoảng 24% sản lượng kinh tế và 60% các phát minh đổi mới. Mỹ sẽ không thể duy trì tốc độ tăng trưởng như hiện nay khi thế giới có tới 7 tỷ người. Có lẽ 3 tỷ người trong số đó có một cuộc sống hiện đại với đầy đủ phương tiện di chuyển; thực phẩm chế biến sẵn... Nhưng sau đó là sụt giảm mạnh mẽ. Phần dân số còn lại sống trong điều kiện sống hoàn toàn khác. Công việc của chúng tôi là đem đến mọi người một cuộc sống hiện đại. Làm thế nào để đạt điều đó? Càng có nhiều đổi mới, càng tăng trưởng tốt hơn. Thực sự, Trung Quốc sẽ trở thành động lực đổi mới thứ hai, và [Gates] thực sự tin rằng một Trung Quốc sáng tạo và phát triển hơn là điều tuyệt vời đối với thế giới. Tôi cũng tin như vậy.

Cách đây vài năm khi bắt đầu tăng cường nguồn lực trí tuệ nhân tạo, ông đã tập trung xây dựng một phòng nghiên cứu tại Thung lũng Silicon. Khi chuyên gia nghiên cứu người Mỹ Andrew Ng rời Baidu vào mùa xuân năm ngoái, người kế nhiệm phụ trách phòng thí nghiệm trí tuệ của Baidu đã từng ở Trung Quốc. Phải chăng nhân lực ngành trí tuệ nhân tạo của Trung Quốc đã bắt kịp Mỹ?

Chắc chắn Mỹ vẫn mạnh hơn. Nhưng rõ ràng khoảng cách giữa hai quốc gia đã nhanh chóng bị rút ngắn. Trong hơn sáu tháng ở Trung Quốc, thành thật mà nói, tôi đọc nhiều bài báo hơn, tôi nói chuyện với nhiều nhà phát triển trí tuệ nhân tạo hơn, và bạn có thể cảm nhận được sức mạnh của nguồn nhân lực tài năng ở đây.

Baidu sẽ thực hiện ngày càng nhiều trí tuệ nhân tạo tại Trung Quốc, đó là điều chắc chắn. Nhưng đồng thời, chúng tôi vẫn tiếp tục đầu tư vào Mỹ, tại Vùng Vịnh và Seattle. Chúng tôi vừa mở một cơ sở ở Seattle sau khi đã mua lại công ty Kitt.ai. Về những tài năng xuất chúng, Mỹ vẫn giỏi hơn, và chúng tôi muốn tận dụng tối đa điều đó.

Quỳnh Mai

Theo Wired


Đánh giá gần đây
Đọc nhiều nhất Phản hồi nhiều nhất

1 Khoa học lý giải tại sao mũi ta tẹt, mũi tây cao

2 Trận Indonesia - Việt Nam ngày 15/10 mấy giờ đá?

3 Ai bảo đinh rỉ liên quan đến nhiễm trùng uốn ván?

4 Khoa học lý giải kết hôn với anh em họ nguy hiểm như thế nào

5 Nhờ hình ảnh phản chiếu trên mắt khi chụp ảnh selfie, nữ ca sĩ Nhật bị fan cuồng tìm đến tận nhà quấy rối

Tin Liên quan
Các tin khác
a
Xem thêm
Góc nhìn VNREVIEW