VnReview
Hà Nội

Cách hoạt động của Google Search có làm mất uy tín của ông Trump?

Tuần trước, tổng thống Mỹ ông Donald Trump cáo buộc Google lạm dụng quyền lực khi cố ý ẩn đi các câu chuyện tích cực về chính quyền của ông. Trong khi cáo buộc này nhằm củng cố uy tín cho ông Trump, nó cũng cho thấy sự bất mãn ngày càng tăng về tác động của các công ty công nghệ trong việc cho chúng ta thấy những gì khi trực tuyến.

Khi web trở nên ngày càng tăng trưởng hơn về quy mô và phức tạp hơn, tầm quan trọng của Google Search cũng gia tăng. Một tinh chỉnh nhỏ trong thuật toán của Google Search cũng có thể điều hướng một lượng truy cập web khổng lồ. Tuy nhiên, không nhiều người hiểu vì sao Google có thể làm được điều đó – đó là vì Google luôn cố gắng giấu kín "nước sốt bí mật" của mình.

Vậy Google Search hoạt động như thế nào?

Giả sử bạn muốn tìm kiếm về "lợi ích sức khỏe của cải xoăn". Khi bạn bắt đầu nhập vào, hệ thống máy tính của Google bắt đầu chọn lọc thông qua chỉ mục của mình, bao gồm hàng trăm tỷ trang web có chính xác các từ ngữ này hoặc các cụm từ liên quan. Google ước tính rằng có khoảng 53 triệu trang web phù hợp với tìm kiếm các lợi ích sức khỏe của cải xoăn.

Sau đó Google sẽ sắp xếp những trang này theo một trật tự nhất định bằng thuật toán bí mật của mình.

Có hàng trăm yếu tố tác động đến thuật toán của Google. Trong khi Google giấu kín phần lớn chi tiết về công thức tìm kiếm của mình, họ cũng tiết lộ một số thông tin cụ thể về cách hoạt động của nó.

Một trong những đột phá quan trọng trong engine tìm kiếm của Google là công thức được gọi là PageRank, đặt tên theo Larry Page - một trong những nhà sáng lập Google và giờ là giám đốc điều hành công ty mẹ Alphabet. PageRank hoạt động dựa trên tiền đề cơ bản rằng, giá trị của một trang web có thể được xác định bằng số lượng các trang liên kết tới nó.

Trong những ngày đầu của tìm kiếm web, đây là một ý tưởng hoàn toàn mới lạ, và nó giúp thúc đẩy Google vượt qua các đối thủ cạnh tranh như Yahoo và AltaVista.

Engine tìm kiếm này đã trở nên tinh vi hơn sau nhiều năm qua (thứ ba vừa rồi là sinh nhật 20 năm của hãng). Bên cạnh PageRank, công ty cho biết phần mềm của họ còn tìm kiếm tần suất và vị trí các từ khóa được tìm kiếm khi hiển thị trên một trang cụ thể, thời điểm trang web được tạo ra (một dấu hiệu cho thấy độ tươi mới của thông tin) và vị trí của người thực hiện tìm kiếm.

Google cho biết, không có khác biệt đáng kể giữa cách họ thu lượm các câu chuyện tin tức và các kết quả tìm kiếm khác, cho dù một số yếu tố, ví dụ như thời điểm trang được tạo, được đánh giá có tầm quan trọng lớn hơn trong việc tìm kiếm tin tức.

Tại sao Google không tiết lộ thuật toán của mình?

Google cho biết, việc tiết lộ công thức của họ sẽ làm cho nhiều người dễ đánh lừa kết quả tìm kiếm hơn. Còn có cả một ngành công nghiệp với những người chuyên tối ưu kết quả tìm kiếm, hay còn gọi là S.E.O (Search Engine Optimization), và giúp các công ty có được vị trí tốt hơn trong trang kết quả tìm kiếm. Xa hơn nữa, những trang web spam và những người quảng cáo có thể chiếm vị trí hàng đầu của các trang web phù hợp nhất trên bảng kết quả tìm kiếm.

Nhưng tất nhiên Google có lý do khác để giữ bí mật về công thức tìm kiếm: nó là tài sản độc quyền của họ. Google thiết lập vị thế thống trị trong lĩnh vực tìm kiếm bởi vì họ làm tốt việc đưa ra câu trả lời tốt nhất cho mỗi truy vấn tìm kiếm. Vì vậy Google muốn giữ bí mật thuật toán tìm kiếm của họ, cũng như Cocacola không tiết lộ công thức của mình.

Tổng thống Trump cáo buộc Google Search thiên vị, chống lại truyền thông cánh hữu, điều này có đúng không?

Google cho biết ý thức hệ chính trị không phải là một yếu tố xếp hạng trong kết quả tìm kiếm của họ. Việc người dùng là người bảo thủ hay tự do cũng không phải là một phần trong các thông tin mà công ty thu thập, và họ không phân loại các trang web theo thiên hướng chính trị.

Tuy nhiên việc giám sát về thông tin sai lệch sau cuộc bầu cử tổng thống năm 2016 đã buộc Google phải thay đổi thuật toán tìm kiếm của mình. Vào thời điểm đó, Google phát hiện ra rằng, 0,25% lượng truy cập hàng ngày của họ liên kết tới các thông tin xúc phạm, sai lệch, gây hiểu lầm một cách cố ý.; Họ muốn hiển thị nhiều các nội dung "có căn cứ" hơn trong kết quả tìm kiếm.

Tuy nhiên, thay đổi này đã kéo theo các khiếu nại rằng nó gây ra việc sụt giảm mạnh lưu lượng truy cập. Những tổ chức đứng ra khiếu nại và các trang web của họ đều có xu hướng cánh tả. Do đó khó có thể nói Google thiên vị cho những trang web có xu hướng chính trị này hơn là những trang cánh hữu.

Làm thế nào Google xác định đâu là thông tin có căn cứ trong kết quả tìm kiếm?

Lúc này họ lại phải dựa vào một đội quân "những người đánh giá" (các rater) để thông báo về chất lượng kết quả tìm kiếm. Google có khoảng 10.000 người đánh giá trên toàn thế giới. Họ đánh giá về chất lượng kết quả tìm kiếm để xác định xem các trang xếp hạng đầu tiên có truyền tải được kiến thức chuyên môn, có căn cứ và đáng tin cậy hay không.

Mặc dù những người đánh giá không thể trực tiếp thay đổi cách hoạt động trong thuật toán của Google, họ có thể báo cáo các vấn đề với một số trang web cụ thể hoặc các điểm mù trong công thức tìm kiếm. Google đã xuất bản các chỉ dẫn nguyên tắc cho người đánh giá để xác định chất lượng tìm kiếm.

Vậy Google Search là hoàn toàn trung lập?

Không hẳn như vậy. Khi Google Search được tạo ra, kết quả tìm kiếm chỉ là những đường link thuần túy. Vào lúc đó mục tiêu chính của họ là đưa ra các kết quả tìm kiếm phù hợp để mọi người ra khỏi Google càng nhanh càng tốt.

Điều đó đã thay đổi đáng kể trong nhiều năm qua. Thay vì chỉ đơn thuần cung cấp các đường link, giờ đây Google đang đóng gói thêm nhiều thông tin vào trang web của họ - điều này làm gia tăng căng thẳng giữa nhà xuất bản và các dịch vụ khác, như trang web review Yelp, vốn phụ thuộc vào Google để điều hướng lượng truy cập đến trang của họ. Google lập luận rằng người dùng tìm đến Google không chỉ vì đường link – họ tìm đến vì thông tin.

Nhưng khi Google đưa vào trang kết quả tìm kiếm của họ các thông tin du lịch, các dịch vụ mua sắm hoặc đánh giá về các nhà hàng và doanh nghiệp địa phương, các đối thủ cạnh tranh cho rằng, Google đang ưu tiên những dịch vụ của riêng mình so với các đối thủ khác. Liên minh châu Âu cho rằng cách đối xử ưu đãi này là vi phạm luật chống độc quyền của họ.

Ngoài ra cũng có vấn đề về tính thiên vị ẩn trong Google Search. Nó không giống như những gì ông Trump cáo buộc, mà là cách các thuật toán hoặc trí tuệ nhân tạo vô tình khuếch đại các thành kiến về những nhóm như phụ nữ hoặc dân tộc thiểu số.

Điều đáng ngại là do phần nhiều các kỹ sư Google là nam da trắng hoặc châu Á, họ ít có khả năng phát hiện ra những vấn đề tế nhị, nảy sinh từ những nhóm không có người đại diện. Ví dụ, Google có một tính năng có tên Autocomplete, đưa ra các gợi ý tìm kiếm khi người dùng bắt đầu nhập truy vấn. Trước đây, một số đề xuất này từng mang tính phân biệt chủng tộc hoặc phân biệt giới tính.

Google cho biết, họ nhận thức được những loại thiên vị này có thể xuất hiện trong kết quả tìm kiếm, nhưng họ vẫn thận trọng với việc loại bỏ các vấn đề đó. Giờ đây, khi tìm kiếm với cụm từ "Donald Trump là", ba đề xuất đầu tiên mà Autocomplete đưa ra là "một nhà dân chủ", "một tổng thống vĩ đại" và "tổng thống của tôi".

Nguyễn Hải

Theo New York Times

Chủ đề khác