Google can thiệp vào thuật toán để sửa kết quả (phần 2: mối nguy mang tên định kiến nội bộ)

Bên cạnh việc thiên vị cho các công ty hoặc đối tác lớn, Google còn sử dụng một lượng lớn nhân công giá rẻ để kiểm duyệt kết quả tìm kiếm sắp xếp bởi thuật toán. Đây chính là những người nắm quyền gián tiếp thay đổi thứ hạng các kết quả. Ngoài ra trong nội bộ công ty này còn có một kênh giao tiếp riêng để giúp nhân viên có thể phản ánh về những kết quả có vấn đề.

Google can thiệp vào thuật toán để sửa kết quả (Phần 1)

Google can thiệp vào thuật toán để sửa kết quả (phần 2: mối nguy mang tên định kiến nội bộ)

Trong những tháng gần đây, Google đã cố gắng làm rõ cách thức hoạt động của mình nhờ một số thông tin được bổ sung thêm. Cuối tháng 10 vừa qua, họ còn đăng tải một video mới với tựa đề "Google Search hoạt động như thế nào?".

Jonathan Zittrain, một giáo sư thuộc trường Luật Harvard và cũng là trưởng khoa của Trung tâm nghiên cứu về mạng internet và xã hội Berkman Klein, cho rằng Google tiết lộ rất ít thông tin về tần suất cũng như thời điểm mà công ty này can thiệp vào kết quả tìm kiếm của mình. Theo ông, cái lí do "để tránh nạn spam" mà Google dùng để bao biện cho sự thật trên là không hợp lí.

Ông nói: "Kiểu lí do này có thể đúng, đối với 10 hay 15 năm trước, nhưng nó không đúng với hiện tại. Đây là hình thức bảo mật bằng cách che dấu" – một cụm từ để chỉ một trường phái bảo mật lỗi thời tin rằng độ an toàn của hệ thống sẽ được nâng cao nếu hạn chế lượng thông tin về cách thức mà nó vận hành.

Phản bác ý kiến trên, phát ngôn viên của Google cho rằng: "lịch sử đã chứng minh rằng sự minh bạch tới mức cực đoan chính là thứ đã trao quyền cho những đối tượng xấu làm ảnh hưởng tới người dùng và chủ trang web, những người luôn ‘chơi' theo luật".

Một lí do khác là "việc xây dựng được một dịch vụ như của Google đòi hỏi hàng chục nghìn quyết định cực kì phức tạp của con người, chứ không hề đơn giản như những gì người ta thường nghĩ", John Bowers, một nhà nghiên cứu cộng tác với Berkman Klein Center, cho biết.

Những quyết định kể trên, một bên được thực hiện bởi những kĩ sư giỏi nhất cùng mức lương cao nhất với mục tiêu duy nhất là đưa cái công cụ tìm kiếm khổng lồ ấy vào trong vài triệu dòng code của Google thực hiện. Còn ở bên kia cán cân ấy chính là đội quân kiểm duyệt viên lên tới hơn vạn người, đây là những người làm việc tại nhà và được trả lương theo giờ cho công việc đánh giá thứ hạng của kết quả tìm kiếm.

Cái thứ hạng được đề xuất bởi đội ngũ kiểm duyệt viên, dựa trên những hướng dẫn trực tiếp dài hàng trăm trang bởi Google, sẽ là thứ quyết định gián tiếp tới vị trí của mỗi kết quả tìm kiếm. Ngoài ra, một tập hợp các phản hồi có chọn lọc sẽ được đánh giá bởi các giám đốc điều hành của Google và trở thành một biến số giúp chỉnh sửa thuật toán tìm kiếm.

Google can thiệp vào thuật toán để sửa kết quả (phần 2: mối nguy mang tên định kiến nội bộ)

Trong những người kiểm duyệt thủ công ấy có Zack Langley, 27 tuổi, hiện đang làm quản lí tại một công ty du lịch ở New Orleans, Mỹ. Anh đã kí kết bản hợp đồng làm kiểm duyệt có thời hạn một năm thông qua Lionbridge Technologies, một trong vài công ty hiện đang hợp tác với Google và các nền tảng công nghệ khác.

Trong suốt thời gian làm kiểm duyệt viên của mình, Langley cho biết rằng anh chưa bao giờ được liên hệ với bất kì ai làm việc ở Google, cũng như chưa bao giờ được giải thích về mục đích sử dụng của công việc mà anh đang làm. Giống như những nhân công khác thuê bởi Google, anh cũng phải kí vào một bản thỏa thuận không tiết lộ thông tin. Mỗi tuần, số giờ anh làm việc được tùy ý giao động, có khi là lên tới 20 tiếng, với mức lương là 13,5 USD/giờ.

Khi làm công việc này, anh không cần quan tâm tới chuyện ăn mặc. Mệnh lệnh duy nhất giao cho anh chính là phải sử dụng khả năng phán đoán của mình để đánh giá hàng trăm kết quả tìm kiếm theo các tiêu chí về chất lượng, danh tiếng, độ hữu dụng cùng nhiều yếu tố khác.

Có lần, anh thấy không hài lòng vì bắt gặp những kết quả về "cách tự tử tốt nhất". Do đó anh quyết định đánh tụt hạng hết tất cả các đường link bài viết hướng dẫn về cách tự tử cho tới khi đưa trang chủ của Đường dây Phòng chống tự sát lên vị trí đầu tiên.

Langley còn kể rằng, ngay sau đó, Google đã gửi một ghi chú thông qua Lionbridge, trong đó yêu cầu phải đưa đường dây nóng này lên vị trí đầu tiên trong những kết quả tìm kiếm liên quan tới tự tử sao cho đủ để điều chỉnh thuật toán tìm kiếm làm điều tương tự. Nhưng đối với những người như Langley, sự ảnh hưởng của họ tới những thay đổi trong kết quả tìm kiếm vẫn chỉ là những thông tin đầy mơ hồ.

Anh Langley tin rằng Google dường như muốn những người như anh thay đổi nội dung của kết quả tìm kiếm là bởi vì họ muốn tạo ra một bằng chứng hoàn hảo để phủ định những tác động của mình vào kết quả tìm kiếm. Theo anh thì nhiều kiểm duyệt viên khác cũng sẽ nhận được các đoạn ghi chú từ Lionbridge với nguồn gốc thật sự là từ Google để quy định đâu là những kết quả "đúng" cho kết quả tìm kiếm.

Anh còn cho biết là vào cuối năm 2016, tức thời điểm mà cuộc bầu cử tổng thống đang tới dần, Google đã chính thức nhúng tay vào định hướng kết quả tìm kiếm nhiều hơn, dù là với cả những kết quả tìm kiếm không liên quan tới các chiến dịch vận động tranh cử. "Trước đó họ không bao giờ sử dụng lối tiếp cận trực tiếp tới thế, và rồi bỗng nhiên, mọi thứ dường như đã thay đổi", Langley kể thêm.

Lên tiếng về điều này, phát ngôn viên Levin của Google cho rằng công ty này "trước đó đã thay đổi phương thức tiếp cận trong việc thu thập phản hồi trên một số kết quả tìm kiếm nhằm giúp phát triển những giải pháp và tính năng mới liên quan tới các chủ đề này". "Những thay đổi trong bản chỉ dẫn là điều cần thiết giúp chúng tôi đảm bảo rằng toàn bộ kiểm duyệt viên đều đang tuân theo một bộ khung đánh giá chung", Levin bổ sung.

Lionbridge thì không trả lời yêu cầu đưa ra bình luận về thông tin kể trên.

Google can thiệp vào thuật toán để sửa kết quả (phần 2: mối nguy mang tên định kiến nội bộ)

Google can thiệp vào thuật toán để sửa kết quả (phần 2: mối nguy mang tên định kiến nội bộ)

Nhân viên của Google thường sử dụng trình nhắn tin nội bộ và một mẫu đơn có tên là "go/bad" để gửi yêu cầu thay đổi với một kết quả tìm kiếm cụ thể nào đó. Go/bad là một hệ thống để báo cáo những kết quả tìm kiếm có vấn đề.

Theo nguồn tin lân cận thì một vấn đề thu hút được nhiều sự quan tâm đã xuất hiện vào năm 2015. Khi ấy, nhiều người trong công ty báo cáo rằng kết quả tìm kiếm cho nội dung "tại sao tiêm vắc-xin lại gây tự kỉ" đã hiển thị thông tin sai sự thật tới từ các trang web phản đối việc tiêm chủng.

Tuy nhiên, cũng có cách nhìn khác cho rằng Google nên "để cho thuật toán tự quyết định" xem đâu là nội dung được hiển thị. Và thế là Google đã thực hiện một vài thay đổi để khi tìm kiếm cho cụm từ trên, kết quả xuất hiện ở vị trí đầu tiên sẽ trỏ tới đường dẫn howdovaccinescauseautism.com (tại-sao-tiêm-vắc-xin-lại-gây-tự-kỉ.com). Trên trang chủ của đường dẫn này nổi bật với dòng chữ trả lời cho câu hỏi này được viết in đậm với cỡ chữ lớn: "Không, vắc-xin không gây tự kỉ". Quyết định này sau đó đã trở thành một câu đùa lan truyền trong Google.

Về sự kiện trên, Google từ chối đưa là bình luận.

Mùa thu năm 2018, trang tin bảo thủ Breitbart News Network đã đăng tải một đoạn video bị lộ về một vài giám đốc điều hành của Google trong đó có cả Brin và CEO Sundar Pichai, nó ghi lại cảnh hai người này tức giận chỉ trích nhân viên sau khi tổng thống Trump đắc cử. Sau đó, một nhóm nhân viên của Google đã phát hiện ra rằng video này xuất hiện ở trang thứ 12 trong kết quả tìm kiếm, dường như đây là một kỉ niệm không hề đẹp mà công ty này muốn chôn vùi, theo đúng nghĩa đen, mãi mãi. Những người này đã khiếu nại về phát hiện của mình trong bảng tin nội bộ. Và thế là, không lâu sau, đoạn clip trên lại bắt đầu xuất hiện trên các vị trí cao hơn.

Phát ngôn viên Levin cho biết: "Khi chúng tôi nhận được những báo cáo về việc sản phẩm của mình không đạt được kết quả như mong đợi, chúng tôi sẽ điều tra để tìm ra được thông tin hữu ích cho những cải thiện sau đó".

Google can thiệp vào thuật toán để sửa kết quả (phần 2: mối nguy mang tên định kiến nội bộ)

Google can thiệp vào thuật toán để sửa kết quả (phần 2: mối nguy mang tên định kiến nội bộ)

Từ góc nhìn của những người thành lập lên Google, Larry Page và Sergey Brin đều hiểu rằng việc đưa ra thứ hạng cho các trang web có thể được coi là một dạng đưa ra chính kiến. Họ đã viết trong bài giới thiệu về thuật toán PageRank vào năm 1998 như sau: "Tính quan trọng của mỗi trang web luôn là một vấn đề mang tính chủ quan, nó phụ thuộc vào mối quan tâm, hiểu biết và thái độ của người đọc".

Họ cũng viết thêm rằng PageRank sẽ tính toán mức độ quan tâm của con người theo một cách máy móc và chỉ dựa trên những sự thật mà không bị ảnh hưởng bởi con người đồng thời khẳng định rằng hệ thống của mình sẽ tính toán mức độ liên quan của một trang web với đơn vị đo là số lần mà các trang web khác trỏ hướng tới nó.

Ngày nay, PageRank đã được chỉnh sửa nhiều lần và được cấu thành từ hơn 200 thuật toán giúp theo dõi hàng trăm đặc tính khác nhau. Thực chất thuật toán PageRank đã được Google thay thế bằng một phiên bản mới hơn có tên là PageRankNG vào năm 2005 nhằm đáp ứng với lưu lượng truy cập khổng lồ mà công ty này phải xử lí. Hai chữ "NG" ở đây mang nghĩa là "thế hệ tiếp theo". Tuy vậy, về mặt công khai, công ty này vẫn sử dụng cái tên PageRank cũ để gọi thuật toán của mình. Phát ngôn viên Levin khẳng định: "Cách đánh giá dựa theo dấu hiệu về đường dẫn của thuật toán ban đầu vẫn được chúng tôi đưa vào sử dụng trong hệ thống".

Những năm đầu của thập kỉ trước, spammer đã tìm cách làm thuật toán của Google bối rối để khiến cho trang web của mình xuất hiện ở vị trí cao hơn hoặc làm sai lệch kết quả tìm kiếm. Đây là vấn đề mà cả Page và Brin đều có hướng giải quyết riêng của mình.

Brin thì phản đối sự can thiệp của con người, nhấn mạnh sự thật rằng Google phải là công cụ tìm kiếm mang lại kết quả chuẩn xác nhất theo quyết định của thuật toán, thứ mà theo ông chỉ nên được chỉnh sửa trong trường hợp cực kì đặc biệt. Page thì phản bác rằng trải nghiệm người dùng sẽ là thứ bị ảnh hưởng khi họ gặp phải các kết quả trên thay vì những nội dung thực sự hữu ích.

Từ trước đó, Google đã sử dụng biện pháp thủ công nhắm vào các trang web cụ thể hưởng lợi từ việc lợi dụng thuật toán. Khi ấy, các kĩ sư của công ty này sẽ hạ bậc của một trang web bằng việc thay đổi một giá trị "cân nặng". Ví dụ, hành vi trả tiền để thuê các trang web khác trỏ hướng tới trang web của mình nhằm tăng thứ hạng của kết quả tìm kiếm là hành động vi phạm bộ luật của Google, bởi vậy, các kĩ sư có thể giảm thông số "cân nặng" của trang web ấy. Công ty này còn có thể đưa một trang nào đó vào danh sách đen hoặc xóa vĩnh viễn nó khỏi kết quả tìm kiếm.

Tuy nhiên, Brin vẫn liên tục phản đối nỗ lực quy mô lớn này, bởi quá trình này đòi hỏi sự can thiệp của con người nhiều hơn. Thậm chí dù có cha mẹ là người Do Thái tị nạn khỏi Liên bang Xô Viết, ông vẫn quyết định đưa những trang bài trừ Do Thái vào kết quả tìm kiếm về dân tộc này. Google sau đó đã đăng tải một bài viết miễn trừ trách nhiệm về những kết quả tìm kiếm kể trên, trong đó có viết: "Kết quả tìm kiếm của chúng tôi tạo ra là hoàn toàn khách quan và không bị ảnh hưởng bởi bất kì tư tưởng hay sở thích của bất kì ai đang làm việc tại Google".

Cuối cùng, vào một ngày của năm 2004, tại phòng tắm ở trụ sở Google ở Moutain View, Page đã tiến tới cùng với lời chấp luận về biện pháp mới trong chống nạn spam của Ben Gomes, một trong những nhà quản lí đầu tiên của công ty này. Ông đã nói: "Hãy cứ làm tất cả những gì anh muốn. Sergey sẽ hủy hoại công ty này mất".

Page và Brin đều từ chối đưa ra bình luận về sự kiện kể trên.

Sau đó, Google đã chỉnh sửa lại thuật toán của mình để chống lại vấn đề spam, đồng thời nới lỏng bộ nguyên tắc về sự can thiệp thủ công của con người.

Google hiện có những hướng dẫn riêng về việc thay đổi thuật toán của mình, đây là một quy trình mệt mỏi vận hành dưới hình thức một hội đồng. Nó được các nhà quản lí của Google ví von như một phiên chất vấn trước Quốc Hội với chủ đề chính là những thay đổi trong thuật toán.

Theo những người trong cuộc thì đây là một quy trình rất căng thẳng, và có nhiều nét tương đồng với một buổi bảo vệ luận án.
Thậm chí đây là điều mà nhiều kĩ sư luôn tìm cách để né tránh một phần là bởi nó tiêu tốn rất nhiều công sức và những thay đổi nhỏ hơn đôi khi có thể được thông qua mà không cần sự chấp thuận của ủy ban này. Nhân vật Ben Gomes kể trên chính là một trong những thành viên cùa hội đồng này. Ngoài ra, các lãnh đạo cấp cao đôi khi cũng sẽ tham gia vào các buổi đánh giá của ủy ban.

Theo phát ngôn viên Levin thì không phải bất kì những thay đổi nào về thuật toán cũng đều phải được thảo luận trong phiên họp này, nhưng "tổ chức này còn có nhiều cấp độ khác nhau tương ứng với các quy trình đánh giá khác nhau" đòi hỏi sự có mặt của các thành viên trong hội đồng.

Chỉ mới tới khoảng thời gian gần đây thì Google mới tiết lộ một vài nhân tố xếp hạng được sử dụng trong thuật toán của mình. Một trong số đó có "độ mới", đây là yếu tố dùng để hướng tới những nội dung được tạo ra gần thời điểm tìm kiếm như tin tức và các sự kiện thể thao. Ngoài ra còn là thông tin về vị trí, các kĩ sư Google muốn thuật toán của mình sẽ hiển thị những vườn thú tốt nhất ưu tiên theo khu vực sinh sống của người đang tìm kiếm. Một yếu tố quan trọng khác chính là giọng điệu, thứ sẽ tạo ra sự thay đổi về ngữ nghĩa khi kết hợp các từ ngữ lại với nhau. Đây là thứ giúp xác định nội dung mà người dùng mong muốn.

Ngoài những nhân tố kể trên, Google còn sử dụng thông tin về thời gian mà người dùng dành ra để đọc trang web vừa truy cập trước khi quay trở lại trang tìm kiếm. Những trang web có thời lượng truy cập dài sẽ có thứ hạng cao hơn trong kết quả tìm kiếm, còn thời lượng truy cập ngắn sẽ đồng nghĩa với việc nội dung của trang web đó không liên quan, và tất nhiêu thứ hạng của nó cũng sẽ bị ảnh hưởng nặng nề.

Trong thời gian hoạt động của mình, cơ sở dữ liệu về hành vi người dùng kể trên của Google đã trở thành một ưu thế cạnh tranh đặc biệt cho công ty này, giúp nó giữ vững vị thế số một trên thị trường của các công cụ tìm kiếm. Vị trí này khiến cho từng quyết định được thực hiện bởi gã khồng lồ tìm kiếm này mang tầm ảnh hưởng rất lớn. Đầu năm nay vào thời điểm mà Pinterest lần đầu lên sàn chứng khoán, công ty này đã nhấn mạnh rằng: "những công cụ tìm kiếm, trong đó có Google, có thể tự ý chỉnh sửa thuật toán và các chính sách của mình hoặc biến chúng thành những yếu tố bất lợi cho chúng tôi. Khả năng chúng ta can dự vào những động thái kể trên đều rất giới hạn".

Nghề tư vấn về tối ưu trang web cho các công cụ tìm kiếm (SEO) xuất hiện với vai trò là những người giải mã các dấu hiệu của Google cho khách hàng là những doanh nghiệp lớn và nhỏ. Nhưng ngay cả những người này cũng tin rằng hiện vẫn còn một ranh giới vô hình ngăn cản họ thấu hiểu thuật toán của gã khổng lồ làng công nghệ này.

Còn tiếp…

Trung ND theo Wall Street Journal

Đánh giá gần đây
Đọc nhiều nhất Phản hồi nhiều nhất

1 "Điểm mặt" những quảng cáo smartphone thất bại nhất từ trước đến nay

2 Tân Thứ trưởng 8x Nguyễn Huy Dũng từng là học sinh chuyên Toán, sinh viên ĐH Bách Khoa Hà Nội

3 Mẹo đánh lừa bộ não giúp bạn ghi nhớ mọi thứ

4 Cục Đăng kiểm Việt Nam nói gì về ống xả Honda Winner X?

5 Xin lỗi người hâm mộ Android, Apple đã đúng: màn hình 1080p là quá đủ với smartphone!

Tin Liên quan
Các tin khác
a
Xem thêm
Góc nhìn VNREVIEW