TikTok đã "đi guốc trong bụng" chúng ta như thế nào

Thuật toán của TikTok có 4 mục tiêu chính: "giá trị người dùng", "giá trị người dùng lâu dài", "giá trị nhà sáng tạo", và "giá trị nền tảng".
Những mục tiêu đó đã được vạch ra trong một tài liệu khá thẳng thắn dành cho các nhân viên của công ty, và qua đó, chúng ta cũng thấy được nhiều chi tiết mới về chiến lược đã giúp ứng dụng video thành công bậc nhất thế giới này tạo nên một đế chế giải trí hùng mạnh - và cực kỳ gây nghiện nữa!
Tài liệu được đề cập ở trên, có tiêu đề "TikTok Algo 101", được viết bởi nhóm kỹ sư công ty tại Bắc Kinh. Người phát ngôn của họ, Hilary McQuaide, đã xác nhận đây là tài liệu "chính chủ", và cho biết nó được viết ra để giải thích cho các nhân viên không chuyên về kỹ thuật của công ty cách hoạt động của thuật toán ẩn bên dưới ứng dụng. Tài liệu mở ra vô vàn chi tiết chưa từng được biết đến trước đây về ứng dụng video đang làm mưa làm gió trên các cửa hàng ứng dụng, cho thấy nền tảng toán học ưu việt và sự thấu hiểu bản chất con người của đội ngũ phát triển - xu hướng của chúng ta khi đối mặt với sự buồn tẻ, sự nhạy cảm của chúng ta đối với những nét văn hóa đặc sắc - từ đó giải thích tại sao một khi đã cầm điện thoại lên và mở TikTok, bạn sẽ khó mà đặt nó xuống được. Ngoài ra, tài liệu còn vén màn mối liên hệ khăng khít giữa công ty với công ty mẹ ByteDance ở Trung Quốc, trong bối cảnh Bộ Thương mại Mỹ đang chuẩn bị đưa ra kết luận cuối cùng về việc liệu TikTok có tiềm ẩn nguy cơ đối với an ninh quốc gia nước này hay không.
Nếu bạn nằm trong một tỷ người say mê TikTok mỗi tháng, bạn hẳn đã quen thuộc với ứng dụng đang đóng vai trò cầu nối văn hóa trẻ và văn hóa trực tuyến này rồi. TikTok hiển thị một danh sách video dài vô tận và, không như những ứng dụng truyền thông xã hội mà nó đang ngày càng cho ra rìa, hướng đến mục đích giải trí hơn là kết nối bạn bè.
TikTok đã đi guốc trong bụng chúng ta như thế nào
TikTok thành công khi các ứng dụng video ngắn khác không thể một phần bởi nó khiến việc tạo nội dung trở nên quá dễ dàng, cung cấp cho người dùng nhạc nền để thoải mái nhún nhảy, hay hàng tá meme để diễn trò, thay vì buộc họ phải tự tìm lấy nội dung cho những video của chính mình. Và đối với nhiều người dùng, những người chỉ xem chứ không sáng tạo, ứng dụng này có khả năng "đọc vị" giỏi đến kinh ngạc và sẽ lèo lái bạn theo hướng nó muốn, dù bạn có sở thích với chính trị, những mẹo vặt văn phòng, tình dục, hay một người nổi tiếng cụ thể nào đó. Nó cực kỳ siêu đẳng trong việc bộc lộ đam mê của người dùng kể cả đối với chính họ - "Thuật toán TikTok biết về xu hướng tình dục của tôi còn giỏi hơn cả tôi nữa", đó là một phần trong loạt bài viết cho thấy mọi người sửng sốt ra sao về khả năng "đi guốc trong bụng" của ứng dụng này.
TikTok từng công khai chia sẻ những thông tin cơ bản về hệ thống đề xuất nội dung của nó, rằng nó sẽ tính toán đến nhiều yếu tố bao gồm số lượt thích và bình luận, cũng như thông tin video như tiêu đề, âm thanh, và hashtag. Các nhà phân tích bên ngoài công ty cũng tìm cách bẻ khóa mã nguồn của ứng dụng này. Một bản tin gần đây trên tờ Wall Street đã cho thấy TikTok dựa rất nhiều vào thời lượng chúng ta dành để xem từng video nhằm hướng người dùng đến với những video khác có khả năng giữ chân họ trên nền tảng càng lâu càng tốt, và quá trình đó đôi lúc khiến những người dùng trẻ tuổi u mê, dẫn họ đến những nội dung không mấy hay ho như ***** hoặc tự hành hạ bản thân - đây cũng là những vấn đề mà TikTok khẳng định đang tìm cách ngăn chặn thông qua việc tích cực xóa bỏ các nội dung vi phạm quy định dịch vụ.
Tài liệu mới nói trên được chia sẻ cho tờ The New York Times bởi một người được phép đọc nhưng không được phép chia sẻ. Người này cảm thấy khó chịu bởi hành vi khuyến khích người dùng xem những nội dung không lành mạnh, có thể dẫn đến hành vi tự làm hại bản thân, của TikTok.
Tài liệu nói rằng nhằm theo đuổi "mục tiêu tối thượng" của công ty là tăng hơn nữa số lượng người dùng mỗi ngày, TikTok phải tối ưu hai tiêu chí có mối liên hệ mật thiết với nhau: "khả năng giữ chân người dùng" - tức là người dùng có quay lại với nền tảng hay không - và "thời gian sử dụng". Ứng dụng này muốn bạn tiếp tục cuộn lên xuống càng lâu càng tốt. Trải nghiệm này đôi lúc có thể nói chẳng khác gì cơn nghiện, dù rằng nó là một điều khá quen thuộc và cũng thường bị chỉ trích khá nhiều trong văn hóa đại chúng. Nhà biên kịch David Mamet, người từng có bài viết đả kích thứ "nghệ thuật giả hiệu" vào năm 1998, đã quan sát thấy rằng "người ta bị lôi cuốn đến những bộ phim công chiếu vào mùa hè bởi họ không cảm thấy thỏa mãn, và do đó họ được trao cơ hội để liên tục cưỡng ép trí óc trải nghiệm chúng"
Đối với các nhà phân tích tin rằng những đề xuất của thuật toán tiềm ẩn một mối nguy cho xã hội, thì tài liệu của TikTok xác nhận sự nghi ngờ của họ là chính xác.
"Hệ thống này vận hành xoay quanh thời gian xem video. Thuật toán tìm cách khiến người ta bị nghiện thay vì mang lại cho họ thứ họ thực sự muốn" - theo Guillaume Chaslot, nhà sáng lập tổ chức Algo Transparency vốn từng nghiên cứu hệ thống đề xuất của YouTube và đưa ra kết luận đầy tiêu cực về những hệ quả mà sản phẩm này tạo ra đối với trẻ nhỏ. Chaslot cũng đã xem qua tài liệu nói trên của TikTok.
"Tôi nghĩ thật là điên rồ khi để thuật toán của TikTok lèo lái cuộc sống của con em chúng ta. Mỗi video tụi nhóc xem, TikTok lại có thêm thông tin về chúng. Trong vài giờ ngắn ngủi, thuật toán có thể phát hiện ra sở thích âm nhạc, hứng thú về ngoại hình, liệu lũ trẻ có bị trầm cảm hay không, liệu chúng có nghiện thuốc hay không, cùng nhiều thông tin nhạy cảm khác. Có khả năng cao rằng một vài trong số những thông tin đó sẽ bị lợi dụng để nhắm vào chính chúng. Nó có thể bị lấy ra để nhắm vào một đứa nhóc cụ thể hoặc khiến nó nghiện nền tảng này hơn nữa." - ông nói.
Tuy nhiên, tài liệu tiết lộ thời gian xem video không phải là yếu tố duy nhất TikTok quan tâm. Nền tảng này có một công thức để tính điểm các video, trong đó một dự đoán được đưa ra bởi học máy và hành vi thực sự của người dùng được tổng hợp lại dựa trên ba loại dữ liệu: số lượt thích, số bình luận, và thời gian xem, cùng một chỉ báo cho thấy video đã được phát:
Plike X Vlike + Pcomment X Vcomment + Eplaytime X Vplaytime + Pplay X Vplay
"Hệ thống đề xuất chấm điểm cho mọi video dựa trên công thức này, và trả lại cho người dùng những video với điểm cao nhất. Để ngắn gọn, công thức ghi trong tài liệu này đã được tối giản hóa. Công thức thực sự phức tạp hơn nhiều, nhưng logic đằng sau thì như nhau" -
tài liệu nêu rõ như vậy.
Tài liệu minh họa chi tiết cách công ty tinh chỉnh hệ thống của mình để xác định và loại bỏ "những mồi câu like" - tức những video được thiết kế để đánh lừa thuật toán bằng cách đề nghị người xem nhấn like - và cách công ty trả lời những câu hỏi đa dạng hơn ra sao.
"Một số tác giả có thể đề cập đến những vấn đề văn hóa trong video của họ và người dùng chỉ có thể hiểu rõ những thông tin đó bằng cách xem thêm nhiều video của tác giả đó. Do vậy, giá trị tổng mà người dùng xem tất cả những video đó cao hơn giá trị của việc xem từng video gộp lại. Một ví dụ khác: nếu một người chỉ thích một loại video nhất định, nhưng ứng dụng cứ liên tục đề xuất loại nội dung đó cho anh ta, anh ta sẽ nhanh chóng chán và thoát ứng dụng. Trong trường hợp này, tổng giá trị tạo ra bởi người dùng xem cùng một loại video là thấp hơn xem từng video riêng rẽ, bởi sự lặp lại dẫn đến nhàm chán" - tài liệu nói.
"Có hai giải pháp cho vấn đề này. Đưa ra một vài giả định, và chia giá trị vào phương trình giá trị. Ví dụ, đối với tỉ lệ lặp lại, chúng ta có thể thêm một giá trị 'same_author_seen', và đối với vấn đề nhàm chán, chúng ta cũng có thể thêm một giá trị âm 'same_tag_today'. Các giải pháp khác ngoài phương trình giá trị có thể cũng hiệu quả..."
Một biểu đồ khác trong tài liệu chỉ ra rằng "khả năng kiếm tiền của các nhà sáng tạo nội dung" là một trong nhiều mục tiêu của công ty, cho thấy TikTok có thể ưu tiên các video nếu chúng có khả năng sinh lời, chứ không chỉ vì có tính giải trí.
Julian McAuley, giáo sư khoa học máy tính tại Đại học California ở San Diego, cũng đã đánh giá qua tài liệu này và nói rằng nó đề cập khá ít đến cách TikTok đưa ra những dự đoán của mình, nhưng những miêu tả về bộ máy đề xuất nội dung của nó thì "hoàn toàn hợp lý, nhưng cũng chỉ là một thứ bình thường mà thôi". Theo ông, lợi thế của công ty đến từ việc kết hợp học máy với "lượng dữ liệu khổng lồ, sự tương tác cao từ người dùng, và một thị trường nơi người dùng thích thú với những nội dung được đề xuất bởi thuật toán. Chứ không phải là ma thuật do thuật toán mang lại"
Ông McAuley nói thêm rằng ông cảm thấy đôi chút khó hiểu về lý do tại sao mọi người cứ luôn hỏi ông về TikTok.
"Dường như có một sự nhận thức (bởi giới truyền thông? hay bởi công chúng?) rằng TikTok đã khám phá ra một dạng mã nguồn ma thuật để thực hiện xuất sắc việc đề xuất nội dung, nhưng hầu hết những thứ tôi đã xem qua thì lại khá bình thường" - ông nói.
TikTok đã đi guốc trong bụng chúng ta như thế nào
Và thật vậy, tài liệu đã cố làm sáng tỏ hệ thống đề xuất mà các công ty công nghệ thường khẳng định là rất khó cho giới phê bình và các nhà quản lý hiểu được, nhưng chủ yếu tập trung vào những tính năng mà bất kỳ người dùng thông thường nào cũng có thể nắm bắt. Ví dụ, các tài liệu Facebook bị rò rỉ mà tờ Journal có được cho thấy cách Facebook quyết định ưu tiên hiển thị những bình luận nhất định đã giúp các nội dung gây chia rẽ được phát tán rộng rãi ra sao. Dù các mô hình có thể phức tạp, thuật toán đề xuất của TikTok được nêu ra trong tài liệu không có gì mờ ám hay khó hiểu cả.
Nhưng tài liệu cũng chỉ rõ rằng TikTok không làm gì để cắt đứt mối liên hệ với công ty mẹ ByteDance ở Trung Quốc, vốn là tâm điểm trong chính sách của chính quyền cựu Tổng thống Donald Trump vào năm 2020, khi mà ông này tìm cách buộc ByteDance bán TikTok cho một công ty Mỹ có quan hệ với chính phủ là Oracle.
Tài liệu TikTok có nhắc đến một số câu hỏi từng được đặt ra đối với một chuyên gia kỹ thuật làm việc cho cả TikTok và Douyin (TikTok dành cho thị trường Trung Quốc), qua đó tiết lộ một mảnh ghép đặc biệt quan trọng trong ngành công nghệ đang ngày một chia rẽ: các tài năng kỹ thuật. Theo trang LinkedIn của chuyên gia kỹ thuật nói trên, anh từng học Đại học Bắc Kinh và làm việc cho Facebook trong hai năm trước khi đến ByteDance tại Bắc Kinh vào năm 2017. Tài liệu được viết bằng tiếng Anh, nhưng không phải tiếng Anh bản địa, và dưới góc nhìn của ngành công nghệ Trung Quốc. Nó không đề cập gì đến các công ty đối thủ tại Mỹ như Facebook và Google, nhưng có một đoạn thảo luận về việc "nếu Toutiao/Kuaishou/Weibo đã làm ra một thứ tương tự trước đó, liệu chúng ta có thể áp dụng chiến thuật như họ đã từng làm?"
Theo tài liệu, quy trình phát triển của TikTok có mối liên hệ chặt chẽ với quy trình phát triển của Douyin. Thậm chí tài liệu có đoạn nói đến việc điều chuyển các nhân viên TikTok đến để hỗ trợ Douyin, và có liên kết đến một tài liệu nội bộ của công ty với nội dung như nhau dành cho cả TikTok và Douyin.
Các nhân viên TikTok cũng tham gia sâu vào hệ sinh thái của ByteDance. Họ sử dụng một sản phẩm của ByteDance gọi là Lark, vốn là một hệ thống giao tiếp nội bộ giống như Slack nhưng với nhiều tính năng quản lý năng suất làm việc nhằm buộc các nhân viên phải sử dụng hệ thống nhiều hơn nữa. Ví dụ, ứng dụng này có phần cho bạn biết liệu bạn đã thực hiện một hành động - như mở tin nhắn - nhiều hay ít hơn các đồng nghiệp.
Những lo ngại về công nghệ tiêu dùng Trung Quốc là điều được cả hai đảng tại Mỹ đồng tình. Sắc lệnh của Tổng thống Trump nhằm cấm TikTok vào tháng 8/2020 đi kèm lời cảnh báo rằng "hoạt động thu thập dữ liệu của TikTok có thể cho phép Chính phủ Trung Quốc truy cập thông tin cá nhân và tài sản của người Mỹ". Chính phủ Trung Quốc có thể "xây dựng những bộ hồ sơ về thông tin cá nhân để tống tiền và tiến hành hoạt động gián điệp kinh tế". Lệnh cấm này đã bị tạm hoãn và sau đó không còn được nhắc đến sau khi Tổng thống Biden lên nắm quyền. Dù ông Biden tuyên bố hủy bỏ sắc lệnh, nhưng chính phủ của ông đã công bố sẽ tổ chức một cuộc điều tra của riêng họ về những mối đe dọa an ninh mà TikTok có thể gây ra, và một quan chức kỳ cựu giấu tên cho biết Trung Quốc "đang lợi dụng công nghệ kỹ thuật số và dữ liệu của người Mỹ theo những cách có thể gây ra những nguy cơ an ninh quốc gia không thể chấp nhận được"
Trong một email, bà McQuaide nói rằng "dù có một số điểm chung trong mã nguồn, các ứng dụng TikTok và Douyin hoạt động hoàn toàn riêng biệt, trên các máy chủ riêng rẽ, và cả hai mã nguồn đều không chứa dữ liệu người dùng"
Bà còn nói rằng, "TikTok chưa bao giờ cung cấp dữ liệu người dùng cho chính phủ Trung Quốc, và sẽ không cung cấp nếu được yêu cầu"
TikTok đã thuê hàng loạt lãnh đạo và chuyên gia an ninh nổi tiếng người Mỹ và châu Âu trong bối cảnh áp lực của chính phủ Donald Trump ngày càng đè nặng. Họ nói rằng công ty không có trụ sở chính thức, và tìm cách xoa dịu những quan ngại của Mỹ bằng cách lưu trữ dữ liệu người dùng tại Mỹ, và các bản sao lưu tại Singapore. CEO TikTok cũng sống tại Singapore.
Mối quan ngại của chính phủ Mỹ đối với TikTok thể hiện qua hai dạng. Đầu tiên, như ông Trump đã nói trong sắc lệnh của mình, là liệu lượng dữ liệu khổng lồ mà TikTok đang nắm giữ - ví dụ, về những đam mê sắc dục cá nhân của các fan của ứng dụng này, những người mà trong tương lai có khả năng trở thành các viên chức công của nước Mỹ - có nên bị xem như một vấn đề an ninh quốc gia hay không. Chưa có bằng chứng nào cho thấy dữ liệu từng được sử dụng theo cách đó, và TikTok cũng không phải là nền tảng duy nhất người Mỹ đã và đang chia sẻ những chi tiết về cuộc sống của họ trên mạng xã hội. Mối quan ngại thứ hai là liệu TikTok có kiểm duyệt các bài viết có nội dung nhạy cảm về mặt chính trị hay không.
Một báo cáo được Citizen Lab - một tổ chức an ninh mạng tại Toronto - công bố trong năm nay cho biết cả hai mối quan ngại kia đều được xếp vào nhóm "tiềm tàng" - tức là họ không tìm thấy bất kỳ chứng cứ nào chỉ ra TikTok đang kiểm duyệt các chủ đề nhạy cảm lẫn truyền dữ liệu về Trung Quốc.
Nhưng việc TikTok dòm ngó đời sống riêng tư của người dùng là điều bất thường. Một screenshot cho thấy đội ngũ kiểm duyệt nội dung của TikTok có quyền truy cập không chỉ các video đã được đăng tải công khai, mà còn nội được gửi đến bạn bè hoặc tải lên hệ thống nhưng chưa chia sẻ, khác với các ứng dụng như WhatsApp và Signal vốn cung cấp tính năng mã hóa hai chiều.
Câu hỏi thứ hai là liệu chính phủ Trung Quốc có thể sử dụng nền tảng này để tuyên truyền. Sau khi bị phát giác kiểm duyệt nội dung một video có nội dung phê phán hoạt động giam giữ hàng loạt người dân tộc thiểu số theo đạo Hồi ở Trung Quốc, TikTok đã cho phép những bình luận chỉ trích chính phủ nước này. Ví dụ,hashtag #whereispengshuai, ý nói đến ngôi sao quần vợt người Trung Quốc cáo buộc một lãnh đạo hàng đầu Trung Quốc tấn công tình dục, sẽ được tự động điền trong hệ thống khi người dùng gõ một phần từ khóa, dù các video TikTok với hashtag này có rất ít lượt xem. Không có cách nào khác để biết liệu công ty có hạn chế số lượt tìm kiếm với các từ khóa này không, chỉ biết trên Twitter, số lượt tìm kiếm nhiều hơn hẳn, còn trên Instagram thì ít tương tự.
TikTok đã đi guốc trong bụng chúng ta như thế nào
Một số nhà phân tích người Mỹ xem TikTok là một mối đe dọa nghiêm trọng; số khác cho rằng nỗi sợ TikTok chỉ là một phản ứng vô căn cứ mà những người Mỹ nay sắp bước sang tuổi trung niên phải đối mặt, bởi trước đây cha mẹ họ từng cảnh báo rằng nếu chia sẻ thông tin lên mạng xã hội, họ sẽ không bao giờ tìm được việc làm. Nhiều, nhiều sản phẩm khác, từ các mạng xã hội đến ngân hàng và thẻ tín dụng, đều thu thập nhiều dữ liệu riêng tư hơn về người dùng. Nếu cơ quan an ninh nước ngoài muốn có dữ liệu đó, họ hoàn toàn có thể tìm cách mua từ một công ty chuyên buôn bán dữ liệu mờ ám nào đó.
"Lo sợ về việc bị theo dõi hoặc kiểm duyệt của TikTok giống như chúng ta đang lơ đi sự thật rằng những vấn đề phải đối mặt còn lớn hơn nhiều so với bất kỳ công ty cụ thể nào, hoặc công ty mẹ ở Trung Quốc của nó" - theo Samm Sacks, một nhà nghiên cứu chính sách an ninh mạng tại tổ chức New America. "Kể cả nếu TikTok thuộc sở hữu của Mỹ, không có luật hay quy định nào ngăn được Bắc Kinh mua dữ liệu của nó trên thị trường buôn bán dữ liệu ngoài kia"
Một điều mà bài viết này muốn nhấn mạnh: bóng ma ám ảnh an ninh quốc gia Mỹ hay bất kỳ quốc gia nào khác mà TikTok tạo ra dường như hoàn toàn là thuyết âm mưu, và tùy thuộc vào cách bạn phân tích về mối quan hệ Mỹ - Trung, hay tương lai của công nghệ và văn hóa. Nhưng khả năng đề xuất những thứ khiến người ta hứng thú của thuật toán - từ những cú đánh tennis, thức ăn Thổ Nhĩ Kỳ, và tất cả những thứ khác mà ứng dụng này cho rằng bạn sẽ thích xem - đúng là đang tiềm ẩn một mối họa hiện hữu và rõ ràng đối với...khả năng tập trung vào công việc của mỗi chúng ta!
Tham khảo: NYTimes
 


Đăng nhập một lần thảo luận tẹt ga

Gợi ý cộng đồng

Top