Này thì "ăn cắp bản quyền": YouTuber "đầu độc" AI xấu tính chuyên ăn cắp nội dung

From Beijing with Love
From Beijing with Love
Phản hồi: 0

From Beijing with Love

Cháu đã lớn thế này rồi à. Lại đây chú ôm cái coi.
Bạn có để ý đến xu hướng kênh YouTube "vô diện" (faceless) ngày càng phổ biến gần đây? Những kênh này không bao giờ có người thật xuất hiện trên khung hình, mà sử dụng công cụ AI để tự động tạo ra mọi thứ, từ kịch bản, giọng thuyết minh đến hình ảnh và âm nhạc. Mục đích không gì khác ngoài việc kiếm tiền nhanh chóng từ thuật toán YouTube với nỗ lực tối thiểu của con người.

"Đầu độc" transcript bằng .ass


Nhiều YouTuber đã lên tiếng phàn nàn về tình trạng các kênh "vô diện" đạo nhái nội dung của họ bằng cách lấy trộm file transcript nhúng (embedded transcript) và sử dụng AI để tóm tắt lại, tạo ra các video "ăn theo" một cách nhanh chóng. YouTuber F4mi, chuyên làm video phân tích công nghệ chuyên sâu, đã chia sẻ cách cô đối phó với vấn nạn này: "đầu độc" các AI tóm tắt bằng cách chèn dữ liệu rác vào transcript, vô hình với người xem nhưng gây nhiễu loạn cho AI.

1738420463214.png


Bí quyết của F4mi nằm ở định dạng subtitle .ass (Advanced SubStation Alpha), được tạo ra từ hàng thập kỷ trước cho phần mềm fansub Advanced SubStation Alpha. Không giống như các định dạng subtitle đơn giản hơn, .ass hỗ trợ các tính năng nâng cao như font chữ, màu sắc, vị trí, in đậm, in nghiêng, gạch chân, v.v.

Chính những tính năng này cho phép F4mi ẩn dữ liệu rác gây nhiễu loạn AI trong transcript YouTube của mình mà không ảnh hưởng đến trải nghiệm xem subtitle của người xem. Với mỗi đoạn text thực tế, cô chèn thêm "hai đoạn text khác nằm ngoài khung hình bằng cách sử dụng tính năng định vị của định dạng .ass, với kích thước và độ trong suốt được đặt về 0 để chúng hoàn toàn vô hình".

Trong các hộp subtitle "vô hình" này, F4mi thêm text từ các tác phẩm thuộc phạm vi công cộng (thay thế một số từ bằng từ đồng nghĩa để tránh bị phát hiện) hoặc các script do LLM của riêng cô tạo ra, chứa đầy những thông tin bịa đặt hoàn toàn. Khi các file transcript này được đưa vào các trang web tóm tắt AI phổ biến, dữ liệu rác đã lấn át nội dung thực tế, tạo ra một script hoàn toàn không liên quan, vô dụng đối với bất kỳ kênh "vô diện" nào cố gắng khai thác nó.

Vượt qua ChatGPT o1, vẫn còn lỗ hổng

1738420474614.png


1738420482417.png


F4mi cho biết các mô hình tiên tiến như ChatGPT o1 đôi khi có thể lọc ra dữ liệu rác và tạo ra bản tóm tắt chính xác về video của cô. Tuy nhiên, với một chút tinh chỉnh script, file .ass có thể được chia nhỏ thành các chữ cái riêng lẻ được đánh dấu thời gian, thứ tự của chúng có thể bị xáo trộn trong chính file, nhưng vẫn hiển thị chính xác trong video cuối cùng. Điều này tạo ra một câu đố khó (nhưng không phải là không thể) để ngay cả AI tiên tiến nhất cũng khó có thể hiểu được.

Mặc dù YouTube không hỗ trợ trực tiếp .ass, nhưng có các công cụ cho phép người sáng tạo chuyển đổi subtitle .ass sang định dạng .ytt ưa thích của YouTube. Tuy nhiên, các subtitle này không hiển thị chính xác trên phiên bản di động của YouTube, nơi các subtitle .ass được định vị lại chỉ hiển thị dưới dạng các hộp đen che phủ video.

F4mi đã khắc phục vấn đề này bằng cách viết một script Python để ẩn các caption rác của mình dưới dạng text đen trên nền đen, lấp đầy màn hình bất cứ khi nào cảnh phim chuyển sang màu đen. Tuy nhiên, F4mi lưu ý rằng "một số người dùng gặp sự cố điện thoại bị treo do subtitle quá nặng", cho thấy phương pháp này vẫn có một số hạn chế.


Không phải là giải pháp hoàn hảo


F4mi thừa nhận phương pháp của cô còn xa mới hoàn hảo. Các công cụ như Whisper của OpenAI, có khả năng nghe track âm thanh, vẫn có thể tạo ra transcript hữu ích mà không cần file caption. Và một trình đọc màn hình AI vẫn có thể dễ dàng trích xuất các subtitle mà con người có thể đọc được từ bất kỳ video nào.

Tuy nhiên, nỗ lực nhỏ bé của F4mi là một phần của phong trào lớn hơn nhằm chống lại các AI scraper đang cố gắng thu thập và tái sử dụng mọi thứ trên Internet công cộng. Chúng tôi tin rằng đây không phải là nỗ lực cuối cùng mà chúng ta thấy từ những người sáng tạo YouTube trong việc bảo vệ nội dung của họ khỏi kiểu "tóm tắt" AI này.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top