Làm thế nào để tạo video Deepfake trở nên dễ dàng và tại sao nó lại là một mối đe dọa?


Giờ đây, trí tuệ nhân tạo cho phép bất kỳ ai có điện thoại thông minh gợi lên những hình ảnh và âm thanh sống động như thật từ hư không, ngày càng khó để biết những gì bạn thấy và nghe trực tuyến là thực tế hay hư cấu. 

Microsoft sẽ trình bày tầm nhìn AI cho Windows và hơn thế nữa tại sự kiện đặc biệt
Làm thế nào để tạo video Deepfake trở nên dễ dàng và tại sao nó lại là một mối đe dọa? 

Lúc đầu, cái gọi là công nghệ deepfake chủ yếu được sử dụng trong các video người lớn trong đó khuôn mặt của người nổi tiếng được ánh xạ lên cơ thể của một diễn viên khiêu dâm mà không có sự đồng ý của họ. Tuy nhiên, nó ngày càng được sử dụng để truyền bá những thông tin sai lệch và gây tổn hại đến danh tiếng: Các cơ quan tình báo phát tán những clip giả mạo về các nhà lãnh đạo của các quốc gia đối thủ để làm mất uy tín của họ; Các chính trị gia xuất bản các video đã được chỉnh sửa về cảnh đối thủ của họ nói lắp bắp hoặc nói những điều họ chưa bao giờ nói. Các chính phủ cảnh báo về khả năng thông tin sai lệch ở quy mô công nghiệp có thể làm suy yếu nền dân chủ đã bắt đầu chống trả.

1. Deepfake được tạo ra như thế nào?

Mặc dù việc thao tác các tệp kỹ thuật số bằng Photoshop và các ứng dụng khác không có gì mới, nhưng việc xử lý các tệp kỹ thuật số được thực hiện bằng cách sử dụng một dạng AI. Một thuật toán được đào tạo để nhận dạng các mẫu trong bản ghi video thực của một người cụ thể, một quá trình được gọi là học sâu. Sau đó, có thể hoán đổi một phần tử của một video, chẳng hạn như khuôn mặt của người đó, thành một phần nội dung khác. Các thao tác này dễ gây hiểu lầm nhất khi kết hợp với công nghệ sao chép giọng nói, công nghệ này sẽ chia đoạn âm thanh của một người nào đó nói thành các đoạn nửa âm tiết có thể được tập hợp lại thành các từ mới có vẻ như được người đó nói trong bản ghi âm gốc. Đó là phương pháp tương tự được sử dụng để tạo ra trợ lý giọng nói như Siri của Apple và Alexa của Amazon.

2. Công nghệ deepfake phát triển như thế nào?

Bo mạch chủ, một ấn phẩm của Vice, đã báo cáo vào năm 2017 rằng một người dùng Reddit có tên là “deepfakes” đã nghĩ ra một thuật toán để cung cấp công khai các video giả bằng cách sử dụng mã nguồn mở. Trước đây, công nghệ này là lĩnh vực của các học giả và nhà nghiên cứu, nhưng bây giờ ai cũng có thể sử dụng nó. Reddit đã cấm người dùng “deepfakes”, nhưng hành vi này vẫn lan rộng. Sự ra mắt của Dall-E của OpenAI vào năm 2021 và ChatGPT vào năm 2022 đã đưa khả năng này lên một tầm cao mới. Các công cụ tạo phương tiện truyền thông AI ngày nay có thể tạo ra văn bản, hình ảnh chân thực và — ngày càng — video, chỉ từ một vài từ khóa được gõ vào giao diện giống như nhắn tin tức thời.

3. Deepfake đã phát triển như thế nào?

Thư viện nội dung mà thuật toán học sâu được cung cấp càng lớn thì khả năng giả mạo càng thực tế hơn. Apple đã ghi âm 10 đến 20 giờ phát biểu để tạo ra Siri. Nam diễn viên kiêm đạo diễn Jordan Peele đã thực hiện một đoạn deepfake dài một phút vào năm 2018, cho thấy cảnh cựu Tổng thống Mỹ Barack Obama sử dụng từ ngữ tục tĩu để ám chỉ người kế nhiệm ông, Donald Trump. Peele bắt chước giọng nói của Obama và sử dụng đoạn video mẫu dài 56 giờ của cựu tổng thống. Những kích thước mẫu đó là vô cùng nhỏ so với những gì các công ty AI hiện đang áp dụng các công cụ mới của họ: toàn bộ kho tài liệu có sẵn miễn phí trên web, từ YouTube đến Wikipedia đến thư viện hình ảnh lưu trữ. Cách đơn giản nhất để hiểu sự khác biệt mà điều này tạo ra là tham khảo lại clip lan truyền đó của Obama: Một người phải chỉnh sửa một video đã tồn tại và mang đến một màn trình diễn giọng hát thực sự; ngày nay, ai đó chỉ cần yêu cầu một cái máy tạo một đoạn video về cựu tổng thống và nó sẽ xuất hiện.

4. Một số ví dụ về deepfake là gì?

Vào tháng 5, một hình ảnh được cho là Lầu Năm Góc bốc cháy được lan truyền trên mạng, khiến chứng khoán Mỹ sụt giảm trong thời gian ngắn. Các chuyên gia cho biết bức ảnh cho thấy cột khói bên cạnh khu phức hợp quân sự có dấu hiệu được tạo ra bởi AI.

Vào tháng 3, người dùng mạng xã hội đã chia sẻ những hình ảnh do AI tạo ra cho thấy Trump bị cơ quan thực thi pháp luật của Thành phố New York bắt giữ. Người tạo ra nhiều hình ảnh lan truyền trên mạng xã hội xác nhận chúng được sản xuất bằng công cụ AI Midjourney.

Vào tháng 2, âm thanh bị chỉnh sửa lan truyền trên mạng tuyên bố rằng ứng cử viên tổng thống Nigeria Atiku Abubakar đang lên kế hoạch gian lận cuộc bầu cử tháng đó.

Vào năm 2021, một đoạn video dài một phút xuất hiện trên mạng cho thấy Tổng thống Ukraine Volodymyr Zelenskiy yêu cầu binh lính của mình hạ vũ khí và đầu hàng Nga.

Cựu Chủ tịch Hạ viện Hoa Kỳ Nancy Pelosi dường như đang nói ngọng trong một video đã được chỉnh sửa vào năm 2019 được lan truyền rộng rãi trên mạng xã hội.

5. Nguy hiểm ở đây là gì?

Mặc dù nhiều tác phẩm deepfake được sản xuất ngày nay vẫn còn khá kém chất lượng và dễ bị phát hiện, nhưng điều đáng lo ngại là cuối cùng chúng sẽ trở nên thuyết phục đến mức không thể phân biệt được đâu là thật đâu là giả. Hãy tưởng tượng những kẻ lừa đảo thao túng giá cổ phiếu bằng cách tạo ra các video giả về các giám đốc điều hành đưa ra các bản cập nhật của công ty; hoặc video giả mạo mô tả ứng cử viên tổng thống lạm dụng tình dục trẻ em, cảnh sát trưởng kích động bạo lực đối với nhóm thiểu số hoặc binh sĩ phạm tội ác chiến tranh. Những cá nhân nổi tiếng như chính trị gia và lãnh đạo doanh nghiệp đặc biệt gặp rủi ro, do có bao nhiêu bản ghi âm về họ được công khai. Đối với những người bình thường, đặc biệt là phụ nữ, công nghệ này giúp cho việc trả thù có thể xảy ra với phim khiêu dâm ngay cả khi không có ảnh hoặc video khỏa thân thực sự nào tồn tại. Một khi một video lan truyền trên internet thì gần như không thể ngăn chặn được. Một mối quan tâm nữa là việc truyền bá nhận thức về deepfake sẽ giúp những người thực sự bị ghi hình đang làm hoặc nói những điều phản cảm hoặc bất hợp pháp dễ dàng tuyên bố rằng bằng chứng chống lại họ là không có thật. Một số người đã đưa ra lời bào chữa cho deepfake trước tòa, nói rằng tài liệu video được sử dụng để chống lại họ có thể đã được sản xuất.

6. Làm thế nào để bạn phát hiện ra một deepfake?

Loại máy học tạo ra các tác phẩm sâu không thể dễ dàng đảo ngược để phát hiện chúng. Các nhà nghiên cứu đã xác định được manh mối có thể cho thấy một video không chân thực - ví dụ: nếu người nói không chớp mắt trong một lúc hoặc có vẻ hơi giật - nhưng những chi tiết như vậy có thể dễ dàng khiến người xem không chú ý. Bằng cách tăng cường độ bão hòa màu trên video của một người, có thể phát hiện mạch của người đó từ sự thay đổi gần như vô hình trên da mặt; một hình ảnh được tạo từ một loạt các clip sẽ có dòng máu không đều hoặc không tồn tại.

7. Có điều gì đang được thực hiện không?

Một số công ty khởi nghiệp như Sensity AI có trụ sở tại Hà Lan và Sentinel có trụ sở tại Estonia đang phát triển công nghệ phát hiện deepfake, cũng như nhiều công ty công nghệ lớn. Intel Corp. đã ra mắt sản phẩm FakeCatcher vào tháng 11 năm ngoái như một phần công việc của mình về AI có trách nhiệm. Theo công ty, nó có thể phát hiện hàng giả với độ chính xác 96%. Bộ Quốc phòng Hoa Kỳ cũng đang phát triển các công cụ để chống lại deepfake và đây là mối quan tâm chính của các cơ quan quản lý trong nhiều cuộc họp với các ông chủ ngành AI. Trong bối cảnh chính phủ liên bang đang bế tắc, các cơ quan lập pháp của các bang đã nhanh chóng đưa ra các luật nhằm giải quyết những tác hại trước mắt của AI. Chín tiểu bang đã ban hành luật điều chỉnh các hành vi giả mạo sâu, chủ yếu trong bối cảnh nội dung khiêu dâm và ảnh hưởng đến bầu cử, và ít nhất bốn tiểu bang khác có các dự luật ở các giai đoạn khác nhau của quy trình lập pháp. Đạo luật AI của Liên minh Châu Âu, vẫn đang được đàm phán, sẽ yêu cầu các công ty dán nhãn cho các tác phẩm deepfake như vậy.

8. Có công dụng nhân từ không?

Đúng. Công ty CereProc của Scotland tạo ra giọng nói kỹ thuật số cho những người bị mất giọng nói do bệnh tật và việc nhân bản giọng nói có thể phục vụ mục đích giáo dục bằng cách tái tạo âm thanh của các nhân vật lịch sử. Một dự án tại Đại học bang North Carolina đã tổng hợp một trong những bài phát biểu không được ghi âm của Martin Luther King Jr. CereProc đã tạo ra một phiên bản của bài diễn văn cuối cùng được viết bởi Tổng thống John F. Kennedy, người đã bị ám sát trước khi gửi nó. Tuy nhiên, Thư viện John F. Kennedy đã từ chối bản ghi âm và nói rằng nó không đáp ứng các nguyên tắc của nó.

Kệ tham khảo

QuickTake giải thích về việc quản lý AI ở Hoa Kỳ, tại sao AI là điểm sáng tiếp theo trong cuộc cạnh tranh Mỹ-Trung, một mánh gian lận đối với các từ thông dụng về AI và công nghệ đằng sau các công cụ AI tổng hợp.

Chủ tịch Ủy ban Chứng khoán và Giao dịch Gary Gensler cho biết Deepfakes cũng gây ra mối đe dọa cho thị trường tài chính.

Cách Google và Microsoft tăng cường nội dung khiêu dâm deepfake bằng AI

Bloomberg Law cho biết các cơ quan quản lý Hoa Kỳ đang vật lộn tìm cách ngăn chặn các hành vi deepfake ảnh hưởng đến cuộc bầu cử tổng thống năm 2024.

Một video của Bloomberg về Lyrebird, công ty AI có khả năng đưa lời nói vào miệng bạn.

Tham khảo bài viết gốc tại đây:

Thành viên mới đăng
Top