Một video âm nhạc mới của ca sĩ kiêm nhạc sĩ Washed Out vừa được tung ra trên YouTube. Tuy nhiên, đây không phải là video âm nhạc thông thường vì toàn bộ clip ca nhạc dài bốn phút này được thực hiện bằng công cụ AI tạo video bằng văn bản Sora của OpenAI.
Đạo diễn của video, Paul Trillo cho biết anh đã tạo ra video từ những câu lệnh với AI Sora, và phải mất hơn 55 clip riêng lẻ được ghép lại với nhau thông qua ứng dụng Adobe Premiere Pro để tạo ra sản phẩm cuối cùng. Điều nổi bật trong video này là tính nhất quán của các nhân vật được thể hiện một cách ấn tượng, và nếu không tiết lộ đây là video được tạo bởi AI, hẳn bạn sẽ nghĩ rằng nó là một video thông thường được quay bởi con người.
Video được ủy quyền bởi ca sĩ indie Ernest Green, được biết đến với cái tên chuyên nghiệp là Washed Out cho ca khúc The Hardest Part của anh ấy. Trillo nói trên X: “Đây là ý tưởng mà tôi đã ấp ủ gần 10 năm trước và sau đó đã bỏ dở. Cuối cùng cũng có thể biến nó thành hiện thực.”
Đây không phải là video âm nhạc đầu tiên được tạo bởi AI Sora nhưng là video thương mại đầu tiên được thực hiện bởi công cụ tạo video từ văn bản bày. Đặc biệt, tính nhất quán và chân thực trong video khiến người xem khó lòng phân biệt là nó được tạo bởi AI hay con người.
Nội dung chính của video là hình ảnh chuyển động liên tục về phía trước, tựa như máy quay đang được gắn trên một chiếc drone và bay theo sau một cặp đôi, đi qua nhiều khung cảnh khác nhau từ bên trong một chiếc xe buýt đến một căng-tin, có lúc như ở trong lớp học rồi lại chuyển sang một khuôn viên, rồi một siêu thị.
Đoạn video dường như kể về câu chuyện của một cặp vợ chồng trong suốt những năm đi học, khi họ có con và sau đó là khi họ lớn lên và hình ảnh trong video là những khoảnh khắc đáng nhớ của cặp đôi.
Vẫn có một số khoảnh khắc có thể nhận ra khá rõ ràng hình ảnh được tạo bởi AI, như cảnh quay có một em bé như đang lơ lửng trong không trung, nhưng chúng xuất hiện rất ít và cho chúng ta thấy một ví dụ tuyệt vời về việc sử dụng clip AI.
Đạo diễn Trillo cho biết phải mất tổng cộng 55 clip được ghép lại với nhau để tạo nên video này và theo như cách hoạt động của công cụ AI Sora thì có thể mất khoảng 10 phút để tạo nên mỗi clip.
Có một số thao tác chỉnh sửa nhỏ trong After Effects nhưng Trillo cho biết anh không phải can thiệp quá nhiều. Tuy nhiên, không rõ là anh đã tạo ra bao nhiêu clip để tìm ra được 55 clip cuối cùng để đưa vào video.
Mặc dù Sora vẫn chưa thể thay thế được việc làm phim truyền thống trong mọi lĩnh vực, nhưng việc tạo một video âm nhạc cho một bài hát chỉ cần chi phí khiêm tốn là một yếu tố thực sự có thể thay đổi cuộc chơi.
Tính nhất quán của các nhân vật trong video rất ấn tượng nhưng chưa hoàn hảo. Tuy nhiên, nó cho thấy khi các công cụ AI được đặt vào tay những nhà sáng tạo xuất sắc, kết quả cho ra sẽ có thể làm bạn kinh ngạc thế nào.
>> Ngỡ ngàng với loạt video AI tạo bằng văn bản từ công cụ Sora do OpenAI vừa công bố, giới làm phim, làm TVC lo dần đi là vừa
Video được ủy quyền bởi ca sĩ indie Ernest Green, được biết đến với cái tên chuyên nghiệp là Washed Out cho ca khúc The Hardest Part của anh ấy. Trillo nói trên X: “Đây là ý tưởng mà tôi đã ấp ủ gần 10 năm trước và sau đó đã bỏ dở. Cuối cùng cũng có thể biến nó thành hiện thực.”
Đây không phải là video âm nhạc đầu tiên được tạo bởi AI Sora nhưng là video thương mại đầu tiên được thực hiện bởi công cụ tạo video từ văn bản bày. Đặc biệt, tính nhất quán và chân thực trong video khiến người xem khó lòng phân biệt là nó được tạo bởi AI hay con người.
Nội dung chính của video là hình ảnh chuyển động liên tục về phía trước, tựa như máy quay đang được gắn trên một chiếc drone và bay theo sau một cặp đôi, đi qua nhiều khung cảnh khác nhau từ bên trong một chiếc xe buýt đến một căng-tin, có lúc như ở trong lớp học rồi lại chuyển sang một khuôn viên, rồi một siêu thị.
Đoạn video dường như kể về câu chuyện của một cặp vợ chồng trong suốt những năm đi học, khi họ có con và sau đó là khi họ lớn lên và hình ảnh trong video là những khoảnh khắc đáng nhớ của cặp đôi.
Vẫn có một số khoảnh khắc có thể nhận ra khá rõ ràng hình ảnh được tạo bởi AI, như cảnh quay có một em bé như đang lơ lửng trong không trung, nhưng chúng xuất hiện rất ít và cho chúng ta thấy một ví dụ tuyệt vời về việc sử dụng clip AI.
Đạo diễn Trillo cho biết phải mất tổng cộng 55 clip được ghép lại với nhau để tạo nên video này và theo như cách hoạt động của công cụ AI Sora thì có thể mất khoảng 10 phút để tạo nên mỗi clip.
Có một số thao tác chỉnh sửa nhỏ trong After Effects nhưng Trillo cho biết anh không phải can thiệp quá nhiều. Tuy nhiên, không rõ là anh đã tạo ra bao nhiêu clip để tìm ra được 55 clip cuối cùng để đưa vào video.
Mặc dù Sora vẫn chưa thể thay thế được việc làm phim truyền thống trong mọi lĩnh vực, nhưng việc tạo một video âm nhạc cho một bài hát chỉ cần chi phí khiêm tốn là một yếu tố thực sự có thể thay đổi cuộc chơi.
Tính nhất quán của các nhân vật trong video rất ấn tượng nhưng chưa hoàn hảo. Tuy nhiên, nó cho thấy khi các công cụ AI được đặt vào tay những nhà sáng tạo xuất sắc, kết quả cho ra sẽ có thể làm bạn kinh ngạc thế nào.
>> Ngỡ ngàng với loạt video AI tạo bằng văn bản từ công cụ Sora do OpenAI vừa công bố, giới làm phim, làm TVC lo dần đi là vừa