VnReview
Hà Nội

Phần mềm chỉ cần vẽ đường thẳng là ra hình ảnh vật thể

Có thể coi công cụ phác thảo hình ảnh ứng dụng công nghệ AI này của Nvidia là phiên bản kế nhiệm hoàn hảo của Microsoft Paint trong thời đại AI.

Tại sự kiện Nvidia GTC 2019, Nvidia đã trình làng một công cụ tạo dựng hình ảnh đầy ấn tượng. Nhờ ứng dụng AI, người dùng chỉ cần vài cú nhấp chuột trên phần mềm có tên GauGAN là có thể ngay lập tức phác họa ra được một bức tranh theo đúng ý muốn.

Sau khi người dùng vạch ra một đường kẻ, phần mềm sẽ ngay lập tức nhận diện bối cảnh trong bức tranh và biến nó thành chủ thể mà bạn mong muốn. Ví dụ như trong bản demo của Nvidia, khi người dùng kẻ một đường thẳng xuống trong bức tranh phác họa, ngay lập tức GauGAN nhận diện đó là một dòng thác đổ từ trên núi xuống và kết quả là chúng ta có một bức tranh thiên nhiên hùng vĩ (ảnh trên).

Theo Techcrunch, GauGAN là minh chứng cho thấy những gì mà mạng thần kinh của Nvidia có thể làm được. Nhiệm vụ của GauGAN là hiểu và biến đổi một hình ảnh theo cách mà con người sẽ vẽ ra. Mục tiêu của công cụ này là phác thảo ý tưởng và biến nó thành một bức ảnh thực tế trong vài giây.

Phần mềm GauGAN có ba công cụ chủ yếu là thùng sơn, bút và bút chì. Ở dưới cùng là một loạt các đối tượng gợi ý mà phần mềm đưa ra để người dùng lựa chọn. Ví dụ nếu như bạn chọn đối tượng là đám mây và vẽ một đường thẳng bằng bút chì, phần mềm sẽ tạo ra một đám mây vắt ngang. Bạn có thể vẽ thêm vòng tròn và tô màu cho nó bằng công cụ thùng sơn, từ đó đám mây sẽ có cảm giác phồng lên và trông chân thực hơn.

Nếu bạn muốn vẽ một cái cây, bạn sẽ cần vẽ một đường thẳng để tạo ra thân cây. Sau đó bạn vẽ một hình tròn ở trên đường thẳng và phần mềm sẽ tự động nhận diện đó là lá và tạo ra một cái cây hoàn chỉnh.

Bạn không cần quá lo về việc GauGAN sẽ tạo ra các vật thể giống nhau trong cùng một bức ảnh, bởi phần mềm có thể tạo ra các bản phác thảo khác nhau cho cùng một vật thể để tăng mức độ sinh động cho bức ảnh.

Để đảm bảo kết quả có thể hiển thị ngay trong thời gian thực, GauGAN sử dụng nền tảng điện toán Tensor. Nvidia đã tình diễn phần mềm GauGAN trên nền tảng GPU RDX Titan và kết quả là hình ảnh phác thảo hiển thị khá mượt mà trong thời gian thực. Theo Bryan Catanzaro, phó chủ tịch phụ trách bộ phận nghiên cứu deep learning cho biết, GauGAN có thể chạy trên mọi nền tảng, bất chấp GPU hay CPU là gì. Tuy nhiên với các dòng GPU đời thấp hoặc yếu hơn, thời gian hiển thị có thể lâu hơn.

Có thể thấy trong demo, ranh giới giữa các đối tượng vẫn còn đôi chút chưa hoàn thiện và nhóm nghiên cứu đang tích cực cải thiện điều này bằng mạng thần kinh.

Nvidia đã chuyển khoảng 1 triệu hình ảnh đã được cấp phép trên Flickr vào bộ dữ liệu để huấn luyện mạng thần kinh. Nvidia cho biết, chương trình có thể tổng hợp hàng trăm ngàn đối tượng và mối quan hệ giữa chúng với các đối tượng khác trong thế giới thực.

Nói cách khác, GauGAN có thể hiểu bối cảnh để phác họa ra các đối tượng một cách hợp lý. Ví dụ nếu bối cảnh là bầu trời mùa đông thì cây sẽ không có lá mà chỉ có cành cây. Hoặc nếu có một hồ nước ở trước cây, GauGAN sẽ tự biết cách đổ bóng cây lên trên mặt hồ.

Hiện tại Nvidia chưa có kế hoạch thương mại hóa phần mềm này và điều này cũng khá dễ hiểu khi hãng mới chỉ đang thử nghiệm các tính năng. Tuy nhiên hãng sẽ sớm phát hành một bản thử nghiệm công khai cho tất cả người dùng trong thời gian tới.

Bản demo phần mềm phác thảo ứng dụng công nghệ AI GauGAN của Nvidia

Tiến Thanh

Chủ đề khác