Các pháp sư sáng tạo ra phần mềm chỉnh sửa ảnh bằng AI ngay trên trình duyệt như đang sử dụng trên Photoshop

Linh Pham · 20:49 Hôm qua

Trước đây, trong các công việc thực tế, AI tỏ ra rất mạnh trong việc tạo ra hình ảnh, nhưng khả năng chỉnh sửa lại vô cùng hạn chế. Gần đây, một nhóm triển khai sản phẩm mới với nguyên tắc: toàn bộ hình ảnh phải được xử lý hoàn toàn bằng AI, không thuê thêm thiết kế bên ngoài. Tuy nhiên, việc này không hề dễ dàng, quá trình thử và chọn ảnh khiến ai cũng mệt mỏi.

Trong một ví dụ, có người đã phải dành cả buổi để sửa một banner. Dù các mô hình như Nano Banana hay Seedream 4.0 đã rất mạnh trong chỉnh sửa, nhưng bản chất của chúng vẫn dựa trên ngôn ngữ tự nhiên, một cách khó kiểm soát chính xác. Vì vậy, giải pháp tạm thời là để AI tạo ra phần nền phù hợp, rồi đưa vào Photoshop để thêm chữ và tinh chỉnh thủ công. Đây là “thực hành tốt nhất” nhóm rút ra được sau nhiều lần thử, nhưng hiệu quả không cao và tốn thời gian.

Việc chỉnh sửa đơn giản như thay đổi kiểu chữ trong ảnh, nếu có thể thao tác trực tiếp như trong Photoshop, sẽ dễ dàng hơn rất nhiều. Tiếc rằng trước đây, chưa có mô hình AI nào đạt đến mức đó, mọi hình ảnh đầu ra chỉ là JPG phẳng, không thể tách lớp như file PSD. Trong các tình huống thực tế, việc chỉnh sửa bằng AI thường dẫn đến vòng lặp mô tả – thất vọng – thử lại, khiến người dùng nản lòng.

Khi Lovart công bố hỗ trợ chỉnh sửa ảnh theo lớp, trải nghiệm thử nghiệm cho thấy đây là một đột phá thực sự. Sau khi tải lên hoặc tạo hình ảnh, người dùng chỉ cần chọn chức năng “chỉnh sửa phần tử”, Lovart sẽ tự động nhận diện cấu trúc trong ảnh: người, nền, chữ, kiến trúc… và tách chúng thành các lớp riêng biệt. Có thể chọn lớp nhân vật để di chuyển, thay đổi màu sắc và kích thước chữ, hoặc chỉnh ánh sáng nền mà không ảnh hưởng đến tiền cảnh. Các thao tác này có thể thực hiện bằng gợi ý văn bản hoặc kéo thả trực tiếp.

Nhờ vậy, việc chỉnh sửa ảnh trở nên linh hoạt như trong Photoshop: thay font, đổi màu, thêm viền, thậm chí di chuyển hoặc loại bỏ từng phần tử. Điều này khiến nhiều người cảm thấy có thể ngừng gia hạn Photoshop.

Đáng chú ý, Adobe gần đây cũng công bố mô hình Firefly Image 5 với tính năng tương tự, nhưng sản phẩm vẫn chưa thực sự ra mắt, chưa có cổng truy cập cụ thể, khác hẳn Lovart đã triển khai ngay.

Công nghệ mà Lovart sử dụng hiện chưa được công bố chi tiết, dù có một số nghiên cứu học thuật năm 2024 đề cập đến hướng phát triển này. Điều đáng ngạc nhiên là các “ông lớn” như Google, OpenAI hay Midjourney vẫn chưa thực hiện được khả năng tương tự, dù đây là nhu cầu rất rõ ràng.

Tuy vậy, Lovart vẫn tồn tại một số lỗi nhỏ. Trong các ảnh có chữ viết tay, quá trình tách lớp đôi khi khiến nét chữ bị lệch nhẹ hoặc thay đổi độ dày. Dù vậy, kết quả tổng thể vẫn rất ấn tượng, và các vấn đề nhỏ này chắc chắn sẽ được khắc phục theo thời gian.

Điều đáng mừng là từ nay, mọi hình ảnh đều có thể chỉnh sửa được, một bước nhảy vọt trong quy trình làm việc thị giác. Trước đây, muốn sửa một ảnh JPG, người dùng phải cắt, che, vẽ lại, đây từng là đổi mới của Photoshop trong thế hệ cũ. Muốn di chuyển nhân vật, phải cắt và bù nền; muốn sửa chữ, phải che đi rồi viết lại. Chỉ khi có file PSD, việc chỉnh sửa mới thật sự linh hoạt.

Các ứng dụng như Meitu có thể hạ thấp rào cản sử dụng, nhưng vẫn không đủ chuyên nghiệp trong các tình huống nghiêm túc. Về bản chất, ảnh JPG chỉ là các điểm ảnh độc lập, không có mối quan hệ ngữ nghĩa. Công cụ không thể “hiểu” nội dung của ảnh.

Lovart thì khác. Nó hiểu được ảnh, biết đâu là tiền cảnh, đâu là hậu cảnh, đâu là chữ, người, vật thể, và phần nào thuộc cùng một đơn vị ngữ nghĩa. Dựa trên sự hiểu biết đó, hệ thống tự động tách ảnh thành các lớp có thể chỉnh sửa. Nhờ vậy, chữ có thể thay đổi, nhân vật có thể di chuyển, bố cục có thể sắp xếp lại một cách tự nhiên. Từ “chỉnh sửa” chuyển thành “biên tập” thực thụ.

Ngoài tính năng này, Lovart còn nhanh chóng tích hợp hai mô hình video mới nhất: Hailuo 2.3 và LTX 2. Hailuo là sản phẩm của MiniMax (Trung Quốc), nay cải thiện rõ rệt khả năng tạo nội dung chân thực. LTX 2 của công ty Lightricks (Israel) nổi bật ở tốc độ — có thể tạo video 20 giây độ phân giải 1080p chỉ trong 30 giây, thậm chí hỗ trợ tối đa đến 2160p, với chất lượng rất cao.

Kết hợp với khả năng chỉnh sửa ảnh, tương lai Lovart có thể mở rộng sang chỉnh sửa video, nơi người dùng có thể thao tác video như chỉnh ảnh, khi đó, ngưỡng sáng tạo sẽ tiếp tục được hạ thấp, đưa sản xuất nội dung trở nên phổ biến và tự do hơn.

Chỉ cách đây một tuần, nhiều nhóm vẫn phải mất hàng giờ để điều chỉnh một tấm poster, liên tục thay gợi ý mà không đạt kết quả mong muốn. Có lúc phải tự hỏi: liệu AI đã sẵn sàng đáp ứng nhu cầu thực tế chưa, hay vẫn nên quay lại với thiết kế truyền thống? Nhưng chỉ sau một cuối tuần, công nghệ đã đem lại câu trả lời khác hẳn.

Có thể bạn quan tâm

Chủ đề hot

Có thể bạn quan tâm

Các pháp sư sáng tạo ra phần mềm chỉnh sửa ảnh bằng AI ngay trên trình duyệt như đang sử dụng trên Photoshop

Linh Pham

Intern Writer

Linh Pham

Việt Nam là 1 trong 7 thị trường đầu tiên được dùng Sora trên Android

Liệu AI có thực sự làm được việc đó không? Một thí nghiệm thực tế ở Thung lũng Silicon đã đưa ra một câu trả lời khó hiểu

Sử dụng Sora trên Android bằng cách nào?

Điều gì khiến trình duyệt AI có thể biến thành “kẻ nội gián” ngay trên máy tính của bạn?

Tại sao OpenAI lại chi tới 600 tỷ đô chỉ để “thuê đám mây”?

Chiến lược tự phát triển AI thất bại, Apple giờ phải "cầu cứu" Google Gemini

Liên minh 3 nhóm hacker khét tiếng thành thế lực đe dọa toàn cầu

Cảnh báo: Mã độc giả mạo Telegram X chiếm toàn bộ điện thoại và thiết bị của bạn

Hơn 48.000 thiết bị Cisco đối mặt làn sóng tấn công từ ba lỗ hổng nghiêm trọng

Cháy trung tâm dữ liệu, hơn 600 dịch vụ chính phủ Hàn Quốc tê liệt

Khi dữ liệu số bị lộ: Hacker có thể làm gì với các thông tin tài chính của bạn?

Apple vá lỗ hổng nghiêm trọng trong hệ thống xử lý hình ảnh: Người dùng cần cập nhật ngay

HP OmniBook X Flip 14: Laptop chuẩn Copilot+ PC với AI mạnh mẽ, thiết kế linh hoạt cho người dùng hiện đại

Tổng thống Trump đề cử lại Giám đốc NASA, đẩy nhanh tiến độ đưa người lên Mặt trăng

Việt Nam là 1 trong 7 thị trường đầu tiên được dùng Sora trên Android

Liệu AI có thực sự làm được việc đó không? Một thí nghiệm thực tế ở Thung lũng Silicon đã đưa ra một câu trả lời khó hiểu

Đánh giá nổi bật