Tại Lễ trao giải thưởng Sáng tạo Khoa học Công nghệ Việt Nam (VIFOTEC), Viettel AI- đơn vị trực thuộc Tập đoàn Công nghiệp - Viễn thông Quân đội (Viettel), đã được trao giải Khuyến khích cho công trình nghiên cứu về nhận diện chữ viết tay tiếng Việt.
Từ lâu, việc trích xuất thông tin từ hình ảnh văn bản, đặc biệt là tài liệu có bảng biểu không phân tách, chữ viết tay, định dạng phi chuẩn…, vẫn là một bài toán nan giải trong giới công nghệ.
Các tập đoàn công nghệ lớn như Google, Microsoft, Amazon đã phát triển nhiều hệ thống nhận diện ký tự quang học và xử lý ngôn ngữ tự nhiên mạnh mẽ nhưng phần lớn chỉ tối ưu cho tiếng Anh và một số ngôn ngữ phổ biến.
Với tiếng Việt, một ngôn ngữ có hệ thống dấu phong phú, cấu trúc ngữ âm đa tầng, các hệ thống quốc tế thường cho kết quả với độ chính xác chưa cao, đặc biệt trong xử lý chữ viết tay.
Công trình nghiên cứu “Phát triển công nghệ trích xuất thông tin từ ảnh văn bản có đa dạng bố cục, bảng biểu và chữ viết tay tiếng Việt” do Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) nghiên cứu và làm chủ đã vinh dự nhận giải Khuyến khích tại VIFOTEC 2024.
Đây là giải thưởng cấp quốc gia, được tổ chức thường niên bởi Liên hiệp các Hội Khoa học và Kỹ thuật Việt Nam phối hợp với Bộ Khoa học & Công nghệ, Tổng Liên đoàn Lao động Việt Nam và Trung ương Đoànthanh niên. Nghiên cứu của Viettel AI cũng là một trong những nền tảng công nghệ trích xuất thông tin từ văn bản tiếng Việt đầu tiên do người Việt tự nghiên cứu, phát triển và làm chủ toàn bộ công nghệ lõi.
Công nghệ này có khả năng nhận dạng và xử lý chính xác văn bản ảnh có cấu trúc phức tạp, bao gồm bảng biểu không phân tách, định dạng phi chuẩn và đặc biệt là chữ viết tay tiếng Việt. Độ chính xác khi nhận diện văn bản lên đến 99% với chữ in và 90% với chữ viết tay.
Về nhận dạng biểu đồ, công nghệ của Viettel AI đạt độ chính xác 98,6%, gần bằng các ông lớn như Microsoft, Alibaba, Tencent hay IFLYTEK trong khi tốc độ xử lý lại nhanh hơn. Ngoài ra, không phát triển đơn lẻ từng sản phẩm, Viettel AI lựa chọn hướng đi khác biệt khi xây dựng một nền tảng công nghệ có kiến trúc mở, cho phép lắp ghép linh hoạt các module, tùy biến theo nhu cầu của từng bài toán cụ thể.
Dựa trên nền tảng đó, Viettel AI đã phát triển ra nhiều giải pháp nhằm đưa công nghệ ứng dụng thực tiễn cho cuộc sống. Trong đó, tiêu biểu là Viettel IPA, giải pháp tự động hoá quy trình đang được triển khai rộng rãi trong nhiều lĩnh vực như bảo hiểm, ngân hàng, hành chính - văn phòng…
Viettel IPA cho phép nhận diện chữ viết và tự động trích xuất thông tin từ các loại giấy tờ tuỳ thân, hoá đơn, hợp đồng…, tự động phân loại các loại giấy tờ khác nhau, và tự động phê duyệt, thẩm định hồ sơ, tối ưu quy trình xử lý giấy tờ tại các doanh nghiệp, tổ chức.
Đặc biệt, sản phẩm giúp dễ dàng số hóa hàng triệu hồ sơ và tiết kiệm đến 80% thời gian, công sức cho các tổ chức và doanh nghiệp trong các nghiệp vụ xử lý giấy tờ. Sản phẩm giúp giám sát văn bản trên không gian mạng, hỗ trợ xác minh danh tính, tự động hoá xử lý văn bản hành chính...
Trước đó, công nghệ nhận diện văn bản của Viettel AI cũng được ghi nhận tại nhiều giải thưởng uy tín trong nước và quốc tế như IT World Awards, Make in Vietnam, Vietnam Digital Awards…
Công trình cũng được công bố tại ba hội nghị khoa học hàng đầu thế giới trong lĩnh vực thị giác máy tính và AI là ICDAR (Hội nghị Quốc tế về Phân tích và Nhận dạng Văn bản), DICTA (Hội nghị Quốc tế về Tính toán Ảnh số), và IEEE NICS (Hội nghị về Thông tin và Khoa học Máy tính). Đặc biệt, một phần quan trọng của công trình là module xử lý biểu mẫu cố định đã được Cục Sở hữu trí tuệ Việt Nam cấp bằng sáng chế.
Từ lâu, việc trích xuất thông tin từ hình ảnh văn bản, đặc biệt là tài liệu có bảng biểu không phân tách, chữ viết tay, định dạng phi chuẩn…, vẫn là một bài toán nan giải trong giới công nghệ.
Các tập đoàn công nghệ lớn như Google, Microsoft, Amazon đã phát triển nhiều hệ thống nhận diện ký tự quang học và xử lý ngôn ngữ tự nhiên mạnh mẽ nhưng phần lớn chỉ tối ưu cho tiếng Anh và một số ngôn ngữ phổ biến.
Với tiếng Việt, một ngôn ngữ có hệ thống dấu phong phú, cấu trúc ngữ âm đa tầng, các hệ thống quốc tế thường cho kết quả với độ chính xác chưa cao, đặc biệt trong xử lý chữ viết tay.
Công trình nghiên cứu “Phát triển công nghệ trích xuất thông tin từ ảnh văn bản có đa dạng bố cục, bảng biểu và chữ viết tay tiếng Việt” do Trung tâm Dịch vụ dữ liệu và Trí tuệ nhân tạo Viettel (Viettel AI) nghiên cứu và làm chủ đã vinh dự nhận giải Khuyến khích tại VIFOTEC 2024.

Đây là giải thưởng cấp quốc gia, được tổ chức thường niên bởi Liên hiệp các Hội Khoa học và Kỹ thuật Việt Nam phối hợp với Bộ Khoa học & Công nghệ, Tổng Liên đoàn Lao động Việt Nam và Trung ương Đoànthanh niên. Nghiên cứu của Viettel AI cũng là một trong những nền tảng công nghệ trích xuất thông tin từ văn bản tiếng Việt đầu tiên do người Việt tự nghiên cứu, phát triển và làm chủ toàn bộ công nghệ lõi.
Công nghệ này có khả năng nhận dạng và xử lý chính xác văn bản ảnh có cấu trúc phức tạp, bao gồm bảng biểu không phân tách, định dạng phi chuẩn và đặc biệt là chữ viết tay tiếng Việt. Độ chính xác khi nhận diện văn bản lên đến 99% với chữ in và 90% với chữ viết tay.
Về nhận dạng biểu đồ, công nghệ của Viettel AI đạt độ chính xác 98,6%, gần bằng các ông lớn như Microsoft, Alibaba, Tencent hay IFLYTEK trong khi tốc độ xử lý lại nhanh hơn. Ngoài ra, không phát triển đơn lẻ từng sản phẩm, Viettel AI lựa chọn hướng đi khác biệt khi xây dựng một nền tảng công nghệ có kiến trúc mở, cho phép lắp ghép linh hoạt các module, tùy biến theo nhu cầu của từng bài toán cụ thể.
Dựa trên nền tảng đó, Viettel AI đã phát triển ra nhiều giải pháp nhằm đưa công nghệ ứng dụng thực tiễn cho cuộc sống. Trong đó, tiêu biểu là Viettel IPA, giải pháp tự động hoá quy trình đang được triển khai rộng rãi trong nhiều lĩnh vực như bảo hiểm, ngân hàng, hành chính - văn phòng…
Viettel IPA cho phép nhận diện chữ viết và tự động trích xuất thông tin từ các loại giấy tờ tuỳ thân, hoá đơn, hợp đồng…, tự động phân loại các loại giấy tờ khác nhau, và tự động phê duyệt, thẩm định hồ sơ, tối ưu quy trình xử lý giấy tờ tại các doanh nghiệp, tổ chức.
Đặc biệt, sản phẩm giúp dễ dàng số hóa hàng triệu hồ sơ và tiết kiệm đến 80% thời gian, công sức cho các tổ chức và doanh nghiệp trong các nghiệp vụ xử lý giấy tờ. Sản phẩm giúp giám sát văn bản trên không gian mạng, hỗ trợ xác minh danh tính, tự động hoá xử lý văn bản hành chính...
Trước đó, công nghệ nhận diện văn bản của Viettel AI cũng được ghi nhận tại nhiều giải thưởng uy tín trong nước và quốc tế như IT World Awards, Make in Vietnam, Vietnam Digital Awards…
Công trình cũng được công bố tại ba hội nghị khoa học hàng đầu thế giới trong lĩnh vực thị giác máy tính và AI là ICDAR (Hội nghị Quốc tế về Phân tích và Nhận dạng Văn bản), DICTA (Hội nghị Quốc tế về Tính toán Ảnh số), và IEEE NICS (Hội nghị về Thông tin và Khoa học Máy tính). Đặc biệt, một phần quan trọng của công trình là module xử lý biểu mẫu cố định đã được Cục Sở hữu trí tuệ Việt Nam cấp bằng sáng chế.