Tại sao dữ liệu phi cấu trúc đặt ra thách thức cho việc áp dụng AI?

Thoại Viết Hoàng · 17/08/2023

Đến năm 2030, AI được thiết lập để đóng góp tới 15,7 nghìn tỷ USD cho nền kinh tế toàn cầu, nhờ tăng năng suất từ các doanh nghiệp tự động hóa quy trình và tăng cường lực lượng lao động hiện có.

Các tập đoàn có định cấm sử dụng ChatGPT không?

Tại sao dữ liệu phi cấu trúc đặt ra thách thức cho việc áp dụng AI?

Cuộc đua hiện đang diễn ra để các tổ chức kết hợp AI vào hệ thống công nghệ của họ và tận dụng tiềm năng to lớn của công nghệ đang phát triển này. Theo Chỉ số áp dụng AI toàn cầu của IBM, 35% công ty đã sử dụng AI trong hoạt động kinh doanh của họ và thêm 42% đang khám phá cách triển khai công nghệ này trong tương lai gần.
Trường hợp kinh doanh cho AI là rõ ràng. Tự động hóa có thể hợp lý hóa quy trình làm việc, tăng năng suất của nhân viên, hỗ trợ quản lý rủi ro và cải thiện trải nghiệm của khách hàng. Tuy nhiên, hầu hết các doanh nghiệp đang tìm cách áp dụng AI không nhận ra rằng họ cần tất cả dữ liệu của mình ở một nơi trước khi có thể sử dụng AI để trích xuất giá trị.
Ngày nay, phần lớn dữ liệu kinh doanh không có cấu trúc. Không giống như dữ liệu có cấu trúc thường được lưu trữ ở định dạng bảng được tiêu chuẩn hóa trên các nền tảng ứng dụng như Salesforce hoặc Workday, dữ liệu phi cấu trúc thường bị phân mảnh trên các kho lưu trữ nội dung và ứng dụng khác nhau. Dữ liệu phi cấu trúc là nội dung kinh doanh quan trọng nằm ở trung tâm của mọi tổ chức, từ hợp đồng pháp lý giành được thỏa thuận và sàn bán hàng đến đồ họa tiếp thị bắt mắt và thiết kế sản phẩm đột phá.
Nhưng do bản chất rời rạc vốn có của nó, việc quản lý hoặc phân tích dữ liệu này bằng kỹ thuật số là vô cùng khó khăn, nghĩa là hiện tại chỉ có khoảng 0,5% dữ liệu phi cấu trúc đang được các doanh nghiệp sử dụng theo bất kỳ cách nào có ý nghĩa. Cho rằng đến năm 2025, 80% dữ liệu kỹ thuật số của thế giới sẽ không có cấu trúc, các doanh nghiệp đang xem xét áp dụng AI phải lấy dữ liệu phi cấu trúc của họ theo thứ tự trước. Nếu không, họ sẽ không khai thác được tiềm năng thực sự của những gì AI có thể mang lại cho tổ chức của họ.
Những thách thức của dữ liệu phi cấu trúc
Các doanh nghiệp đang tạo ra ngày càng nhiều dữ liệu phi cấu trúc dưới dạng nội dung số. Cho dù nó được sử dụng để tìm kiếm hình ảnh trong bộ phận tiếp thị, gọi hỗ trợ trong dịch vụ khách hàng hoặc đàm phán hợp đồng trong bộ phận pháp lý, dữ liệu phi cấu trúc nằm ở trung tâm của hoạt động kinh doanh của công ty.
Bản chất của dữ liệu phi cấu trúc là rời rạc và nếu không có chiến lược quản lý nội dung hiệu quả, dữ liệu này có thể dễ dàng bị khóa trong các silo khác nhau, khiến việc phân tích trở nên rất khó khăn. Đáng báo động là theo IDC, 90% dữ liệu phi cấu trúc không bao giờ được phân tích, nghĩa là các doanh nghiệp đang bỏ lỡ những hiểu biết có giá trị từ dữ liệu trong công ty của họ.
Dữ liệu im lặng này cũng có thể tác động đến mức năng suất trong toàn tổ chức. Khi nội dung bị xáo trộn, nó có thể gây ra sự chậm trễ khi truy xuất dữ liệu, vì nhân viên buộc phải điều hướng các hệ thống khác nhau hoặc chờ phê duyệt quyền truy cập, điều này có thể làm chậm tốc độ công việc. Tương tự, dữ liệu im lặng có thể cản trở sự hợp tác. Thay vì có thể cộng tác trên một phần nội dung trong thời gian thực, nhân viên có thể phải gửi tệp qua lại theo cách thủ công qua email hoặc ứng dụng nhắn tin, điều này không chỉ làm chậm quá trình cộng tác mà còn có thể dẫn đến sự cố kiểm soát phiên bản.
Tương tự, dữ liệu phi cấu trúc có thể gây ra rủi ro bảo mật đáng kể cho các tổ chức. Khi dữ liệu được lưu trữ trên các ứng dụng và vị trí khác nhau, việc triển khai chiến lược bảo mật toàn diện và phối hợp sẽ trở nên tốn nhiều công sức và chi phí hơn. Chẳng hạn, mỗi silo có thể có các biện pháp kiểm soát bảo mật riêng, dẫn đến nỗ lực trùng lặp và tăng chi phí hành chính. Hơn nữa, mỗi silo dữ liệu có thể có mức độ kiểm soát quyền truy cập và quyền khác nhau, nghĩa là nội dung có thể có nguy cơ bị mất hoặc bị rò rỉ do lỗi của người dùng hoặc dễ bị ảnh hưởng bởi hành vi nguy hiểm, chẳng hạn như phần mềm độc hại, hack hoặc lừa đảo.
Tầm quan trọng của việc tập trung hóa dữ liệu phi cấu trúc
Statista dự đoán rằng đến năm 2025, việc tạo dữ liệu toàn cầu sẽ tăng lên hơn 180 zettabyte. Để so sánh, vào năm 2020, có 6,4 zettabyte dữ liệu trên toàn thế giới. Để đi trước và thu được giá trị từ tất cả dữ liệu này bằng AI, trước tiên các doanh nghiệp phải loại bỏ các silo và tập trung nội dung của họ trên đám mây. Điều này sẽ cải thiện năng suất, sự cộng tác và cho phép tạo ra một chiến lược bảo mật tập trung duy nhất, giúp cắt giảm chi phí chung.
Ví dụ: hãy nghĩ xem có bao nhiêu nhóm cộng tác trong việc chuẩn bị bài thuyết trình để công bố một sản phẩm mới. Trong khi nhóm thiết kế đang xây dựng một bộ bài, nhóm bán hàng có thể cùng nhau phác thảo bản sao trong thời gian thực. Nhóm sản phẩm có thể nhập trực tiếp các tính năng mới thay vì gửi nội bộ cho nhóm thích hợp. Điều này giúp hợp lý hóa quy trình làm việc bên trong và bên ngoài, đồng thời kích hoạt các giao thức bảo mật tập trung, chẳng hạn như quản lý quyền và mã hóa đầu cuối.
Sử dụng một tổ chức dịch vụ tài chính toàn cầu làm ví dụ. Từ quảng cáo chiêu hàng đến đánh giá khách hàng và tài liệu, hầu hết công việc được thực hiện thông qua các quy trình tập trung vào tài liệu. Như vậy, phần lớn thông tin tình báo của công ty nằm trong các tài liệu, không phải trong dữ liệu có cấu trúc. Các tài liệu này tồn tại trong 15 hệ thống khác nhau ở 5 khu vực khác nhau, khiến cho việc tìm kiếm tất cả các tài liệu trên một máy khách đơn lẻ là không thể - và thậm chí còn khó bảo mật thông tin đó hơn. Trước khi công ty này thậm chí có thể sử dụng AI để thúc đẩy trí thông minh và hiệu quả, bước đầu tiên họ phải tập trung hóa nội dung của mình. Trong trường hợp xảy ra sự cố như Bernie Madoff, làm thế nào công ty có thể xem xét tất cả các tài liệu của mình để xác định mức độ tiếp xúc của họ với kẻ xấu? Nếu không có một trung tâm tập trung cho nội dung kinh doanh hoặc việc sử dụng AI, đó sẽ là một dự án lớn không phải là một câu hỏi.
Lợi ích của AI đối với nội dung kinh doanh
Sau khi một tổ chức có chiến lược nội dung tập trung, tổ chức đó có thể mở khóa tiềm năng thực sự của dữ liệu bằng AI. Nội dung có thể được tạo chỉ trong vài giây dựa trên các tài liệu được lưu trữ trong kho lưu trữ nội dung. Các quy trình kinh doanh thủ công, lặp đi lặp lại và tốn thời gian, chẳng hạn như tạo và phân loại tài liệu, có thể được tự động hóa và thực hiện ngay lập tức.
Thông qua nhận dạng hình ảnh, phiên âm lời nói thành văn bản và phân tích văn bản, giá trị chưa được khai thác trước đây có thể được trích xuất từ
nội dung, giúp tạo điều kiện thuận lợi hơn cho việc ra quyết định dựa trên dữ liệu trên tất cả các khía cạnh của tổ chức. Tất cả những điều này có thể giúp nhân viên tiết kiệm thời gian và tập trung vào các hoạt động chiến lược quan trọng để thúc đẩy thành công trong kinh doanh.
Ví dụ: người điều hành dịch vụ khách hàng có thể tìm kiếm bản ghi các cuộc trò chuyện của khách hàng để tìm từ khóa hoặc tên sản phẩm. Các nhà thiết kế đồ họa có thể tìm kiếm trong kho hình ảnh vô tận một cách dễ dàng và nhanh chóng hơn để tìm ra bức ảnh phù hợp cho một chiến dịch. Các trợ lý luật sư, những người cần hiểu các điểm chính của tài liệu dài 100 trang, có thể sử dụng chatbot AI để trích xuất những thông tin chi tiết hữu ích nhất trong một vài đoạn văn ngắn. Các nhóm truyền thông có thể sử dụng AI để thu hút kho lưu trữ nội dung của công ty nhằm phát triển các tài liệu mới, từ blog và thông cáo báo chí đến các bài đăng trên mạng xã hội, phù hợp với giọng nói và thông điệp của thương hiệu.
Ngoài ra, các quy trình công việc do AI cung cấp được bảo vệ tốt hơn khi nói đến an ninh mạng. Chúng có thể tự động phát hiện phần mềm độc hại, hack, lừa đảo và các rủi ro bảo mật khác, đồng thời có thể phân tích hành vi điển hình của người dùng - phát hiện sự bất thường và gửi cảnh báo khi xác định được các hành vi vi phạm tiềm ẩn.
Trong môi trường kinh tế hiện nay, các doanh nghiệp đang làm mọi thứ có thể để vượt lên. AI có tiềm năng to lớn trong các trường hợp sử dụng kinh doanh, nhưng có thể dư thừa nếu cơ cấu tổ chức phù hợp không được đặt lên hàng đầu. Các bộ dữ liệu không có cấu trúc và không có cấu trúc đặt ra một thách thức lớn đối với quá trình xử lý AI, vì vậy, trước tiên, các doanh nghiệp phải tập trung và hợp nhất nội dung của họ trong một nền tảng thống nhất trước khi thực hiện bước nhảy vọt để áp dụng các công nghệ đột phá này và hưởng lợi đầy đủ từ tiềm năng thực sự của chúng.
Tham khảo bài viết gốc tại đây

Tìm kiếm

Có thể bạn quan tâm

Tại sao dữ liệu phi cấu trúc đặt ra thách thức cho việc áp dụng AI?

Thoại Viết Hoàng

Writer

Thoại Viết Hoàng

Hồ sơ người dùng trên LinkedIn đã bị sử dụng trái phép để đào tạo AI

EA muốn dùng AI tạo sinh để sản xuất trò chơi điện tử, giảm bớt vai trò của con người

Ông lớn Hollywood cho phép công ty AI khai thác dữ liệu, muốn dùng AI tạo sinh sản xuất phim

Người dùng Apple tại Việt Nam chú ý: Apple Intelligence vừa có 1 thông báo quan trọng

Học dốt thì làm nghề gì? Những công việc phù hợp với người có học lực kém

Kế hoạch tấn công thị trường xe điện của Sony dần lộ diện

Ốp lưng iPhone 15 có vừa với iPhone 16 không?

Chiếc xe bằng giá Vinfast VF3 vừa trở thành xe bán chạy nhất Trung Quốc

Bước ngoặt cho TikToker nhiều follow nhất thế giới

Nhật Bản đang biến "hòn đảo xe hơi" thành "hòn đảo di động" để thúc đẩy công nghệ pin và chip

DJI Osmo Action 5 Pro trình làng: camera hành động đối đầu GoPro Hero 13, giá từ hơn 9 triệu đồng

Triển Lãm Ô Tô Vietnam Motor Show 2024 hướng tới mục tiêu phù hợp với thực tế thị trường

Cận cảnh Synology NAS DS923+: giải pháp NAS giúp quản lý dữ liệu thuận tiện cho cá nhân, doanh nghiệp vừa và nhỏ

Yamaha LEXi 155 giảm giá "sập sàn", đại lý hạ giá mong kiếm khách

Đánh giá nổi bật