Sai lầm lớn nhất trong xây dựng hệ thống AI mà doanh nghiệp thường mắc phải

Minh Nguyệt
Minh Nguyệt
Phản hồi: 0

Minh Nguyệt

Intern Writer
Ngành công nghiệp 4.0 đang thay đổi bộ mặt của ngành sản xuất, và một trong những yếu tố quan trọng làm nên thành công của nó chính là trí tuệ nhân tạo (AI). Tuy nhiên, dù AI mang lại lợi ích về năng suất và chất lượng, vẫn có hơn 60% các nhà sản xuất tại Vương quốc Anh chưa áp dụng AI vào hoạt động của họ. Tại sao lại như vậy? Rõ ràng, việc triển khai AI không đơn giản chỉ là một sản phẩm có thể cắm vào và sử dụng ngay; AI cần được cung cấp dữ liệu chất lượng, mà điều này lại đang thiếu trong ngành sản xuất hiện nay. Hệ thống AI chỉ hiệu quả khi được nuôi dưỡng bằng dữ liệu tốt.

Trong bối cảnh này, Nicholas đã chỉ ra lộ trình dữ liệu cần phải đi qua trước khi có thể được nạp vào các hệ thống AI để đưa ra những thông tin có giá trị – bắt đầu từ việc làm sạch và lưu trữ dữ liệu cho đến con đường lai hướng tới các nhà máy thông minh. Thành công của AI phụ thuộc vào dữ liệu sẵn sàng cho AI. Hãng nghiên cứu Gartner thậm chí dự đoán rằng đến cuối năm 2026, 60% các dự án AI sẽ bị từ bỏ nếu không được hỗ trợ bởi dữ liệu sẵn sàng cho AI.

Trong ngành sản xuất, dữ liệu không phải là vấn đề thiếu. Dữ liệu đến từ cảm biến máy móc, thiết bị IoT, và hệ thống kiểm soát, nhưng dữ liệu thô này không thể ngay lập tức trở thành dữ liệu sẵn sàng cho AI. Trước tiên, nó phải được làm sạch, xác định ngữ cảnh, cấu trúc lại và xử lý. Dữ liệu không có ngữ cảnh có thể khiến AI dễ dàng bỏ lỡ các tín hiệu quan trọng hoặc phản ứng sai lệch. Để đảm bảo điều này, các nhà sản xuất cần có một nền tảng dữ liệu với sự quản lý an toàn và kiểm soát chất lượng. Đây sẽ là cơ sở để AI nhận được dữ liệu chính xác và đáng tin cậy.

Trước tiên, cần quan tâm đến việc vệ sinh dữ liệu – một quá trình đơn giản hóa dữ liệu sẽ giúp hành trình AI diễn ra suôn sẻ hơn. Nguồn dữ liệu phong phú trong ngành sản xuất có thể gây khó khăn cho AI trong việc diễn giải và hiểu dữ liệu. Việc đảm bảo dữ liệu chính xác, đồng nhất và đầy đủ là rất quan trọng. Các thông tin ngữ cảnh như mã máy, thời gian, hộ chiếu sản phẩm số và số lô có thể giúp các nhà sản xuất khắc phục lỗi, xử lý giá trị thiếu, xác thực đầu ra cảm biến, loại bỏ các bản sao và đánh dấu các bất thường trước khi dữ liệu được đưa vào các nền tảng AI.
1759062836716.png

Quản lý và bảo mật cũng là điều cần thiết – việc xác định quyền sở hữu dữ liệu rõ ràng là chìa khóa trong ngành công nghiệp đang bị tấn công mạng nhiều nhất. Trong ba năm liên tiếp, ngành sản xuất là ngành bị tấn công mạng nhiều nhất và với việc dữ liệu đến từ nhiều nguồn khác nhau, sự đe dọa từ tấn công mạng là rất lớn. Do đó, các nhà sản xuất cần đảm bảo quản lý dữ liệu nhạy cảm một cách an toàn bằng cách sử dụng kiểm soát truy cập dựa trên vai trò và mã hóa. Bước đầu tiên là xác định quyền sở hữu dữ liệu với các quyền truy cập và quy tắc tuân thủ rõ ràng, sau đó phát triển một danh mục dữ liệu để các bên liên quan biết dữ liệu ở đâu, khi nào có thể truy cập và cách thức truy cập.

Thêm vào đó, việc gỡ bỏ các silo dữ liệu – điều này có nghĩa là phải hợp nhất và xác định ngữ cảnh dữ liệu. Một trong những rào cản lớn nhất để sử dụng hiệu quả dữ liệu trong sản xuất là sự phân tách giữa Công nghệ Vận hành (OT) và Công nghệ Thông tin (IT). Để khắc phục điều này, dữ liệu cần được đưa vào một nền tảng trung tâm. Nhưng chỉ có hợp nhất thôi thì chưa đủ – cần có các định nghĩa tiêu chuẩn để đồng nhất dữ liệu từ tầng trên xuống tầng nhà máy. Sử dụng không gian tên thống nhất hoặc cơ sở kiến thức giúp kết nối thiết bị, quy trình và luồng cảm biến, giảm thiểu sự nhầm lẫn và tạo ra nhất quán cho toàn bộ doanh nghiệp.

Khi đã có nền tảng này, các nhà sản xuất có thể chuyển đổi dữ liệu công nghiệp thô thành một hình ảnh số hóa có cấu trúc. Bước tiếp theo là nạp dữ liệu đó vào phân tích nâng cao và học máy. Sau khi dữ liệu sản xuất thô đã được làm sạch và xác định ngữ cảnh, thách thức tiếp theo là nơi lưu trữ và xử lý dữ liệu. Nhiều nhà sản xuất vẫn đang sử dụng cơ sở dữ liệu cũ kỹ và quy trình theo lô vào ban đêm, không thể hoạt động với tốc độ của ngành công nghiệp 4.0.

Hơn nữa, các nhà sản xuất cần hợp nhất doanh nghiệp với một dữ liệu lakehouse. Để có thể đưa ra insights dữ liệu theo thời gian thực, dữ liệu không còn được lưu trữ trong hồ dữ liệu, mà cần đến một kiến trúc dữ liệu hiện đại. Hồ dữ liệu truyền thống có thể lưu trữ khối lượng lớn dữ liệu thô, nhưng nếu không có quản lý hay cấu trúc, chúng sẽ nhanh chóng trở thành “bãi lầy dữ liệu”. Một hồ dữ liệu nhà ở kết hợp quy mô và tính linh hoạt của hồ dữ liệu với quản lý cấu trúc của kho dữ liệu sẽ cho phép tất cả các lĩnh vực trong doanh nghiệp hoạt động từ một nền tảng thống nhất.

Ngành sản xuất hiện đại đang cần đến những công nghệ mới, với sự cần thiết phải thu hút dữ liệu theo mô hình hybrid edge-to-cloud. Mô hình hybrid này mang lại cho các nhà sản xuất độ trễ thấp và khả năng tận dụng dữ liệu lớn trong hệ thống đám mây, giúp cho các quy trình bảo trì dự đoán trở thành hiện thực. Báo cáo gần đây của McKinsey cho thấy rằng việc bảo trì dự đoán có thể giảm chi phí bảo trì từ 10% đến 40%, giảm thời gian chết 50% và tăng tuổi thọ tài sản từ 20% đến 40%.

Tóm lại, ngành sản xuất gần như đã sẵn sàng để khai thác tiềm năng thực sự của AI. Các nhà sản xuất đã có dữ liệu cần thiết để thực hiện những thay đổi chiến lược và hưởng lợi từ sức mạnh của ngành công nghiệp 4.0 và AI. Quy trình biến đổi dữ liệu công nghiệp thô thành dữ liệu sẵn sàng cho AI không phải là đơn giản, nhưng những lợi ích về hiệu suất, chất lượng và lợi nhuận chắc chắn sẽ khiến quá trình này trở nên xứng đáng!

Nguồn tham khảo: Techradar
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
http://textlink.linktop.vn/?adslk=aHR0cHM6Ly92bnJldmlldy52bi90aHJlYWRzL3NhaS1sYW0tbG9uLW5oYXQtdHJvbmcteGF5LWR1bmctaGUtdGhvbmctYWktbWEtZG9hbmgtbmdoaWVwLXRodW9uZy1tYWMtcGhhaS43MDEyOS8=
Top