Thoại Viết Hoàng
Writer
Trong sáu tháng qua, AI, cụ thể là AI tổng quát, đã trở thành xu hướng chính khi OpenAI ra mắt ChatGPT và DALL-E cho công chúng.
Với sự nâng cấp này của AI từ đồ chơi khoa học viễn tưởng sang công cụ thực tế đã xuất hiện một hỗn hợp các mối quan tâm được công bố rộng rãi (chúng ta có cần tạm dừng các thử nghiệm AI không?) Và sự phấn khích (tuần làm việc bốn ngày!). Đằng sau những cánh cửa đóng kín, các công ty phần mềm đang tranh giành để đưa AI vào sản phẩm của họ và các nhà lãnh đạo kỹ thuật đã cảm thấy áp lực về những kỳ vọng cao hơn từ phòng họp và khách hàng.
Là một nhà lãnh đạo kỹ thuật, bạn sẽ cần chuẩn bị cho những yêu cầu ngày càng tăng đối với nhóm của mình và tận dụng tối đa những tiến bộ công nghệ mới để vượt qua đối thủ cạnh tranh. Thực hiện theo các chiến lược được nêu dưới đây sẽ giúp bạn và nhóm của bạn đạt được thành công.
Kênh ý tưởng thành các dự án thực tế
Trí tuệ nhân tạo AI đang tiến gần đến Đỉnh điểm của những kỳ vọng bị thổi phồng trong Chu kỳ cường điệu của Gartner. Ý tưởng bắt đầu tuôn trào. Đồng nghiệp của bạn và hội đồng quản trị sẽ đến với bạn với các dự án mới mà họ coi là cơ hội để thúc đẩy làn sóng AI.
Bất cứ khi nào mọi người nghĩ lớn về những gì có thể và cách công nghệ có thể hỗ trợ họ, thì đó là một điều tuyệt vời cho ngành kỹ thuật! Nhưng đây là phần khó khăn. Nhiều ý tưởng xuất hiện trên bàn làm việc của bạn sẽ đi kèm với cách làm, có thể không liên quan đến thực tế.
Có thể có một giả định rằng bạn chỉ cần cắm một mô hình từ OpenAI vào ứng dụng của mình và tự động hóa chất lượng cao. Tuy nhiên, nếu bạn bóc tách cách thức và rút ra ý tưởng, bạn có thể khám phá các dự án thực tế với sự hỗ trợ mạnh mẽ của các bên liên quan. Những người hoài nghi trước đây nghi ngờ khả năng tự động hóa có thể đạt được đối với một số tác vụ giờ đây có thể sẵn sàng xem xét các khả năng mới, bất kể công cụ cơ bản mà bạn chọn sử dụng là gì.
Cơ hội và thách thức của AI tổng hợp
AI mới lạ nắm bắt các tiêu đề thực sự tốt trong việc nhanh chóng tạo văn bản, mã và hình ảnh. Đối với một số ứng dụng, khả năng tiết kiệm thời gian cho con người là rất lớn. Tuy nhiên, nó cũng có một số điểm yếu nghiêm trọng so với các công nghệ hiện có. Lấy ChatGPT làm ví dụ:
ChatGPT không có khái niệm về “mức độ tin cậy”. Nó không cung cấp cách để phân biệt giữa thời điểm có nhiều bằng chứng ủng hộ các tuyên bố của nó so với thời điểm nó đưa ra dự đoán tốt nhất từ các liên kết từ. Nếu dự đoán tốt nhất đó thực sự sai, thì nó vẫn có vẻ thực tế một cách đáng ngạc nhiên, khiến cho những sai lầm của ChatGPT thậm chí còn nguy hiểm hơn.
ChatGPT không có quyền truy cập vào thông tin "trực tiếp". Nó thậm chí không thể cho bạn biết bất cứ điều gì về vài tháng qua.
ChatGPT không biết gì về thuật ngữ và khái niệm dành riêng cho miền không có sẵn công khai để nó có thể thu thập từ web. Nó có thể liên kết các tên dự án nội bộ của công ty bạn và các từ viết tắt với các khái niệm không liên quan từ các góc khuất của Internet.
Nhưng công nghệ có câu trả lời:
Các mô hình học máy Bayesian (ML) (và nhiều công cụ thống kê cổ điển) bao gồm các giới hạn tin cậy để lập luận về khả năng xảy ra lỗi.
Kiến trúc phát trực tuyến hiện đại cho phép dữ liệu được xử lý với độ trễ rất thấp, cho dù là để cập nhật hệ thống truy xuất thông tin hay mô hình máy học.
Các mô hình GPT (và các mô hình được đào tạo trước khác từ các nguồn như HuggingFace) có thể được “tinh chỉnh” bằng các ví dụ dành riêng cho miền. Điều này có thể cải thiện đáng kể kết quả, nhưng cũng cần có thời gian và công sức để sắp xếp một tập dữ liệu có ý nghĩa để điều chỉnh.
Là một nhà lãnh đạo kỹ thuật, bạn biết doanh nghiệp của mình và cách trích xuất các yêu cầu từ các bên liên quan. Điều bạn cần tiếp theo, nếu bạn chưa có, là sự tự tin trong việc đánh giá công cụ nào phù hợp với những yêu cầu đó. Các công cụ ML, bao gồm một loạt các kỹ thuật từ các mô hình hồi quy đơn giản đến các mô hình ngôn ngữ lớn (LLM) đằng sau tin đồn “AI” mới nhất, giờ đây cần phải là các tùy chọn trong hộp công cụ mà bạn cảm thấy tự tin khi đánh giá.
Đánh giá các dự án học máy tiềm năng
Không phải mọi tổ chức kỹ thuật đều cần một nhóm chuyên về ML hoặc khoa học dữ liệu. Nhưng chẳng bao lâu nữa, mọi tổ chức kỹ thuật sẽ cần một người có thể vượt qua những ồn ào và nói rõ những gì ML có thể và không thể làm cho doanh nghiệp của họ. Phán quyết đó đến từ kinh nghiệm làm việc trong các dự án dữ liệu thành công và thất bại. Nếu bạn không thể nêu tên người này trong nhóm của mình, tôi khuyên bạn nên tìm họ!
Trong thời gian tạm thời, khi bạn nói chuyện với các bên liên quan và đặt kỳ vọng cho các dự án mơ ước của họ, hãy xem qua danh sách kiểm tra này:
Có cách tiếp cận đơn giản hơn, chẳng hạn như thuật toán dựa trên quy tắc, đã được thử cho vấn đề này chưa? Cụ thể thì cách tiếp cận đơn giản hơn đó không đạt được điều gì mà ML có thể làm?
Thật hấp dẫn khi nghĩ rằng một thuật toán “thông minh” sẽ giải quyết vấn đề tốt hơn và tốn ít công sức hơn so với hàng chục câu lệnh “nếu” được soạn thảo thủ công từ việc phỏng vấn một chuyên gia tên miền. Đó gần như chắc chắn không phải là trường hợp khi xem xét chi phí duy trì một mô hình đã học trong sản xuất. Khi một cách tiếp cận dựa trên quy tắc trở nên khó sử dụng hoặc quá tốn kém, thì đã đến lúc phải nghiêm túc xem xét ML.
Con người có thể cung cấp một số ví dụ cụ thể về những gì một thuật toán ML thành công sẽ tạo ra không?
Nếu một bên liên quan hy vọng tìm thấy một số “thông tin chi tiết” hoặc “điểm bất thường” mơ hồ trong tập dữ liệu nhưng không thể đưa ra các ví dụ cụ thể, thì đó là một dấu hiệu đáng báo động. Bất kỳ nhà khoa học dữ liệu nào cũng có thể phát hiện ra các ngoại lệ thống kê nhưng không mong đợi chúng hữu ích.
Dữ liệu chất lượng cao có sẵn không?
Rác vào, rác ra, như họ nói. Các dự án kiến trúc dữ liệu và vệ sinh dữ liệu có thể là điều kiện tiên quyết đối với một dự án ML.
Có vấn đề tương tự với giải pháp ML được ghi lại không?
Nếu không, điều đó không có nghĩa là ML không thể giúp được gì, nhưng bạn nên chuẩn bị cho một chu kỳ nghiên cứu dài hơn, cần chuyên môn sâu hơn về ML trong nhóm và khả năng dẫn đến thất bại cuối cùng.
'Đủ tốt' đã được xác định chính xác chưa?
Đối với hầu hết các trường hợp sử dụng, một mô hình ML không bao giờ có thể chính xác 100%. Ngược lại, nếu không có hướng dẫn rõ ràng, nhóm kỹ thuật có thể dễ dàng lãng phí thời gian để tiến gần hơn tới mức 100% khó nắm bắt, với mỗi điểm phần trăm cải tiến sẽ tốn nhiều thời gian hơn điểm phần trăm trước đó.
Tóm lại
Bắt đầu đánh giá bất kỳ đề xuất nào để đưa một mô hình ML mới vào sản xuất với một mức độ hoài nghi hợp lý, giống như bạn đánh giá một đề xuất thêm kho lưu trữ dữ liệu mới vào ngăn xếp sản xuất của mình. Gác cổng hiệu quả sẽ đảm bảo ML trở thành một công cụ hữu ích trong tiết mục của nhóm bạn, chứ không phải là thứ mà các bên liên quan coi là một trò lừa bịp.
Máng vỡ mộng đáng sợ của Chu kỳ cường điệu là không thể tránh khỏi. Tuy nhiên, độ sâu của nó được kiểm soát bởi những kỳ vọng bạn đặt ra và giá trị bạn mang lại. Đưa các ý tưởng mới từ khắp nơi trong công ty của bạn vào các dự án thực tế — có hoặc không có AI — và nâng cao kỹ năng cho nhóm của bạn để bạn có thể nhanh chóng nhận ra và tận dụng các cơ hội mới mà ML đang tạo ra.
Lần đầu tiên, bất kỳ ai có kết nối internet đều có thể tương tác với AI cảm thấy thông minh và hữu ích — chứ không chỉ là một nguyên mẫu thú vị.
Với sự nâng cấp này của AI từ đồ chơi khoa học viễn tưởng sang công cụ thực tế đã xuất hiện một hỗn hợp các mối quan tâm được công bố rộng rãi (chúng ta có cần tạm dừng các thử nghiệm AI không?) Và sự phấn khích (tuần làm việc bốn ngày!). Đằng sau những cánh cửa đóng kín, các công ty phần mềm đang tranh giành để đưa AI vào sản phẩm của họ và các nhà lãnh đạo kỹ thuật đã cảm thấy áp lực về những kỳ vọng cao hơn từ phòng họp và khách hàng.
Là một nhà lãnh đạo kỹ thuật, bạn sẽ cần chuẩn bị cho những yêu cầu ngày càng tăng đối với nhóm của mình và tận dụng tối đa những tiến bộ công nghệ mới để vượt qua đối thủ cạnh tranh. Thực hiện theo các chiến lược được nêu dưới đây sẽ giúp bạn và nhóm của bạn đạt được thành công.
Kênh ý tưởng thành các dự án thực tế
Trí tuệ nhân tạo AI đang tiến gần đến Đỉnh điểm của những kỳ vọng bị thổi phồng trong Chu kỳ cường điệu của Gartner. Ý tưởng bắt đầu tuôn trào. Đồng nghiệp của bạn và hội đồng quản trị sẽ đến với bạn với các dự án mới mà họ coi là cơ hội để thúc đẩy làn sóng AI.
Bất cứ khi nào mọi người nghĩ lớn về những gì có thể và cách công nghệ có thể hỗ trợ họ, thì đó là một điều tuyệt vời cho ngành kỹ thuật! Nhưng đây là phần khó khăn. Nhiều ý tưởng xuất hiện trên bàn làm việc của bạn sẽ đi kèm với cách làm, có thể không liên quan đến thực tế.
Có thể có một giả định rằng bạn chỉ cần cắm một mô hình từ OpenAI vào ứng dụng của mình và tự động hóa chất lượng cao. Tuy nhiên, nếu bạn bóc tách cách thức và rút ra ý tưởng, bạn có thể khám phá các dự án thực tế với sự hỗ trợ mạnh mẽ của các bên liên quan. Những người hoài nghi trước đây nghi ngờ khả năng tự động hóa có thể đạt được đối với một số tác vụ giờ đây có thể sẵn sàng xem xét các khả năng mới, bất kể công cụ cơ bản mà bạn chọn sử dụng là gì.
Cơ hội và thách thức của AI tổng hợp
AI mới lạ nắm bắt các tiêu đề thực sự tốt trong việc nhanh chóng tạo văn bản, mã và hình ảnh. Đối với một số ứng dụng, khả năng tiết kiệm thời gian cho con người là rất lớn. Tuy nhiên, nó cũng có một số điểm yếu nghiêm trọng so với các công nghệ hiện có. Lấy ChatGPT làm ví dụ:
ChatGPT không có khái niệm về “mức độ tin cậy”. Nó không cung cấp cách để phân biệt giữa thời điểm có nhiều bằng chứng ủng hộ các tuyên bố của nó so với thời điểm nó đưa ra dự đoán tốt nhất từ các liên kết từ. Nếu dự đoán tốt nhất đó thực sự sai, thì nó vẫn có vẻ thực tế một cách đáng ngạc nhiên, khiến cho những sai lầm của ChatGPT thậm chí còn nguy hiểm hơn.
ChatGPT không có quyền truy cập vào thông tin "trực tiếp". Nó thậm chí không thể cho bạn biết bất cứ điều gì về vài tháng qua.
ChatGPT không biết gì về thuật ngữ và khái niệm dành riêng cho miền không có sẵn công khai để nó có thể thu thập từ web. Nó có thể liên kết các tên dự án nội bộ của công ty bạn và các từ viết tắt với các khái niệm không liên quan từ các góc khuất của Internet.
Nhưng công nghệ có câu trả lời:
Các mô hình học máy Bayesian (ML) (và nhiều công cụ thống kê cổ điển) bao gồm các giới hạn tin cậy để lập luận về khả năng xảy ra lỗi.
Kiến trúc phát trực tuyến hiện đại cho phép dữ liệu được xử lý với độ trễ rất thấp, cho dù là để cập nhật hệ thống truy xuất thông tin hay mô hình máy học.
Các mô hình GPT (và các mô hình được đào tạo trước khác từ các nguồn như HuggingFace) có thể được “tinh chỉnh” bằng các ví dụ dành riêng cho miền. Điều này có thể cải thiện đáng kể kết quả, nhưng cũng cần có thời gian và công sức để sắp xếp một tập dữ liệu có ý nghĩa để điều chỉnh.
Là một nhà lãnh đạo kỹ thuật, bạn biết doanh nghiệp của mình và cách trích xuất các yêu cầu từ các bên liên quan. Điều bạn cần tiếp theo, nếu bạn chưa có, là sự tự tin trong việc đánh giá công cụ nào phù hợp với những yêu cầu đó. Các công cụ ML, bao gồm một loạt các kỹ thuật từ các mô hình hồi quy đơn giản đến các mô hình ngôn ngữ lớn (LLM) đằng sau tin đồn “AI” mới nhất, giờ đây cần phải là các tùy chọn trong hộp công cụ mà bạn cảm thấy tự tin khi đánh giá.
Đánh giá các dự án học máy tiềm năng
Không phải mọi tổ chức kỹ thuật đều cần một nhóm chuyên về ML hoặc khoa học dữ liệu. Nhưng chẳng bao lâu nữa, mọi tổ chức kỹ thuật sẽ cần một người có thể vượt qua những ồn ào và nói rõ những gì ML có thể và không thể làm cho doanh nghiệp của họ. Phán quyết đó đến từ kinh nghiệm làm việc trong các dự án dữ liệu thành công và thất bại. Nếu bạn không thể nêu tên người này trong nhóm của mình, tôi khuyên bạn nên tìm họ!
Trong thời gian tạm thời, khi bạn nói chuyện với các bên liên quan và đặt kỳ vọng cho các dự án mơ ước của họ, hãy xem qua danh sách kiểm tra này:
Có cách tiếp cận đơn giản hơn, chẳng hạn như thuật toán dựa trên quy tắc, đã được thử cho vấn đề này chưa? Cụ thể thì cách tiếp cận đơn giản hơn đó không đạt được điều gì mà ML có thể làm?
Thật hấp dẫn khi nghĩ rằng một thuật toán “thông minh” sẽ giải quyết vấn đề tốt hơn và tốn ít công sức hơn so với hàng chục câu lệnh “nếu” được soạn thảo thủ công từ việc phỏng vấn một chuyên gia tên miền. Đó gần như chắc chắn không phải là trường hợp khi xem xét chi phí duy trì một mô hình đã học trong sản xuất. Khi một cách tiếp cận dựa trên quy tắc trở nên khó sử dụng hoặc quá tốn kém, thì đã đến lúc phải nghiêm túc xem xét ML.
Con người có thể cung cấp một số ví dụ cụ thể về những gì một thuật toán ML thành công sẽ tạo ra không?
Nếu một bên liên quan hy vọng tìm thấy một số “thông tin chi tiết” hoặc “điểm bất thường” mơ hồ trong tập dữ liệu nhưng không thể đưa ra các ví dụ cụ thể, thì đó là một dấu hiệu đáng báo động. Bất kỳ nhà khoa học dữ liệu nào cũng có thể phát hiện ra các ngoại lệ thống kê nhưng không mong đợi chúng hữu ích.
Dữ liệu chất lượng cao có sẵn không?
Rác vào, rác ra, như họ nói. Các dự án kiến trúc dữ liệu và vệ sinh dữ liệu có thể là điều kiện tiên quyết đối với một dự án ML.
Có vấn đề tương tự với giải pháp ML được ghi lại không?
Nếu không, điều đó không có nghĩa là ML không thể giúp được gì, nhưng bạn nên chuẩn bị cho một chu kỳ nghiên cứu dài hơn, cần chuyên môn sâu hơn về ML trong nhóm và khả năng dẫn đến thất bại cuối cùng.
'Đủ tốt' đã được xác định chính xác chưa?
Đối với hầu hết các trường hợp sử dụng, một mô hình ML không bao giờ có thể chính xác 100%. Ngược lại, nếu không có hướng dẫn rõ ràng, nhóm kỹ thuật có thể dễ dàng lãng phí thời gian để tiến gần hơn tới mức 100% khó nắm bắt, với mỗi điểm phần trăm cải tiến sẽ tốn nhiều thời gian hơn điểm phần trăm trước đó.
Tóm lại
Bắt đầu đánh giá bất kỳ đề xuất nào để đưa một mô hình ML mới vào sản xuất với một mức độ hoài nghi hợp lý, giống như bạn đánh giá một đề xuất thêm kho lưu trữ dữ liệu mới vào ngăn xếp sản xuất của mình. Gác cổng hiệu quả sẽ đảm bảo ML trở thành một công cụ hữu ích trong tiết mục của nhóm bạn, chứ không phải là thứ mà các bên liên quan coi là một trò lừa bịp.
Máng vỡ mộng đáng sợ của Chu kỳ cường điệu là không thể tránh khỏi. Tuy nhiên, độ sâu của nó được kiểm soát bởi những kỳ vọng bạn đặt ra và giá trị bạn mang lại. Đưa các ý tưởng mới từ khắp nơi trong công ty của bạn vào các dự án thực tế — có hoặc không có AI — và nâng cao kỹ năng cho nhóm của bạn để bạn có thể nhanh chóng nhận ra và tận dụng các cơ hội mới mà ML đang tạo ra.