ChatGPT và các mô hình ngôn ngữ lớn LLM khác còn thiếu điều gì?

Thoại Viết Hoàng
Thoại Viết Hoàng
Phản hồi: 0
Những phát triển gần đây về trí tuệ nhân tạo làm tôi nhớ đến ngành công nghiệp ô tô vào cuối thế kỷ 19 và đầu thế kỷ 20.
ChatGPT và các mô hình ngôn ngữ lớn LLM khác còn thiếu điều gì?
Trong trường hợp đó, ngành công nghiệp phải mất vài thập kỷ để cam kết sử dụng động cơ đốt trong. Và trong khi bức tranh đó vẫn chưa rõ ràng, đã có hơn 250 nhà sản xuất ô tô khác nhau, một số đang sản xuất ô tô chạy bằng hơi nước. Ô tô điện cũng sớm được phát triển nhưng không khả thi vào thời điểm đó. Và mọi chiếc xe được chế tạo đều được lắp ráp thủ công, ít nhiều.
Vào cuối những năm 1920, hình dạng của một thị trường trưởng thành hơn đã trở nên rõ ràng. Dây chuyền lắp ráp của Ford, lấy cảm hứng từ phương pháp tiếp cận có hệ thống mà Swift đã áp dụng đối với việc giết mổ và đóng gói thịt, vượt trội hơn hẳn so với kiểu sản xuất theo kiểu phường hội cũ đến nỗi các dây chuyền lắp ráp đã nhanh chóng tiếp quản.
Những nhà sản xuất ô tô không thể thích ứng với các quy trình dây chuyền lắp ráp đơn giản là đi xuống. Số lượng nhà sản xuất ô tô giảm xuống còn 44 vào năm 1929. Cuộc Đại khủng hoảng sau đó buộc nhiều nhà sản xuất phải hợp nhất hoặc phá sản.
Rất nhiều ô tô giá cả phải chăng đã xuất hiện và người mua đã chộp lấy chúng, ngay cả trong thời kỳ Suy thoái. Tiện ích của họ là quá rõ ràng để bỏ qua.
Điều thậm chí còn mất nhiều thời gian hơn để phát triển là thị trường cơ sở hạ tầng lớn hơn: tăng quy mô sản xuất và phân phối xăng dầu cho ô tô, mở đường, xây dựng những cây cầu có khả năng hỗ trợ ô tô, trạm xăng và sửa chữa, và “khách sạn xe máy” hoặc nhà nghỉ cho những người đột nhiên muốn thực hiện các chuyến đi lái xe ngày càng dài hơn.
Chưa kể đến việc tạo ra mạng lưới đại lý, lốp xe chống thủng và mạng lưới đường bộ quốc gia và quốc tế. Mãi cho đến những năm 1950, Hệ thống Xa lộ Liên tiểu bang Hoa Kỳ mới ra đời và được tài trợ.
So sánh dòng thời gian với AI hẹp ngày nay
Theo dòng thời gian này, theo tôi, AI vẫn còn trong ngành công nghiệp ô tô tương đương với những năm 1880. ChatGPT trên dòng thời gian của ngành công nghiệp ô tô giống như chiếc ô tô đầu tiên sử dụng động cơ đốt trong của Karl Benz – Benz Patent Motorwagen.
Theo một số cách, Motorwagen đã chỉ ra con đường phía trước, nhưng sẽ không có tầm nhìn về hệ thống giao thông chuyển đổi lớn hơn trong một thời gian. Và có một vấn đề nghiêm trọng sẽ quay trở lại ám ảnh chúng tôi sau này: một cam kết cứng nhắc, lâu dài đối với động cơ đốt trong, khi nhìn lại, đó là một quyết định định mệnh có tác động rất lớn đến mức phát thải carbon.
Nhìn lại, lẽ ra chúng ta nên cho mình sự linh hoạt để xoay trục sang động cơ điện, vận chuyển hàng loạt bằng điện và sau đó là năng lượng tái tạo ngay khi có thể. Động cơ điện đã hoạt động và chúng tôi có thể tập trung nhiều nguồn lực hơn vào công nghệ pin di động và cố định (dành cho vận chuyển khối lượng lớn) để tăng dung lượng lưu trữ. Và chúng ta có thể tinh chỉnh và phi tập trung hóa cả pin và sản xuất điện hạt nhân.
Nhưng chúng tôi không tập trung vào hiệu quả năng lượng hoặc các mối quan tâm về môi trường vào thời điểm đó.
Nhìn lại, việc chúng ta không làm tốt hơn cho môi trường nhiều thập kỷ trước đã chứng tỏ rằng chúng ta đã bỏ qua nhu cầu đưa ra quyết định bao gồm các tác động ở cấp độ hệ sinh thái.
Chúng tôi đã tạo ra một cuộc khủng hoảng do chính chúng tôi tạo ra. Đó là loại khủng hoảng mà chúng tôi chắc chắn muốn tránh khi nói đến AI nói chung thay vì chỉ thu hẹp AI.
AI Motorwagen ngày nay trong Khung trung tâm dữ liệu bị thiếu
Tóm lại, AI đang được chú ý nhiều nhất hiện nay tương đương với chiếc xe ba bánh Benz Motorwagen: máy học thống kê dưới dạng mạng thần kinh và giao diện nhanh. Những thứ này bổ sung cho một dạng xử lý ngôn ngữ tự nhiên (NLP) hoặc xử lý và tạo hình ảnh cũng như giao diện chatbot cùng nhau có thể giúp tự động hóa một số quy trình nhận dạng và chuyển đổi với sự trợ giúp của con người trong vòng lặp.
Điều không được chú ý là quy tắc tất định và khả năng lập luận có thể bổ sung cho những gì NLP làm về mặt xác suất ngày nay. Đây là những khả năng đã được phát triển từ lâu cần được tái sử dụng trong một kiến trúc mới, tập trung vào dữ liệu để chúng có thể được khai thác cùng với NLP và các giao diện nhắc nhở.
Có một sự cộng sinh ngụ ý bởi một kiến trúc tập trung vào dữ liệu như vậy:
ChatGPT và các mô hình ngôn ngữ lớn LLM khác còn thiếu điều gì?
Trở lại năm 2017, John Launchbury của Cơ quan Dự án Nghiên cứu Quốc phòng Tiên tiến (DARPA) đã lùi lại và mô tả một quan điểm khác về sự cộng sinh của AI dưới dạng ba làn sóng AI. Ông chỉ ra rằng làn sóng thứ ba pha trộn giữa làn sóng thứ nhất mang tính quyết định – hay tượng trưng – (nói cách khác là làn sóng khoa học quyết định của những năm 1980) với làn sóng thứ hai của các mạng lưới thần kinh xác suất.
ChatGPT và các mô hình ngôn ngữ lớn LLM khác còn thiếu điều gì?
Tại sao chúng ta vẫn chưa ở Làn sóng III – Chủ nghĩa bộ lạc
Thật không may, chủ nghĩa bộ lạc thường cản trở sự phát triển công nghệ. Chủ nghĩa bộ lạc là một vấn đề lớn và đã tồn tại trong nhiều thập kỷ. Pedro Domingos, hiện là Khoa học máy tính danh dự tại Đại học Washington, đã xuất bản một cuốn sách vào năm 2015 có tên là Master Algorithm mô tả các nỗ lực học máy theo năm nhóm không hoạt động cùng nhau. Ông khẳng định rằng trí thông minh nhân tạo nói chung là cần thiết để khai thác sức mạnh hợp tác của năm bộ tộc đó.
ChatGPT và các mô hình ngôn ngữ lớn LLM khác còn thiếu điều gì?
Cuốn sách của Domingos đã thu hút được một số sự chú ý khi nó được xuất bản, nhưng hầu hết những người liên quan đến kỹ thuật AI ngày nay đều không biết về cái nhìn sâu sắc của nó về các nhóm máy học hoặc không thực sự nghĩ về bức tranh AI rộng lớn hơn.
Một AI hoàn chỉnh hơn với một nền tảng dữ liệu theo ngữ cảnh
Tin đồn về chatbot mà chúng ta đang nghe ngày nay không phải là yếu tố tổng thể của tất cả các yếu tố cần thiết để làm cho AI trở nên đáng tin cậy, đáng tin cậy hoặc có trách nhiệm trong thế giới thực theo bất kỳ nghĩa nào lớn hơn. Chúng tôi đã nghe rất nhiều lời phàn nàn về việc thiếu các khả năng này và kết quả là chúng tôi đang chứng kiến hành động pháp lý được tăng cường.
Trên hết, tin đồn dường như không phản ánh nhiều lợi ích chiến lược đối với chính dữ liệu, thứ mà xét cho cùng sẽ cung cấp nền tảng cho thế giới AI mô phỏng. Cách dữ liệu đó được tạo và quản lý sẽ quyết định hiệu quả của quản trị AI.
Quản lý dữ liệu một cách tổng thể là rất quan trọng đối với AI nói lên sự thật, có thể kiểm chứng. Đó là dữ liệu có thể được phát triển và lưu trữ theo cách nhân văn nhằm coi trọng chủ quyền dữ liệu. Dữ liệu được ngữ cảnh hóa thu được (cho phép tính toán theo ngữ cảnh của làn sóng thứ ba của AI) có thể hữu cơ, hiệu quả và có thể tái sử dụng.
Trên thực tế, dữ liệu và cách nó được quản lý là chìa khóa của AI trên quy mô lớn. Dữ liệu tốt hơn, giáo sư khoa học máy tính và doanh nhân Andrew Ng của Stanford cho biết nhiều năm trước, đánh bại các thuật toán tốt hơn. Nhưng tôi nghi ngờ rằng ngay cả Andrew Ng cũng không biết cách phát triển hoặc dữ liệu chứng minh trong tương lai cho vai trò mà nó sẽ sớm đảm nhận. Đó là bởi vì bản thân anh ấy đã đắm chìm trong một bộ lạc duy nhất.
Sự hợp tác giữa các bộ tộc sẽ giúp chúng ta tạo ra AI mạnh mẽ và bền vững. Do đó, chúng tôi có một thách thức chính trị trước mắt để giành được tâm trí của các kỹ sư, nhà khoa học và người dùng.
Tham khảo bài viết gốc tại đây:
 


Đăng nhập một lần thảo luận tẹt ga
Top