Trung Đào
Writer
Trong một thập kỷ qua, nhiều hệ thống trí tuệ nhân tạo tiên tiến đã được đào tạo bằng kho dữ liệu khổng lồ có gắn nhãn. Ví dụ, một mạng nơ-ron nhân tạo có thể học cách phân biệt một con mèo vằn với một con hổ nhờ vào các nhãn được gán trước. Tuy nhiên, cách tiếp cận này có những hạn chế đáng kể.
Việc đào tạo có giám sát yêu cầu con người dán nhãn dữ liệu một cách tỉ mỉ. Các mạng nơ-ron có xu hướng học theo lối tắt, liên kết nhãn với những đặc điểm dễ nhận biết nhưng hời hợt. Ví dụ, chúng có thể nhận diện một con bò chỉ dựa vào sự xuất hiện của cỏ trong ảnh. Nhà khoa học máy tính Alexei Efros đã so sánh điều này với việc sinh viên chỉ học nhồi nhét trước kỳ thi thay vì hiểu sâu vấn đề.
Trong khi đó, động vật, bao gồm con người, không học theo cách này. Thay vào đó, chúng khám phá thế giới xung quanh và tự hình thành nhận thức. Các nhà khoa học thần kinh tính toán gần đây đã tập trung vào phương pháp học tự giám sát, nơi AI tự tìm ra quy luật trong dữ liệu mà không cần nhãn từ con người. Kết quả cho thấy mô hình này có sự tương đồng lớn hơn với cách thức hoạt động của não bộ.
Khoảng 10 năm trước, khi các mô hình nơ-ron nhân tạo đầu tiên ra đời, chúng được kỳ vọng có thể mô phỏng não bộ. Một số thí nghiệm đã chứng minh sự tương đồng giữa cách mạng nơ-ron và hệ thống thần kinh của động vật. Tuy nhiên, học có giám sát bộc lộ nhiều nhược điểm. Ví dụ, một AI có thể nhận diện sai hình ảnh một chiếc xe hơi khi nó được phủ họa tiết da báo, do hệ thống chú trọng vào kết cấu hơn là hình dạng tổng thể.
Học tự giám sát giúp khắc phục những vấn đề này bằng cách cho phép AI tự động tìm hiểu cấu trúc dữ liệu. Thay vì dán nhãn từng mục, AI sẽ được cung cấp một lượng lớn dữ liệu và tự phát hiện mối quan hệ giữa chúng. Chẳng hạn, một mô hình ngôn ngữ có thể dự đoán từ tiếp theo trong một câu mà không cần con người gán nhãn. Trong thị giác máy tính, một kỹ thuật học tự giám sát được phát triển vào năm 2021 đã cho phép AI tái tạo chính xác hình dạng của một chiếc xe buýt dù gần 80% hình ảnh bị che khuất.
Một số nhà khoa học thần kinh tin rằng não bộ con người cũng hoạt động theo cách tương tự. Blake Richards, nhà khoa học thần kinh tại Đại học McGill, cho rằng phần lớn những gì não bộ thực hiện là học tập tự giám sát. Não không chỉ đơn thuần ghi nhớ thông tin mà còn liên tục đưa ra dự đoán về những gì sắp xảy ra.
Một nghiên cứu của Richards đã chỉ ra rằng hệ thống thị giác của con người có hai luồng xử lý riêng biệt: một luồng nhận diện vật thể và một luồng xử lý chuyển động. Khi huấn luyện AI với một mô hình tương tự, họ phát hiện ra rằng nó cũng tự động hình thành hai hệ thống phân tích độc lập, giống như não bộ.
Trong lĩnh vực thính giác, một nghiên cứu năm 2023 đã đào tạo AI Wav2Vec 2.0 để học ngôn ngữ mà không cần nhãn. Khi so sánh với dữ liệu quét não người, các nhà nghiên cứu phát hiện ra rằng AI và não bộ có cách xử lý âm thanh tương đồng đáng kể. Các lớp nông của AI phản ứng giống vùng thính giác chính trong não, trong khi các lớp sâu hơn giống với vỏ não trước trán.
Tuy nhiên, một số chuyên gia vẫn hoài nghi về việc AI có thể thực sự mô phỏng hoàn toàn não bộ. Josh McDermott từ MIT đã thử nghiệm bằng cách sử dụng các tín hiệu âm thanh và hình ảnh tổng hợp để đánh giá AI. Kết quả cho thấy, ngay cả khi học tự giám sát, các mô hình vẫn gặp khó khăn trong việc hiểu đúng bản chất thực sự của dữ liệu.
Dù còn nhiều thách thức, học tự giám sát đang mở ra những hướng đi mới trong nghiên cứu AI và khoa học thần kinh. Nó không chỉ giúp cải thiện khả năng nhận diện của máy móc mà còn cung cấp cái nhìn sâu sắc hơn về cách con người học hỏi và tiếp thu thông tin từ thế giới xung quanh.
Nguồn: QuantaMag
![1739626779522.png 1739626779522.png](https://vnrv.s3.hn-1.cloud.cmctelecom.vn/data/attachments/36/36613-5277efabf6eb8e461d74c979ddfcc219.jpg)
Việc đào tạo có giám sát yêu cầu con người dán nhãn dữ liệu một cách tỉ mỉ. Các mạng nơ-ron có xu hướng học theo lối tắt, liên kết nhãn với những đặc điểm dễ nhận biết nhưng hời hợt. Ví dụ, chúng có thể nhận diện một con bò chỉ dựa vào sự xuất hiện của cỏ trong ảnh. Nhà khoa học máy tính Alexei Efros đã so sánh điều này với việc sinh viên chỉ học nhồi nhét trước kỳ thi thay vì hiểu sâu vấn đề.
Trong khi đó, động vật, bao gồm con người, không học theo cách này. Thay vào đó, chúng khám phá thế giới xung quanh và tự hình thành nhận thức. Các nhà khoa học thần kinh tính toán gần đây đã tập trung vào phương pháp học tự giám sát, nơi AI tự tìm ra quy luật trong dữ liệu mà không cần nhãn từ con người. Kết quả cho thấy mô hình này có sự tương đồng lớn hơn với cách thức hoạt động của não bộ.
Khoảng 10 năm trước, khi các mô hình nơ-ron nhân tạo đầu tiên ra đời, chúng được kỳ vọng có thể mô phỏng não bộ. Một số thí nghiệm đã chứng minh sự tương đồng giữa cách mạng nơ-ron và hệ thống thần kinh của động vật. Tuy nhiên, học có giám sát bộc lộ nhiều nhược điểm. Ví dụ, một AI có thể nhận diện sai hình ảnh một chiếc xe hơi khi nó được phủ họa tiết da báo, do hệ thống chú trọng vào kết cấu hơn là hình dạng tổng thể.
Học tự giám sát giúp khắc phục những vấn đề này bằng cách cho phép AI tự động tìm hiểu cấu trúc dữ liệu. Thay vì dán nhãn từng mục, AI sẽ được cung cấp một lượng lớn dữ liệu và tự phát hiện mối quan hệ giữa chúng. Chẳng hạn, một mô hình ngôn ngữ có thể dự đoán từ tiếp theo trong một câu mà không cần con người gán nhãn. Trong thị giác máy tính, một kỹ thuật học tự giám sát được phát triển vào năm 2021 đã cho phép AI tái tạo chính xác hình dạng của một chiếc xe buýt dù gần 80% hình ảnh bị che khuất.
Một số nhà khoa học thần kinh tin rằng não bộ con người cũng hoạt động theo cách tương tự. Blake Richards, nhà khoa học thần kinh tại Đại học McGill, cho rằng phần lớn những gì não bộ thực hiện là học tập tự giám sát. Não không chỉ đơn thuần ghi nhớ thông tin mà còn liên tục đưa ra dự đoán về những gì sắp xảy ra.
Một nghiên cứu của Richards đã chỉ ra rằng hệ thống thị giác của con người có hai luồng xử lý riêng biệt: một luồng nhận diện vật thể và một luồng xử lý chuyển động. Khi huấn luyện AI với một mô hình tương tự, họ phát hiện ra rằng nó cũng tự động hình thành hai hệ thống phân tích độc lập, giống như não bộ.
Trong lĩnh vực thính giác, một nghiên cứu năm 2023 đã đào tạo AI Wav2Vec 2.0 để học ngôn ngữ mà không cần nhãn. Khi so sánh với dữ liệu quét não người, các nhà nghiên cứu phát hiện ra rằng AI và não bộ có cách xử lý âm thanh tương đồng đáng kể. Các lớp nông của AI phản ứng giống vùng thính giác chính trong não, trong khi các lớp sâu hơn giống với vỏ não trước trán.
Tuy nhiên, một số chuyên gia vẫn hoài nghi về việc AI có thể thực sự mô phỏng hoàn toàn não bộ. Josh McDermott từ MIT đã thử nghiệm bằng cách sử dụng các tín hiệu âm thanh và hình ảnh tổng hợp để đánh giá AI. Kết quả cho thấy, ngay cả khi học tự giám sát, các mô hình vẫn gặp khó khăn trong việc hiểu đúng bản chất thực sự của dữ liệu.
Dù còn nhiều thách thức, học tự giám sát đang mở ra những hướng đi mới trong nghiên cứu AI và khoa học thần kinh. Nó không chỉ giúp cải thiện khả năng nhận diện của máy móc mà còn cung cấp cái nhìn sâu sắc hơn về cách con người học hỏi và tiếp thu thông tin từ thế giới xung quanh.
Nguồn: QuantaMag