VnReview
Hà Nội

Machine learning có thật sự giúp ra quyết định an toàn và có đạo đức?

Công nghệ học máy (machine learning) đang được ứng dụng rộng rãi trong những lĩnh vực nào trên thế giới? Các quyết định của máy tính đáng tin cậy đến mức nào về độ an toàn, chuyên môn lẫn đạo đức? Mời bạn đọc đến với phần 4 của loạt bài về robot và trí tuệ nhân tạo.

Phần 1: Robot ra đời từ lúc nào và chúng có thật sự thông minh?

Phần 2: Chiến lược nào giúp các cỗ máy chơi cờ trở thành những nhà vô địch thế giới?

Phần 3: Đây là những kỹ thuật machine learning cơ bản giúp máy tính tư duy như con người

Machine Learning là gì và tại sao nó lại quan trọng?

Loạt bài nhiều kỳ về robot và trí tuệ nhân tạo được chuyển ngữ từ bài giảng trực tiếp của giáo sư chuyên ngành toán ứng dụng Chris Budd (Vương quốc Anh), được đăng lại trên Plus Magazine.

Tóm tắt phần 3: Các giải thuật machine learning cơ bản được ứng dụng trong công tác tuyển dụng, nhận dạng chữ viết, mạng perceptron, chơi cờ, các phương pháp học của máy.

Các giải thuật machine learning đang được sử dụng trong vô số ứng dụng theo nhiều cách khác nhau. Một số trong các ứng dụng này có ảnh hưởng rất quan trọng đến xã hội loài người. Có thể kể ra một vài ứng dụng ít gây tranh cãi hơn số còn lại: ứng dụng đặt quảng cáo lên Internet, nhận dạng giọng nói, nhận dạng văn bản, tạo caption ảnh, dịch tự động, dự báo thời tiết ngắn hạn, phân loại và nhận dạng hình ảnh (kể cả nhận dạng gương mặt). Machine learning cũng được dùng cho các bộ lọc spam, xe hơi tự động, chương trình phát hiện gian lận của ngân hàng.

(Ảnh:;ITPlus Academy)

Smartphone

Chương trình nhận dạng giọng nói mà trợ lý cá nhân trong máy bạn sử dụng cũng dùng tới machine learning.

Tuy nhiên, các giải thuật bắt đầu gây tranh cãi khi chúng tác động trực tiếp đến con người và cuộc sống của họ. Ví dụ như việc machine learning được các công ty bảo hiểm dùng để xác định phí bảo hiểm, được các siêu thị dùng để nhắm tới khách hàng mục tiêu, các công ty dùng để tìm kiếm ứng viên, hệ thống tư pháp Mỹ dùng để quyết định việc kết tội tù nhân. Vấn đề này sẽ được minh họa qua hai ví dụ chi tiết hơn trong bài là dùng máy móc để lên kế hoạch về hưu và ra quyết định phẫu thuật.

Thanh toán lương hưu

Theo kết quả khảo sát của công ty tư vấn Accenture, 68% người tiêu dùng toàn cầu sẽ vui vẻ dùng máy tính để tìm lời khuyên khi lên kế hoạch về hưu. Nhiều người cảm thấy lời khuyên của máy tính sẽ nhanh hơn, rẻ hơn, vô tư hơn, ít chỉ trích và "ít xa lạ" hơn lời khuyên của người khác.

Accenture là tập đoàn hàng đầu thế giới về tư vấn quản lý và công nghệ, nằm trong top Fortune Global 500, là đối tác của 95 công ty trong top Fortune Global 100 và 3/4 số công ty trong top Fortune Global 500.

Trong phương pháp này, các giải thuật machine learning được dùng để phân tích tình trạng tài chính của một cá nhân nào đó.

Đầu tiên, khách hàng trả lời các câu hỏi trực tuyến về thu nhập, chi tiêu, tình trạng gia đình, thái độ trước rủi ro. Sau đó, máy sẽ chạy giải thuật để cho ra một kế hoạch đầu tư phù hợp, bao gồm hỗn hợp đầu tư từ quỹ chứng khoán có chỉ số đến trái phiếu thu nhập cố định. Các giải thuật này cũng quan tâm đến thông tin cá nhân như tuổi khách hàng. Theo ước tính của công ty nghiên cứu thị trường Statista, thị trường Mỹ sẽ tăng trưởng 29% hàng năm từ nay đến 2021, và số nhà đầu tư Trung Quốc ứng dụng các giải thuật machine learning sẽ tăng từ 2 triệu lên đến gần 80 triệu nhà đầu tư cũng trong khoảng thời gian trên.

Chẩn đoán và điều trị y khoa

Hiện nay, các mạng neuron cũng được dùng trong chẩn đoán y khoa, thiết kế thuốc, phân tích hình ảnh và hóa sinh học. Các mạng neuron tích chập (Convolutional neural nets-CNN) đã được dùng trong khám phá thuốc. Năm 2015, công ty Atomwise ra mắt AtomNet, mạng neuron deep learning (học sâu) đầu tiên trong lĩnh vực khám phá thuốc lý tính dựa trên cấu trúc. Các hệ thống được đào tạo trực tiếp trên những biểu tượng tương tác hóa học ba chiều. AtomNet đã được dùng để dự báo các phân tử sinh học mới cho những mục tiêu nhiều bệnh mà đáng chú ý nhất là virus Ebola và đa xơ hệ thần kinh.

Chụp X quang (tia X)

Các ảnh chụp tia X cũng có thể được đánh giá bằng máy móc trong tương lai.

Các kỹ thuật như MRI tạo ra những hình ảnh rõ ràng một cách kỳ diệu. Các hình ảnh này có thể được dùng trong một chẩn đoán rõ ràng. Tuy nhiên, cần thời gian để sử dụng các phương pháp này. Trong những trường hợp cấp tính nhất định như gãy xương khớp háng hay xương khớp đầu gối, thời gian đưa ra chẩn đoán rất hạn chế. Do đó, chụp ảnh phức tạp là không khả thi, và các bác sĩ vẫn phải dựa vào ảnh chụp X-quang tiêu chuẩn để đưa ra những đánh giá nhanh chóng.

Trong tương lai, ảnh chụp X-quang có thể được đánh giá bằng machine learning

Một trường hợp khác là không có sẵn bác sĩ có chuyên môn phù hợp để chẩn đoán ngay thời điểm đó. Khi đó, chắc chắn là machine learning có thể có ích trong chẩn đoán. Tại đại học Bath (Vương quốc Anh, nơi giáo sư Budd đang công tác), Richie Gill và Ellen Murphy đang tiên phong một phương pháp chẩn đoán y khoa mới. Trong phương pháp này, một mạng CNN được đào tạo trên một tập hợp ảnh chụp X-quang các khớp xương háng với loại gãy xương và vị trí đã được xác định. Sau đó, CNN được cho một ảnh mới để xác định và phân loại khớp xương, loại gãy xương.

Machine learning có đạo đức, đáng tin cậy và hợp pháp không?

Các mạng neuron sâu là những chiếc hộp RẤT đen! Như chúng ta đã thấy, bạn đào tạo chúng bằng cách đưa cho chúng một lượng dữ liệu lớn. Sau đó, chúng sẽ áp dụng các phương pháp tối ưu phức tạp và khó-phân-tích để xác định cấu trúc bên trong của dữ liệu. Các mạng lưới được dùng để ra quyết định về các vấn đề phức tạp có tác động trực tiếp đến cuộc sống con người. Trong trường hợp máy tính chơi cờ, điều này hiệu quả và dường như không xảy ra các vấn đề đạo đức. Tuy nhiên, thật sự thì chúng ta có thể chứng minh rằng việc dùng machine learning trong chọn lọc hồ sơ xin việc hay các vấn đề khác tương tự cũng hiệu quả và không có hại về đạo đức?

Tôi tin rằng, giữa nhiều vấn đề khác, câu trả lời sẽ phải là "không". Dưới đây là một số lý do.

Tương quan hay hậu quả

Hai vấn đề liên quan đến nhau không có nghĩa là vấn đề này gây ra vấn đề kia (Correlation does not imply causation).

Đây là một bài toán kinh điển trong thống kê học. Nếu bạn có một lượng lớn dữ liệu và đem so sánh tập dữ liệu này với tập dữ liệu kia, bạn có thể tìm thấy những ví dụ có vẻ liên quan tới nhau. Trong hình dưới đây, chúng ta thử so sánh chi tiêu cho khoa học, công nghệ và không gian với số vụ tự tử ở Mỹ từ năm 2003 - 2009. Chúng có vẻ liên quan chặt chẽ với nhau. Từ đồ thị này, chúng ta có thể đưa ra kết luận là số vụ tự tử sẽ tăng theo chi tiêu khoa học. Và một machine learning cũng có thể suy luận như thế. Do đó, chính phủ Mỹ nên cắt giảm ngay lập tức chi tiêu khoa học để giảm tỉ lệ tự tử ở nước này.

(Ảnh: Tylervigen.com, CC BY 4.0) 

Lý do khiến kết luận trên ngớ ngẩn là vì không nhất thiết là những thay đổi trong tập dữ liệu này sẽ gây ra những thay đổi trong tập dữ liệu kia. Trong ví dụ trên, có nhiều khả năng là những thay đổi khác ở Mỹ, ví dụ như tăng trưởng GDP sẽ dẫn tới sự gia tăng tỉ lệ tự tử và hỗ trợ khoa học. Các tập dữ liệu mà chúng ta xem xét càng có tính ngẫu nhiên chừng nào thì bạn càng có nhiều khả năng tìm ra những tương quan sai lầm giữa chúng. Hoặc nói một cách thi vị hơn, "trong ảo tưởng, bạn có thể tìm thấy bất kỳ điều gì bạn đang tìm kiếm". Hãy cẩn thận, quá trình này đã dẫn tới nhiều phán xét sai lầm của tòa án!

Các nhà thống kê học cũng ý thức rõ ràng về vấn đề này và có những bài kiểm tra để phòng ngừa việc đưa ra những suy diễn sai lầm. Machine learning được áp dụng một cách cẩu thả có thể không có những bài kiểm tra như thế. Chúng ta có rất ít sự đảm bảo rằng, từ một tập dữ liệu lớn, một giải thuật machine learning sẽ không đưa ra những kết luận sai.

Machine learning có thể nhầm lẫn

Không chỉ vì các giải thuật machine learning còn lâu mới hoàn hảo mà còn vì chúng thường không đi cùng với bất kỳ ước tính nào về tính không chắc chắn trong các dự báo.

Một trong những ứng dụng của machine learning là trong thiết kế và vận hành xe hơi tự động. Rõ ràng là một chiếc xe dạng này phải có khả năng phát hiện, xác định và nhận ra ý nghĩa của các biển báo đường phố tiêu chuẩn. Tuy nhiên, theo một nghiên cứu gần đây, một giải thuật machine learning được đào tạo trên một tập hợp biển báo đường phố đã nhận dạng nhầm hình ảnh biển báo dừng bị biến dạng đôi chút thành biển báo tốc độ 45 dặm/giờ (1 dặm-mile bằng 1,6 km)! May mắn là giải thuật này không được dùng trong ứng dụng thực tế.

Máy móc không phải là con người

Một vấn đề khác của machine learning đã được hàm ý trong tên gọi của nó. Machine learning có nghĩa là học bằng máy. Con người và máy móc không phải lúc nào cũng "suy nghĩ" theo cùng một cách. Để minh họa điều này, tôi sẽ xem xét nhanh vấn đề nhận thức, điều quan trọng trong lĩnh vực tầm nhìn của máy móc-cách mà robot nhìn môi trường của nó và ra quyết định về những cái nó thấy. Rõ ràng, chúng ta sẽ muốn robot nhìn mọi việc theo cách tương tự con người. Tuy nhiên, điều này không khả thi. Dưới đây chúng ta hãy xem xét một ví dụ minh họa: ảo tưởng cái bóng bàn cờ của Adelson (Adelson's checkers shadow illusion), một ảo tưởng nổi tiếng của nhà khoa học thị lực Edward H. Adelson.

Hãy nhìn hình và quyết định xem hình nào trong hai hình vuông A và B là sáng nhất.

Hình nào sáng hơn? (Ảnh: Edward H. Adelson) 

Bạn có thể ngạc nhiên khi biết rằng, trong thực tế, hai hình vuông có độ sáng như nhau! Bộ não con người chúng ta sẽ nhìn thấy hình vuông B có vẻ sáng hơn hình vuông A, do bóng của hình trụ đứng đã che khuất một phần ánh sáng. Đó là cách con người nhìn sự vật. Tuy vậy, một chiếc máy vi tính sẽ nhìn theo cách khác, bởi vì nói chính xác thì hai hình vuông A và B đều sáng như nhau, theo một phép tính đơn giản.

Cả hai hình vuông đều sáng như nhau (Ảnh: Edward H. Adelson)

Không nghi ngờ gì, còn nhiều ví dụ khác về cách máy và người nghĩ khác nhau-chúng ta không nên kỳ vọng chúng nghĩ giống chúng ta.

Những định kiến tiềm ẩn

Chúng ta có thể nghĩ rằng, một trong những lợi ích của phương pháp machine learning trong việc lựa chọn các ứng viên tìm việc cũng như các vấn đề khác liên quan đến con người là chúng không thể hiện sự thiên vị như con người. Tuy nhiên, chắc chắn là việc này không như vậy. Khi chúng ta đào tạo một mạng neuron trên một tập hợp CV, tập hợp dữ liệu đào tạo sẽ chứa đựng tất cả những định kiến của những người ra quyết định ban đầu. Những định kiến này sẽ được chuyển vào trong kết quả của giải thuật machine learning. Chắc chắn là hành vi này đã được tìm thấy trong những chiếc máy được đào tạo như thế.

(Ảnh: Sott)

Do đó, trước khi áp dụng những phương pháp machine learning, điều quan trọng là tập hợp đào tạo được kiểm tra kỹ lưỡng về các định kiến trước khi được dùng để đào tạo một chiếc máy.

Kết luận

Những lý do trên cho thấy, chúng ta không nhất thiết phải tin vào các giải thuật machine learning. Rõ ràng, việc dùng một chiếc máy để đưa ra các quyết định khi chúng ta không tin tưởng nó có thể ra quyết định tốt là một việc làm không có đạo đức. Kể cả khi chúng ta tin tưởng một hệ thống machine learning, ví dụ như các giải thuật chơi cờ, vẫn có những vấn đề đạo đức nghiêm trọng trong cách sử dụng chúng.

Một ví dụ là, hiện nay khi bạn có thể mang theo một chiếc máy vi tính trong túi và chiếc máy đó có khả năng đánh bại đại kiện tướng cờ vua, cám dỗ của việc gian lận với nhiều người là rất lớn. Kết quả là, chúng ta đã thấy sự gia tăng đáng kể số lượng gian lận trong các trận đấu cờ, phần lớn bằng cách nhìn vào máy tính mà không để người khác chú ý. Cũng đã có nhiều tiến bộ trong phát hiện gian lận để giải quyết việc này. Bạn tôi, nhà logic toán học Ken Regan ở đại học Buffalo (New York), là một chuyên gia về phát hiện gian lận khi chơi cờ. Anh ấy sử dụng các biện pháp thống kê phức tạp để phát hiện các gian lận này.

(Ảnh: Youtube)

Các vấn đề đạo đức liên quan tới machine learning lớn đến mức trường đại học Bath của tôi đã tổ chức một học kỳ đặc biệt trong năm nay dành riêng cho những chủ đề này, kết thúc bằng một buổi tranh luận lớn dành cho công chúng.

Một câu hỏi lớn khác nổi lên, đó là liệu machine learning có thể thay thế các công việc hiện nay được con người đảm nhận hay không, bằng cách nào và việc này sẽ tác động đến xã hội như thế nào. Tôi đặc biệt hứng thú với việc liệu một ngày nào đó, máy móc có thể thay thế các nhà toán học được không. Đó sẽ là chủ đề của bài viết kế tiếp: Khi máy móc có thể tính toán và suy luận như con người thì chúng ta có cần các nhà toán học nữa không?

Linh Trần

Theo Maths.org

Chủ đề khác