Lời cảnh báo từ Google Translate: Tương lai u ám của AI đang hiện hữu

Sóng AI
Sóng AI
Phản hồi: 0

Sóng AI

Writer
QbNhIvvmwJBdAtbHxFzT.jpg


  • Rich Sutton và Andrew Barto vừa được trao giải thưởng Turing danh giá nhất trong lĩnh vực khoa học máy tính. Bài viết "Bài học cay đắng" năm 2019 của Sutton đã định hình nhiều xu hướng AI hiện nay, cho rằng phương pháp dựa vào tính toán mạnh mẽ sẽ hiệu quả hơn kiến thức con người.


  • Chatbot AI ngày nay được xây dựng trên các mô hình ngôn ngữ lớn (LLM), được phát triển từ các mô hình xác suất ngôn ngữ do Claude Shannon chính thức hóa từ năm 1948.


  • Mô hình ngôn ngữ đầu tiên có quy mô như LLM hiện đại xuất bản năm 2007 và là thành phần của Google Translate (ra mắt năm 2006). Nó được huấn luyện trên hàng nghìn tỷ từ, sử dụng hơn 1.000 máy tính.


  • Dù dịch máy đã cải thiện liên tục trong hai thập kỷ qua, Google Translate hiện hỗ trợ 249 ngôn ngữ nhưng con số này chỉ chiếm chưa đến 4% số lượng ngôn ngữ trên thế giới (khoảng 7.000).


  • Dịch máy thường thất bại với thành ngữ, địa danh, thuật ngữ kỹ thuật và pháp lý. Đánh giá thường niên lớn nhất về hệ thống dịch máy năm 2024 kết luận rằng "dịch máy vẫn chưa được giải quyết hoàn toàn".


  • Một khảo sát năm 2022 với 1.200 người cho thấy họ chủ yếu sử dụng dịch máy trong các tình huống ít quan trọng. Chỉ khoảng 2% người dùng dịch máy trong các tình huống quan trọng như giao tiếp với nhân viên y tế hoặc cảnh sát.


  • Nghiên cứu đã chỉ ra rằng lỗi dịch máy trong chăm sóc sức khỏe có thể gây hại nghiêm trọng và làm hỏng các hồ sơ xin tị nạn đáng tin cậy.


  • Ngành dịch thuật vẫn phụ thuộc vào dịch giả con người trong các tình huống quan trọng, nhưng nhiều người đã trở thành freelancer, chủ yếu tập trung vào đảm bảo chất lượng bản dịch máy.


  • Sự ra mắt của mô hình AI Trung Quốc Deepseek với khả năng tương đương OpenAI GPT nhưng giá rẻ hơn nhiều báo hiệu các LLM phức tạp đang trên đường trở thành hàng hóa thông dụng.


  • Giới hạn cơ bản của LLM là dữ liệu, khi chúng đã khai thác hầu hết những gì có trên internet. Dữ liệu huấn luyện có khả năng đại diện chưa đủ cho hầu hết tác vụ, tương tự như với hầu hết ngôn ngữ trong dịch máy.


  • Tương lai của LLM là xuất sắc ở một số tác vụ, trung bình ở một số khác và không đáng tin cậy ở những lĩnh vực còn lại, như đã xảy ra với luật sư tin tưởng vào ChatGPT tạo ra trích dẫn luật không tồn tại.

📌 Từ bài học của Google Translate, chúng ta thấy tương lai của AI có nhiều hạn chế: LLM sẽ chỉ xuất sắc ở một số tác vụ, trung bình ở số khác và kém tin cậy ở những lĩnh vực còn lại. Với dữ liệu internet đã cạn kiệt và rủi ro cao trong các tình huống quan trọng, câu hỏi cấp bách là: đây có thực sự là tương lai chúng ta muốn xây dựng?

Nguồn: Songai.vn
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top