Trường Sơn
Writer
Gần đây, mô hình o3-mini-high của OpenAI được tiết lộ là có khả năng suy luận bằng tiếng Trung Quốc.
Một lượng lớn cư dân mạng nước ngoài đăng tải trên các diễn đàn xã hội rằng người Trung Quốc thường xuất hiện trong quá trình suy nghĩ của mô hình o3-mini-high.
Nhiều cư dân mạng cảm thấy bối rối tại sao mô hình lại sử dụng tiếng Trung rộng rãi để suy luận mà không có sự can thiệp của người dùng.
Điều thú vị là khi một số cư dân mạng đặt câu hỏi bằng tiếng Nga, o3-mini-high vẫn nghĩ bằng tiếng Trung.
Nhiều cư dân mạng nghi ngờ OpenAI đã đạo nhái mô hình DeepSeek của Trung Quốc.
Người ta cho biết tình trạng này cũng xảy ra ở o1 của OpenAi. Tại sao lại xuất hiện hiện tượng lý luận trong tiếng Trung? Một số nhà phân tích tin rằng tiếng Trung có thể ngắn hơn, nên sẽ nhận được nhiều phần thưởng hơn trong quá trình học tăng cường;
Các mô hình chung của OpenAI (như GPT-3/4) vốn có nhiều ngôn ngữ và lý luận tiếng Trung là sự mở rộng tự nhiên của điều này;
Dữ liệu đào tạo của chuỗi GPT bao gồm các văn bản đa ngôn ngữ (bao gồm cả tiếng Trung) có sẵn công khai trên Internet, do đó có thể xử lý dữ liệu đầu vào và tạo ra tiếng Trung;
Mô hình này tự động học các mẫu ngôn ngữ thông qua dữ liệu khổng lồ, mà không cần phải thiết kế kiến trúc riêng cho từng ngôn ngữ.
Gần đây, theo Bloomberg, những người hiểu rõ vấn đề này tiết lộ rằng Microsoft và OpenAI đang điều tra xem liệu dữ liệu đầu ra của công nghệ OpenAI có bị các nhóm liên quan đến công ty khởi nghiệp trí tuệ nhân tạo Trung Quốc DeepSeek lấy cắp một cách trái phép hay không.
Theo những người hiểu rõ vấn đề này, vào mùa thu năm ngoái, các nhà nghiên cứu bảo mật của Microsoft đã phát hiện ra rằng những cá nhân mà họ tin là có thể liên quan đến DeepSeek đã sử dụng giao diện lập trình ứng dụng (API) OpenAI để đánh cắp một lượng lớn dữ liệu.
Tuy nhiên, CEO của OpenAI là Altman cho biết OpenAI "không có kế hoạch" kiện DeepSeek.
Một lượng lớn cư dân mạng nước ngoài đăng tải trên các diễn đàn xã hội rằng người Trung Quốc thường xuất hiện trong quá trình suy nghĩ của mô hình o3-mini-high.
Nhiều cư dân mạng cảm thấy bối rối tại sao mô hình lại sử dụng tiếng Trung rộng rãi để suy luận mà không có sự can thiệp của người dùng.
Điều thú vị là khi một số cư dân mạng đặt câu hỏi bằng tiếng Nga, o3-mini-high vẫn nghĩ bằng tiếng Trung.
Nhiều cư dân mạng nghi ngờ OpenAI đã đạo nhái mô hình DeepSeek của Trung Quốc.
Người ta cho biết tình trạng này cũng xảy ra ở o1 của OpenAi. Tại sao lại xuất hiện hiện tượng lý luận trong tiếng Trung? Một số nhà phân tích tin rằng tiếng Trung có thể ngắn hơn, nên sẽ nhận được nhiều phần thưởng hơn trong quá trình học tăng cường;
Các mô hình chung của OpenAI (như GPT-3/4) vốn có nhiều ngôn ngữ và lý luận tiếng Trung là sự mở rộng tự nhiên của điều này;
Dữ liệu đào tạo của chuỗi GPT bao gồm các văn bản đa ngôn ngữ (bao gồm cả tiếng Trung) có sẵn công khai trên Internet, do đó có thể xử lý dữ liệu đầu vào và tạo ra tiếng Trung;
Mô hình này tự động học các mẫu ngôn ngữ thông qua dữ liệu khổng lồ, mà không cần phải thiết kế kiến trúc riêng cho từng ngôn ngữ.
Gần đây, theo Bloomberg, những người hiểu rõ vấn đề này tiết lộ rằng Microsoft và OpenAI đang điều tra xem liệu dữ liệu đầu ra của công nghệ OpenAI có bị các nhóm liên quan đến công ty khởi nghiệp trí tuệ nhân tạo Trung Quốc DeepSeek lấy cắp một cách trái phép hay không.
Theo những người hiểu rõ vấn đề này, vào mùa thu năm ngoái, các nhà nghiên cứu bảo mật của Microsoft đã phát hiện ra rằng những cá nhân mà họ tin là có thể liên quan đến DeepSeek đã sử dụng giao diện lập trình ứng dụng (API) OpenAI để đánh cắp một lượng lớn dữ liệu.
Tuy nhiên, CEO của OpenAI là Altman cho biết OpenAI "không có kế hoạch" kiện DeepSeek.