Nghiên cứu của Stanford: cuộc đua AI đã trở nên đông đúc, Trung Quốc gần ngang ngửa với Mỹ

Sasha
Sasha
Phản hồi: 0

Sasha

Writer
Nghiên cứu mới từ Stanford cho thấy trí tuệ nhân tạo (AI) không chỉ do OpenAI và Google thống trị, vì sự cạnh tranh ngày càng tăng trên khắp nước Mỹ, Trung Quốc và Pháp.

1744080041419.png

Vào năm ChatGPT trở nên phổ biến, chỉ có hai công ty Mỹ - OpenAI và Google - có thể tự hào về trí tuệ nhân tạo thực sự tiên tiến. Ba năm sau, AI không còn là cuộc đua của hai chú ngựa này nữa, cũng không chỉ là cuộc đua của riêng người Mỹ. Một báo cáo mới được Viện AI lấy con người làm trung tâm (HAI) của Đại học Stanford công bố 7/4 nêu bật mức độ đông đúc của lĩnh vực này.

Chỉ số AI năm 2025 của viện HAI, tổng hợp dữ liệu và xu hướng về tình trạng của ngành AI, vẽ nên bức tranh về một cuộc đua ngày càng cạnh tranh, toàn cầu và không bị hạn chế hướng tới trí tuệ nhân tạo tổng quát (AGI) – công nghệ AI vượt qua khả năng của con người.

Báo cáo cho thấy OpenAI và Google vẫn đang bám đuổi sát nút trong cuộc đua xây dựng AI tiên tiến. Nhưng một số công ty khác đang tiến gần hơn. Tại Mỹ, sự cạnh tranh khốc liệt nhất đến từ các mô hình Llama trọng lượng mở của Meta; Anthropic, một công ty do các cựu nhân viên của OpenAI thành lập; và xAI của Elon Musk.

Đáng chú ý nhất là, theo một chuẩn mực được sử dụng rộng rãi có tên là LMSYS, mô hình mới nhất từ DeepSeek của Trung Quốc, R1, xếp hạng gần nhất với các mô hình hiệu suất cao nhất do hai công ty AI hàng đầu của Mỹ xây dựng.

Vanessa Parli, giám đốc nghiên cứu tại HAI cho biết: "Nó tạo ra một không gian thú vị. Thật tốt khi những mô hình này không phải đều do năm người ở Thung lũng Silicon phát triển".

Parli nói thêm: "Các mô hình của Trung Quốc đang bắt kịp về hiệu suất với các mô hình của Mỹ", "nhưng trên toàn cầu, có những người chơi mới nổi trong lĩnh vực này".

Sự ra đời của DeepSeek-R1 vào tháng 1 đã gây chấn động ngành công nghiệp công nghệ và thị trường chứng khoán Mỹ. Công ty Trung Quốc này tuyên bố đã xây dựng mô hình của mình bằng một phần nhỏ sức mạnh tính toán mà các đối thủ của Mỹ sử dụng. Sự ra mắt của DeepSeek cũng là một bất ngờ vì chính phủ Mỹ đã nhiều lần tìm cách hạn chế quyền truy cập của Trung Quốc vào các chip máy tính cần thiết để xây dựng AI tiên tiến nhất.

Báo cáo của Stanford cho thấy AI của Trung Quốc đang gia tăng nhìn chung, với các mô hình từ các công ty Trung Quốc đạt điểm tương tự như các đối tác Mỹ của họ trên chuẩn LMSYS. Báo cáo lưu ý rằng Trung Quốc xuất bản nhiều bài báo về AI hơn và nộp nhiều bằng sáng chế liên quan đến AI hơn Mỹ, mặc dù không đánh giá chất lượng của cả hai. Ngược lại, Mỹ tạo ra nhiều mô hình AI đáng chú ý hơn: 40 so với 15 mô hình biên giới được sản xuất tại Trung Quốc và ba mô hình được sản xuất tại Châu Âu. Báo cáo cũng lưu ý rằng các mô hình mạnh mẽ gần đây đã xuất hiện ở Trung Đông, Châu Mỹ Latinh và Đông Nam Á khi công nghệ này trở nên toàn cầu hơn.

Nghiên cứu cho thấy một số mô hình AI tốt nhất hiện là "trọng số mở" (open weight), nghĩa là chúng có thể được tải xuống và sửa đổi miễn phí. Meta đã trở thành tâm điểm của xu hướng này với mô hình Llama, lần đầu tiên được phát hành vào tháng 2 năm 2023. Công ty đã phát hành phiên bản mới nhất của mình, Llama 4, vào cuối tuần. Cả DeepSeek và Mistral, một công ty của Pháp, hiện cũng cung cấp các mô hình trọng số mở (open weight model) tiên tiến. Vào tháng 3, OpenAI đã thông báo rằng họ cũng có kế hoạch phát hành một mô hình nguồn mở - mô hình đầu tiên kể từ GPT-2 - vào mùa hè này. Nghiên cứu cho thấy vào năm 2024, khoảng cách giữa các mô hình mở và đóng đã thu hẹp từ 8% xuống còn 1,7%. Tuy nhiên, phần lớn các mô hình tiên tiến - 60,7% - vẫn đóng.

Báo cáo của Stanford lưu ý rằng ngành công nghiệp AI đã chứng kiến sự cải thiện ổn định về hiệu quả, với phần cứng trở nên hiệu quả hơn 40% trong năm qua. Điều này đã làm giảm chi phí truy vấn các mô hình AI và cũng giúp chạy các mô hình tương đối có khả năng trên các thiết bị cá nhân.

Hiệu quả tăng lên đã thúc đẩy suy đoán rằng các mô hình AI lớn nhất có thể cần ít GPU hơn để đào tạo, mặc dù hầu hết các nhà xây dựng AI đều cho biết họ cần nhiều sức mạnh tính toán hơn chứ không phải ít hơn. Nghiên cứu cho thấy các mô hình AI mới nhất được xây dựng bằng cách sử dụng hàng chục nghìn tỷ mã thông báo - các thành phần đại diện cho các phần dữ liệu như các từ trong câu - và hàng chục tỷ petaflop tính toán. Tuy nhiên, báo cáo trích dẫn nghiên cứu cho thấy nguồn cung cấp dữ liệu đào tạo trên internet sẽ cạn kiệt vào khoảng năm 2026 đến năm 2032, đẩy nhanh việc áp dụng cái gọi là dữ liệu tổng hợp hoặc dữ liệu do AI tạo ra.

Báo cáo đưa ra bức tranh toàn cảnh về tác động rộng hơn của AI. Báo cáo cho thấy nhu cầu về người lao động có kỹ năng học máy đã tăng đột biến và trích dẫn các cuộc khảo sát cho thấy tỷ lệ người lao động ngày càng tăng mong đợi công nghệ này sẽ thay đổi công việc của họ. Báo cáo cho thấy đầu tư tư nhân đã đạt mức kỷ lục 150,8 tỷ USD vào năm 2024. Các chính phủ trên khắp thế giới cũng đã cam kết hàng tỷ đô la cho AI trong cùng năm đó. Kể từ năm 2022, luật liên quan đến AI đã tăng gấp đôi tại Mỹ.

Parli lưu ý rằng mặc dù các công ty đã trở nên bí mật hơn về cách họ phát triển các mô hình AI tiên tiến, nhưng nghiên cứu học thuật đang phát triển mạnh mẽ và cải thiện về chất lượng.

Báo cáo cũng chỉ ra những vấn đề phát sinh từ việc áp dụng AI rộng rãi. Báo cáo lưu ý rằng các sự cố liên quan đến các mô hình AI hoạt động không bình thường hoặc bị sử dụng sai mục đích đã tăng lên trong năm qua, cũng như nghiên cứu nhằm mục đích làm cho các mô hình này an toàn hơn và đáng tin cậy hơn.

Đối với việc đạt được mục tiêu AGI được đồn thổi rất nhiều, báo cáo nêu bật cách một số mô hình AI đã vượt qua khả năng của con người trong các tiêu chuẩn kiểm tra các kỹ năng cụ thể, bao gồm phân loại hình ảnh, hiểu ngôn ngữ và lập luận toán học. Điều này một phần là do các mô hình được thiết kế và tối ưu hóa để vượt trội ở các thước đo này, nhưng nó làm nổi bật tốc độ phát triển nhanh chóng của công nghệ trong những năm gần đây.
 


Đăng nhập một lần thảo luận tẹt ga
Thành viên mới đăng
Top