Xu hướng sẽ là sự phát triển của các mô hình nhỏ hơn, tối ưu hơn

ThanhDat
ThanhDat
Phản hồi: 0

ThanhDat

Writer
Dự án Stargate, do OpenAI, Nhà Trắng, Oracle, Softbank và MGX đầu tư, đang thúc đẩy sự phát triển AI tại Hoa Kỳ. Dự án này đặt ra nhiều câu hỏi về cơ sở hạ tầng trung tâm dữ liệu, tiêu thụ điện năng và sự phát triển của AI. Theo Kuba Stolarski, phó chủ tịch nghiên cứu của IDC, Hoa Kỳ đang trong cuộc đua AI với Trung Quốc, tương tự như cuộc chạy đua không gian với Liên Xô vào những năm 1960.
1738837768178.png

Các mô hình ngôn ngữ lớn như ChatGPT 3.0 tốn kém và mất nhiều năm để triển khai do giới hạn về bộ nhớ GPU. Vì vậy, để đạt được AI có khả năng tương đương hoặc vượt qua nhận thức con người, cần tối ưu hóa hướng phát triển AI.

Hiện tại, Stargate đang xây dựng cơ sở hạ tầng AI lớn nhất trong lịch sử với kế hoạch đầu tư 500 tỷ đô la vào thị trường máy chủ trong bốn năm tới, trong đó 100 tỷ đô la đầu tiên được cam kết để giữ vững vị thế dẫn đầu của Hoa Kỳ. Tuy nhiên, các mô hình AI cần có ứng dụng thương mại rõ ràng để biện minh cho khoản đầu tư khổng lồ này. Ngoài ra, nguồn cung GPU có thể chịu áp lực lớn do nhu cầu cao từ dự án.

Stolarski nhấn mạnh rằng mặc dù nguồn cung GPU sẽ tiếp tục tăng, nhu cầu vẫn vượt xa cung, đặc biệt trong một thị trường năng động như AI. Sự tham gia của chính quyền Hoa Kỳ có thể tạo thuận lợi về mặt pháp lý, nhưng vẫn có nhiều bất ổn liên quan đến chính sách năng lượng. Các tranh luận cũng xoay quanh việc liệu GPU farm có phải là khoản đầu tư hữu ích và liệu AGI có thể đạt được chỉ bằng sức mạnh tính toán hiện có không. Stolarski cho rằng máy tính lượng tử có thể mang lại đột phá lớn hơn so với các mô hình ngôn ngữ lớn (LLM).

Trong khi đó, công ty Trung Quốc DeepSeek tuyên bố có thể đào tạo AI với mức tiêu thụ GPU thấp hơn 11 lần so với các mô hình hiện tại. Stolarski cho rằng tuyên bố này đáng chú ý nhưng chưa thể so sánh trực tiếp với các nền tảng AI của Hoa Kỳ. OpenAI đang hợp tác với các công ty công nghệ lớn như Arm, Microsoft, NVIDIA và Oracle để phát triển công nghệ Stargate, bao gồm cả ứng dụng AI trong y tế.

Một xu hướng quan trọng khác là sự phát triển của các mô hình nhỏ hơn, tối ưu hơn, giúp giảm nhu cầu về cơ sở hạ tầng mà vẫn duy trì hiệu suất cao. Stolarski cho rằng các mô hình ngôn ngữ nhỏ hơn, mô hình thưa thớt và mô hình có độ chính xác thấp đang được nghiên cứu để giảm chi phí phát triển AI trong khi vẫn đảm bảo độ chính xác. Ví dụ, IBM đã thành công trong việc triển khai mô hình AI nhỏ hơn nhưng mang lại giá trị kinh doanh cao.

Theo Stolarski, nếu hiệu suất GPU được tối ưu hóa hơn nữa, nhu cầu về AI sẽ tăng mạnh. Thị trường đang chờ đợi bước đột phá trong hiệu suất AI, và mặc dù hiện tại sự phấn khích có thể đã dịu lại, nhưng các cải tiến vẫn đang diễn ra mạnh mẽ.
Nguồn: Healthcare
 


Đăng nhập một lần thảo luận tẹt ga
Top