Foxconn cũng nhảy vào làm mô hình ngôn ngữ lớn

Bỉ Ngạn Hoa
Bỉ Ngạn Hoa
Phản hồi: 0
Vào ngày 10/3, Foxconn, hãng sản xuất iPhone cho Apple, vừa ra mắt mô hình ngôn ngữ lớn đầu tiên và có kế hoạch sử dụng công nghệ này để cải thiện sản xuất và quản lý chuỗi cung ứng.

Mô hình có tên "FoxBrain" được đào tạo bằng 120 GPU H100 của Nvidia và hoàn thành trong khoảng bốn tuần, nhà sản xuất thiết bị điện tử theo hợp đồng lớn nhất thế giới cho biết trong một tuyên bố.

Foxconn cho biết mô hình này dựa trên kiến trúc Llama 3.1 của Meta. Đây là mô hình ngôn ngữ lớn đầu tiên của Đài Loan có khả năng suy luận được tối ưu hóa cho các phong cách ngôn ngữ truyền thống của Trung Quốc và Đài Loan, công ty cho biết.

1741751864113.png

Foxconn cho biết mặc dù có một khoảng cách hiệu suất nhỏ so với mô hình chưng cất DeepSeek của Trung Quốc, nhưng hiệu suất tổng thể của nó rất gần với các tiêu chuẩn đẳng cấp thế giới.

Ban đầu được thiết kế cho các ứng dụng nội bộ, FoxBrain bao gồm phân tích dữ liệu, hỗ trợ quyết định, cộng tác tài liệu, toán học, lý luận và giải quyết vấn đề, và tạo mã.

Foxconn cho biết họ có kế hoạch hợp tác với các đối tác công nghệ để mở rộng các ứng dụng của mô hình, chia sẻ thông tin nguồn mở và thúc đẩy AI trong sản xuất, quản lý chuỗi cung ứng và ra quyết định thông minh.

Nvidia đã hỗ trợ thông qua siêu máy tính "Taipei-1" có trụ sở tại Đài Loan và cung cấp tư vấn kỹ thuật trong quá trình đào tạo mô hình, Foxconn cho biết.

Taipei-1, siêu máy tính lớn nhất tại Đài Loan, thuộc sở hữu và được Nvidia vận hành tại Cao Hùng, một thành phố phía nam của hòn đảo.

Foxconn sẽ công bố thêm thông tin chi tiết về mô hình này trong hội nghị dành cho nhà phát triển GTC của Nvidia vào giữa tháng 3.
 


Đăng nhập một lần thảo luận tẹt ga
Top