Microsoft ra mắt chip Maia 200, tăng tốc suy luận AI

Microsoft vừa công bố ra mắt chip Maia 200, một bộ vi xử lý được thiết kế đặc biệt để tăng cường khả năng suy luận AI trên quy mô lớn. Kế thừa từ Maia 100 ra mắt năm 2023, phiên bản 200 này được trang bị công nghệ tiên tiến, cho phép vận hành các mô hình AI phức tạp với tốc độ nhanh hơn và hiệu quả vượt trội. Với hơn 100 tỷ bóng bán dẫn, Maia 200 mang lại hiệu suất đáng kể, đạt trên 10 petaflop ở độ chính xác 4-bit và khoảng 5 petaflop ở độ chính xác 8-bit, vượt xa đáng kể so với người tiền nhiệm.

Suy luận AI đề cập đến quá trình tính toán để chạy một mô hình đã được huấn luyện, khác với công đoạn huấn luyện mô hình. Khi các công ty AI ngày càng trưởng thành, chi phí suy luận đã trở thành một phần quan trọng trong tổng chi phí vận hành, thúc đẩy nhu cầu tối ưu hóa quy trình này. Microsoft kỳ vọng Maia 200 sẽ là giải pháp tối ưu, giúp các doanh nghiệp AI hoạt động ổn định hơn, giảm thiểu gián đoạn và tiêu thụ ít năng lượng hơn. Một node Maia 200 có thể dễ dàng vận hành các mô hình lớn nhất hiện nay, đồng thời vẫn còn đủ tiềm năng cho những mô hình phức tạp hơn trong tương lai.

Sự ra đời của Maia 200 cũng phản ánh xu hướng ngày càng tăng của các ông lớn công nghệ trong việc tự thiết kế chip để giảm sự phụ thuộc vào GPU của Nvidia, vốn đang đóng vai trò then chốt trong thành công của các công ty AI. Google đã có TPU (Tensor Processing Units), trong khi Amazon phát triển chip tăng tốc AI Trainium, với phiên bản Trainium3 mới nhất được ra mắt vào tháng 12. Các giải pháp này giúp giảm tải một phần công việc tính toán, vốn lẽ ra sẽ do GPU của Nvidia đảm nhiệm, từ đó cắt giảm chi phí phần cứng tổng thể.

Microsoft tự tin định vị Maia 200 để cạnh tranh trực tiếp với các giải pháp thay thế này. Công ty tuyên bố Maia 200 mang lại hiệu suất FP4 cao gấp ba lần so với chip Trainium thế hệ thứ ba của Amazon và hiệu suất FP8 vượt trội hơn so với TPU thế hệ thứ bảy của Google. Hiện tại, Maia 200 đã được ứng dụng để hỗ trợ các mô hình AI của đội ngũ Superintelligence của Microsoft và cung cấp năng lượng cho Copilot, trợ lý chatbot của hãng. Microsoft cũng đã mời các nhà phát triển, học giả và phòng thí nghiệm AI tiên phong sử dụng bộ công cụ phát triển phần mềm (SDK) của Maia 200 trong các khối lượng công việc của họ.

Việc Microsoft ra mắt chip Maia 200 đánh dấu một bước tiến quan trọng trong nỗ lực tối ưu hóa hiệu suất và chi phí cho các tác vụ suy luận AI. Đây không chỉ là một giải pháp mạnh mẽ để vận hành các mô hình AI hiện tại và tương lai mà còn là minh chứng cho chiến lược độc lập hóa phần cứng của các tập đoàn công nghệ. Các nhà phát triển và doanh nghiệp AI nên cân nhắc khám phá tiềm năng của Maia 200 thông qua bộ SDK của nó để tận dụng lợi thế cạnh tranh mà con chip này mang lại.