Microsoft AI vừa chính thức công bố bộ ba mô hình trí tuệ nhân tạo nền tảng mới có khả năng xử lý đa phương thức từ văn bản, giọng nói đến hình ảnh. Đây là bước đi chiến lược của đội ngũ MAI Superintelligence dưới sự dẫn dắt của Mustafa Suleyman, nhằm xây dựng một hệ sinh thái công nghệ tự chủ và trực tiếp cạnh tranh với các phòng thí nghiệm AI hàng đầu hiện nay. Việc ra mắt này khẳng định tham vọng của Microsoft trong việc hoàn thiện ngăn xếp công nghệ (stack) riêng biệt, dù tập đoàn vẫn đang duy trì mối quan hệ hợp tác chặt chẽ với OpenAI.
Trong số các sản phẩm mới, MAI-Transcribe-1 gây chú ý với khả năng chuyển đổi lời nói thành văn bản trên 25 ngôn ngữ khác nhau. Theo dữ liệu công bố, mô hình này đạt tốc độ xử lý nhanh gấp 2,5 lần so với giải pháp Azure Fast hiện có của hãng, với mức chi phí vận hành tối ưu chỉ từ 0,36 USD mỗi giờ. Hiệu suất vượt trội này hứa hẹn sẽ mang lại lợi thế lớn cho các doanh nghiệp cần xử lý dữ liệu âm thanh quy mô lớn với độ trễ thấp.
Song song đó, mô hình MAI-Voice-1 được thiết kế chuyên biệt cho việc tạo ra âm thanh chất lượng cao, cho phép người dùng tạo ra 60 giây âm thanh chỉ trong vòng một giây xử lý. Điểm nổi bật của công cụ này là khả năng hỗ trợ tạo giọng nói tùy chỉnh (custom voice), đáp ứng nhu cầu cá nhân hóa ngày càng cao trong giao tiếp kỹ thuật số. Đối với mảng thị giác, MAI-Image-2 tập trung vào khả năng tạo video, một lĩnh vực đang là tâm điểm chú ý của giới công nghệ toàn cầu sau giai đoạn thử nghiệm thành công trên MAI Playground.
Microsoft định vị các mô hình này theo triết lý Humanist AI, đặt con người vào trung tâm của quá trình phát triển và tối ưu hóa cho các phương thức giao tiếp thực tế. Để gia tăng sức cạnh tranh trong một thị trường đang dần bão hòa, hãng đưa ra chiến lược giá thấp hơn đáng kể so với các đối thủ như Google hay OpenAI. Cụ thể, MAI-Voice-1 có giá từ 22 USD cho 1 triệu ký tự, trong khi MAI-Image-2 áp dụng mức phí 5 USD cho 1 triệu token đầu vào văn bản và 33 USD cho 1 triệu token đầu ra hình ảnh.
Mặc dù tự phát triển các mô hình siêu trí tuệ, Microsoft vẫn khẳng định cam kết trong khoản đầu tư hơn 13 tỷ USD vào OpenAI. Việc tái đàm phán hợp tác gần đây đã mở ra không gian để Microsoft thực sự theo đuổi các nghiên cứu độc lập về siêu trí tuệ, tạo ra một thế chân vạc vững chắc giữa việc tự sản xuất và tận dụng nguồn lực bên ngoài. Hiện tại, tất cả các mô hình mới đã sẵn sàng trên Microsoft Foundry, cho phép các nhà phát triển tiếp cận và tích hợp trực tiếp vào các sản phẩm và trải nghiệm người dùng trong tương lai gần.
Sự xuất hiện của các mô hình MAI đánh dấu một bước ngoặt quan trọng khi Microsoft không còn chỉ đóng vai trò là “bệ đỡ” tài chính hay hạ tầng cho các đơn vị khác, mà đã trực tiếp tham gia vào cuộc đua cốt lõi về mô hình nền tảng. Với ưu thế về chi phí và khả năng tích hợp sâu vào hệ sinh thái sẵn có, bộ ba mô hình này kỳ vọng sẽ tạo ra một tiêu chuẩn mới về hiệu suất cho cộng đồng phát triển AI toàn cầu. Người dùng và doanh nghiệp có thể bắt đầu thử nghiệm các tính năng mới này ngay hôm nay trên nền tảng MAI Playground để tối ưu hóa quy trình làm việc của mình.