OpenAI vừa công bố o3-pro, phiên bản nâng cấp đáng chú ý của mô hình suy luận AI o3 với khả năng giải quyết vấn đề được cải thiện vượt trội. Model mới này đã vượt qua người tiền nhiệm trong nhiều bài kiểm tra khác nhau, đặc biệt xuất sắc ở các lĩnh vực khoa học, giáo dục và lập trình. Tuy nhiên, những gì thực sự đáng quan tâm là cách o3-pro có thể thay đổi cách chúng ta tiếp cận các bài toán phức tạp.
Những điểm chính
- o3-pro là mô hình AI reasoning mạnh mẽ nhất của OpenAI, phiên bản nâng cấp của o3 phát hành năm 2025
- Model có mặt cho người dùng ChatGPT Pro và Team từ 10/6/2025, Enterprise và Edu tuần tiếp theo
- Định giá 20 USD cho một triệu input tokens và 80 USD cho một triệu output tokens
- Vượt trội hơn o3 trong tất cả categories và beats Google Gemini 2.5 Pro, Anthropic Claude 4 Opus
- Hoạt động qua phương pháp giải quyết vấn đề từng bước nhưng thời gian response có thể chậm hơn
OpenAI vừa ra mắt o3-pro, mô hình AI reasoning mạnh mẽ nhất của hãng cho đến nay. Đây là phiên bản nâng cấp của model o3 được phát hành trước đó trong năm 2025, hoạt động thông qua phương pháp giải quyết vấn đề từng bước để cải thiện độ tin cậy.
Model mới này có mặt cho người dùng ChatGPT Pro và Team từ ngày 10 tháng 6 năm 2025, trong khi các khách hàng Enterprise và Edu sẽ được truy cập vào tuần tiếp theo. O3-pro thay thế hoàn toàn model o1-pro trước đó trong bộ chọn model của platform.
Về mặt pricing, o3-pro được định giá 20 USD cho một triệu input tokens và 80 USD cho một triệu output tokens. Để hiểu rõ hơn, một triệu input tokens tương đương khoảng 750,000 từ, trong đó input tokens là dữ liệu được đưa vào model và output tokens là các response được tạo ra.
Các đánh giá từ chuyên gia cho thấy o3-pro được ưa chuộng hơn so với o3 trong tất cả categories được test. Model mới thể hiện sự vượt trội trong các lĩnh vực science, education, programming, business và writing help. Reviewers đánh giá cao o3-pro về độ clarity, đầy đủ, instruction-following và accuracy.
Trên các benchmark phổ biến, o3-pro đạt điểm số cao trong quá trình internal testing. Model này vượt qua Google’s Gemini 2.5 Pro trên AIME 2024 math skills evaluation và surpass Anthropic’s Claude 4 Opus trên GPQA Diamond test dành cho PhD-level science knowledge.
Tuy nhiên, o3-pro cũng có một số limitations. Temporary chats với o3-pro hiện đang bị disable do technical issues. Model không thể generate images hoặc sử dụng Canvas feature. Users có thể gặp phải thời gian response chậm hơn so với o1-pro, nhưng điều này được bù đắp bằng khả năng reasoning và problem-solving vượt trội. O3-pro cũng có quyền truy cập vào nhiều tools khác nhau để tăng cường functionality.