OpenAI ra mắt GPT-5.4 với hai phiên bản Pro và Thinking chuyên sâu cho công việc

Thứ Năm vừa qua, OpenAI chính thức giới thiệu GPT-5.4, mô hình nền tảng mới được định vị là công cụ mạnh mẽ và hiệu quả nhất từ trước đến nay dành cho công việc chuyên môn. Hệ sinh thái này bao gồm phiên bản tiêu chuẩn cùng hai biến thể chuyên biệt: GPT-5.4 Thinking tập trung vào khả năng suy luận logic và GPT-5.4 Pro được tối ưu hóa cho hiệu suất xử lý cao. Sự ra đời của dòng mô hình này đánh dấu bước tiến mới trong việc hỗ trợ các tác vụ đòi hỏi sự chính xác và chiều sâu tư duy.

Điểm nhấn đáng chú ý trên phiên bản API là cửa sổ ngữ cảnh (context window) lên tới 1 triệu token, quy mô lớn nhất mà OpenAI từng cung cấp cho người dùng. Cải tiến này không chỉ cho phép xử lý lượng dữ liệu khổng lồ trong một lần truy vấn mà còn đi kèm với sự đột phá về hiệu suất token. GPT-5.4 có khả năng giải quyết các bài toán tương tự thế hệ tiền nhiệm nhưng với số lượng token tiêu thụ ít hơn đáng kể, giúp tối ưu hóa chi phí vận hành.

Trong các bài kiểm tra thực tế, mô hình mới đã thiết lập những kỷ lục ấn tượng tại các bảng xếp hạng về sử dụng máy tính như OSWorld-VerifiedWebArena Verified. Đặc biệt, GPT-5.4 đạt mức điểm 83% trong bài kiểm tra GDPval của OpenAI đối với các tác vụ tri thức chuyên sâu. Tại bảng xếp hạng APEX-Agents của Mercor, mô hình này cũng dẫn đầu về kỹ năng chuyên môn trong lĩnh vực luật pháp và tài chính, khẳng định vị thế trong các môi trường học thuật và doanh nghiệp.

Khả năng thực thi của GPT-5.4 được đánh giá cao khi xây dựng các sản phẩm dài hạn như bản thuyết trình, mô hình tài chínhphân tích pháp lý. Theo các chuyên gia, mô hình không chỉ mang lại hiệu suất hàng đầu mà còn vận hành nhanh hơn với mức chi phí thấp hơn so với các mô hình đối thủ. Điều này giúp các doanh nghiệp dễ dàng tích hợp AI vào quy trình sản xuất mà vẫn đảm bảo được bài toán kinh tế và tốc độ xử lý công việc.

Nỗ lực hạn chế tình trạng ảo giác (hallucination) cũng đạt được bước tiến quan trọng trong bản cập nhật này. So với phiên bản GPT 5.2, GPT-5.4 giảm 33% khả năng sai sót trong các tuyên bố đơn lẻ và giảm 18% tỷ lệ lỗi trong toàn bộ nội dung phản hồi. Sự cải thiện về tính xác thực giúp người dùng yên tâm hơn khi sử dụng AI để trích xuất dữ liệu hoặc thực hiện các báo cáo đòi hỏi sự chuẩn xác tuyệt đối về mặt thông tin.

Về mặt kỹ thuật, OpenAI đã tái cấu trúc cách quản lý lệnh gọi công cụ thông qua hệ thống mới mang tên Tool Search. Thay vì phải liệt kê toàn bộ định nghĩa công cụ trong lời nhắc hệ thống gây tiêu tốn tài nguyên, mô hình sẽ tự động tra cứu định nghĩa khi cần thiết. Cơ chế này giúp các yêu cầu API trở nên nhanh chóng và tiết kiệm hơn, đặc biệt hữu ích trong các hệ thống tích hợp hàng loạt công cụ phức tạp.

Vấn đề an toàn AI cũng được chú trọng thông qua việc đánh giá chuỗi suy luận (chain-of-thought). Các thử nghiệm cho thấy phiên bản GPT-5.4 Thinking ít có khả năng đưa ra thông tin sai lệch về quy trình tư duy của chính nó trong các tác vụ đa bước. Kết quả này cho thấy mô hình không có khả năng che giấu lập luận, giúp việc giám sát an toàn trở nên hiệu quả hơn và đảm bảo tính minh bạch trong quá trình tương tác giữa người và máy.