GPT-4o mini: Đột phá về trí tuệ nhân tạo hiệu quả chi phí

OpenAI cam kết phổ cập trí tuệ nhân tạo rộng rãi nhất có thể. Hôm nay, chúng tôi công bố GPT-4o mini, mô hình nhỏ hiệu quả nhất về chi phí của chúng tôi. Chúng tôi hy vọng GPT-4o mini sẽ mở rộng đáng kể phạm vi ứng dụng được xây dựng bằng AI bằng cách khiến trí tuệ nhân tạo trở nên dễ tiếp cận hơn nhiều. GPT-4o mini đạt điểm 82% trên MMLU và hiện đang vượt trội hơn GPT-41 về mức độ yêu thích trong các cuộc trò chuyện trên [bảng xếp hạng LMSYS(mở trong cửa sổ mới)](https://arena.lmsys.org/). Nó có giá 15 xu cho mỗi triệu mã thông báo đầu vào và 60 xu cho mỗi triệu mã thông báo đầu ra, rẻ hơn một bậc so với các mô hình tiên tiến trước đây và rẻ hơn 60% so với GPT-3.5 Turbo.

GPT-4o mini cho phép thực hiện nhiều loại tác vụ với chi phí thấp và độ trễ thấp, chẳng hạn như các ứng dụng kết nối hoặc song song hóa nhiều lệnh gọi mô hình (ví dụ: gọi nhiều API), chuyển một lượng lớn ngữ cảnh đến mô hình (ví dụ: cơ sở mã đầy đủ hoặc lịch sử hội thoại), hoặc tương tác với khách hàng thông qua phản hồi văn bản nhanh chóng, theo thời gian thực (ví dụ: chatbot hỗ trợ khách hàng).

Hiện tại, GPT-4o mini hỗ trợ văn bản và hình ảnh trong API, với hỗ trợ cho đầu vào và đầu ra văn bản, hình ảnh, video và âm thanh sẽ ra mắt trong tương lai. Mô hình có cửa sổ ngữ cảnh là 128 nghìn mã thông báo, hỗ trợ tối đa 16 nghìn mã thông báo đầu ra cho mỗi yêu cầu và có kiến thức đến tháng 10 năm 2023. Nhờ bộ mã hóa được cải thiện được chia sẻ với GPT-4o, việc xử lý văn bản không phải tiếng Anh giờ đây thậm chí còn hiệu quả hơn về chi phí.

Mô hình nhỏ với trí thông minh văn bản và lý luận đa phương thức vượt trội

GPT-4o mini vượt qua GPT-3.5 Turbo và các mô hình nhỏ khác về điểm chuẩn học thuật trên cả trí thông minh văn bản và lý luận đa phương thức, đồng thời hỗ trợ cùng phạm vi ngôn ngữ như GPT-4o. Nó cũng thể hiện hiệu suất mạnh mẽ trong việc gọi hàm, cho phép các nhà phát triển xây dựng các ứng dụng tìm nạp dữ liệu hoặc thực hiện hành động với các hệ thống bên ngoài và cải thiện hiệu suất ngữ cảnh dài so với GPT-3.5 Turbo.

GPT-4o mini đã được đánh giá trên một số điểm chuẩn chính2.

Nhiệm vụ lập luận: GPT-4o mini tốt hơn các mô hình nhỏ khác trong các nhiệm vụ lập luận liên quan đến cả văn bản và hình ảnh, đạt 82,0% trên MMLU, một điểm chuẩn về trí thông minh văn bản và lập luận, so với 77,9% của Gemini Flash và 73,8% của Claude Haiku. Năng lực toán học và lập trình: GPT-4o mini vượt trội trong các nhiệm vụ lập luận toán học và lập trình, vượt qua các mô hình nhỏ trước đây trên thị trường. Trên MGSM, đo lường lý luận toán học, GPT-4o mini đạt 87,0%, so với 75,5% của Gemini Flash và 71,7% của Claude Haiku. GPT-4o mini đạt 87,2% trên HumanEval, đo lường hiệu suất mã hóa, so với 71,5% của Gemini Flash và 75,9% của Claude Haiku.   Lý luận đa phương thức: GPT-4o mini cũng cho thấy hiệu suất mạnh mẽ trên MMMU, một đánh giá lý luận đa phương thức, đạt 59,4% so với 56,1% của Gemini Flash và 50,2% của Claude Haiku.

Điểm đánh giá mô hình

Là một phần của quy trình phát triển mô hình của mình, chúng tôi đã làm việc với một số đối tác đáng tin cậy để hiểu rõ hơn về các trường hợp sử dụng và hạn chế của GPT-4o mini. Chúng tôi đã hợp tác với các công ty như Ramp(mở trong cửa sổ mới) và Superhuman(mở trong cửa sổ mới) người thấy GPT-4o mini hoạt động tốt hơn đáng kể so với GPT-3.5 Turbo cho các tác vụ như trích xuất dữ liệu có cấu trúc từ tệp biên lai hoặc tạo phản hồi email chất lượng cao khi được cung cấp lịch sử luồng.

Các biện pháp an toàn tích hợp

An toàn được tích hợp vào các mô hình của chúng tôi ngay từ đầu và được củng cố ở mọi bước trong quy trình phát triển của chúng tôi. Trong quá trình đào tạo trước, chúng tôi loại bỏ(mở trong cửa sổ mới) thông tin mà chúng tôi không muốn mô hình của mình học hỏi hoặc xuất ra, chẳng hạn như ngôn từ kích động thù địch, nội dung người lớn, trang web chủ yếu tổng hợp thông tin cá nhân và thư rác. Trong quá trình đào tạo sau, chúng tôi điều chỉnh hành vi của mô hình theo chính sách của chúng tôi bằng cách sử dụng các kỹ thuật như học tăng cường với phản hồi của con người (RLHF) để cải thiện độ chính xác và độ tin cậy của phản hồi của mô hình.

GPT-4o mini có các biện pháp giảm thiểu an toàn tích hợp giống như GPT-4o, mà chúng tôi đã đánh giá cẩn thận bằng cả đánh giá tự động và đánh giá của con người theo Khung chuẩn bị và phù hợp với cam kết tự nguyện của chúng tôi. Hơn 70 chuyên gia bên ngoài trong các lĩnh vực như tâm lý xã hội và thông tin sai lệch đã thử nghiệm GPT-4o để xác định các rủi ro tiềm ẩn, mà chúng tôi đã giải quyết và có kế hoạch chia sẻ chi tiết trong thẻ hệ thống GPT-4o và bảng điểm Chuẩn bị sắp tới. Thông tin chi tiết từ các đánh giá của chuyên gia này đã giúp cải thiện tính an toàn của cả GPT-4o và GPT-4o mini.

Dựa trên những bài học kinh nghiệm này, các nhóm của chúng tôi cũng đã làm việc để cải thiện tính an toàn của GPT-4o mini bằng cách sử dụng các kỹ thuật mới được thông báo bởi nghiên cứu của chúng tôi. GPT-4o mini trong API là mô hình đầu tiên áp dụng phương pháp phân cấp hướng dẫn(mở trong cửa sổ mới) của chúng tôi, giúp cải thiện khả năng chống lại việc bẻ khóa, tiêm lời nhắc và trích xuất lời nhắc hệ thống của mô hình. Điều này làm cho phản hồi của mô hình đáng tin cậy hơn và giúp sử dụng an toàn hơn trong các ứng dụng ở quy mô lớn.

Chúng tôi sẽ tiếp tục theo dõi cách GPT-4o mini đang được sử dụng và cải thiện tính an toàn của mô hình khi chúng tôi xác định được các rủi ro mới.

Tính khả dụng và giá cả

GPT-4o mini hiện có sẵn dưới dạng mô hình văn bản và hình ảnh trong API Trợ lý, API Hoàn thành Trò chuyện và API Hàng loạt. Các nhà phát triển trả 15 xu cho mỗi 1 triệu mã thông báo đầu vào và 60 xu cho mỗi 1 triệu mã thông báo đầu ra (tương đương khoảng 2.500 trang trong một cuốn sách tiêu chuẩn). Chúng tôi có kế hoạch triển khai tinh chỉnh cho GPT-4o mini trong những ngày tới.

Trong ChatGPT, người dùng gói Liên hệ: 0981.243.678, Plus và Team sẽ có thể truy cập GPT-4o mini bắt đầu từ hôm nay, thay cho GPT-3.5. Người dùng Doanh nghiệp cũng sẽ có quyền truy cập bắt đầu từ tuần sau, phù hợp với sứ mệnh của chúng tôi là mang lại lợi ích của AI cho tất cả mọi người.

Tiếp theo là gì

Trong vài năm qua, chúng ta đã chứng kiến ​​những tiến bộ vượt bậc về trí thông minh AI kết hợp với việc giảm đáng kể chi phí. Ví dụ, chi phí cho mỗi mã thông báo của GPT-4o mini đã giảm 99% kể từ text-davinci-003, một mô hình kém khả năng hơn được giới thiệu vào năm 2022. Chúng tôi cam kết tiếp tục quỹ đạo này là giảm chi phí đồng thời tăng cường khả năng của mô hình.

Chúng tôi hình dung một tương lai nơi các mô hình được tích hợp liền mạch trong mọi ứng dụng và trên mọi trang web. GPT-4o mini đang mở đường cho các nhà phát triển xây dựng và mở rộng quy mô các ứng dụng AI mạnh mẽ hiệu quả và hợp lý hơn. Tương lai của AI đang trở nên dễ tiếp cận, đáng tin cậy và được nhúng trong trải nghiệm kỹ thuật số hàng ngày của chúng ta, và chúng tôi rất vui mừng được tiếp tục dẫn đầu.