Claude 3.5 Sonnet: Nâng tầm trí tuệ nhân tạo với tốc độ vượt trội

Hôm nay, Anthropic chính thức ra mắt Claude 3.5 Sonnet, phiên bản đầu tiên trong dòng sản phẩm Claude 3.5 sắp tới. Claude 3.5 Sonnet thiết lập tiêu chuẩn mới cho ngành AI với trí thông minh vượt trội, đánh bại các mô hình cạnh tranh và cả Claude 3 Opus trong nhiều bài kiểm tra, nhưng vẫn giữ được tốc độ và chi phí của mô hình tầm trung.

Người dùng có thể trải nghiệm Claude 3.5 Sonnet miễn phí trên Claude.ai và ứng dụng Claude iOS. Người đăng ký gói Claude Pro và Team được hưởng lợi từ giới hạn tốc độ cao hơn đáng kể. Mô hình này cũng có sẵn thông qua Anthropic API, Amazon Bedrock và Vertex AI của Google Cloud với giá 3 đô la cho mỗi triệu token đầu vào và 15 đô la cho mỗi triệu token đầu ra, với cửa sổ ngữ cảnh 200.000 token.

Trí tuệ đột phá với tốc độ gấp đôi

Claude 3.5 Sonnet thiết lập các tiêu chuẩn mới cho ngành về khả năng lập luận cấp độ sau đại học (GPQA), kiến thức cấp độ đại học (MMLU) và năng lực lập trình (HumanEval). Mô hình này cho thấy sự cải thiện rõ rệt trong việc nắm bắt sắc thái, sự hài hước và các hướng dẫn phức tạp, đồng thời có khả năng viết nội dung chất lượng cao với giọng văn tự nhiên, dễ hiểu.

Claude 3.5 Sonnet hoạt động với tốc độ gấp đôi so với Claude 3 Opus. Sự gia tăng hiệu suất này, kết hợp với giá cả phải chăng, khiến Claude 3.5 Sonnet trở nên lý tưởng cho các tác vụ phức tạp như hỗ trợ khách hàng theo ngữ cảnh và điều phối quy trình làm việc nhiều bước.

Trong một bài kiểm tra lập trình nội bộ, Claude 3.5 Sonnet đã giải quyết được 64% số vấn đề, vượt trội so với Claude 3 Opus (38%). Bài kiểm tra đánh giá khả năng sửa lỗi hoặc thêm chức năng vào mã nguồn mở của mô hình, dựa trên mô tả bằng ngôn ngữ tự nhiên về cải tiến mong muốn.

Khi được hướng dẫn và cung cấp các công cụ phù hợp, Claude 3.5 Sonnet có thể tự viết, chỉnh sửa và thực thi mã với khả năng lập luận và xử lý sự cố tinh vi. Mô hình này xử lý việc dịch mã một cách dễ dàng, giúp nó đặc biệt hiệu quả trong việc cập nhật các ứng dụng cũ và di chuyển cơ sở mã.

Thị giác vượt trội

Claude 3.5 Sonnet là mô hình thị giác mạnh mẽ nhất của Anthropic cho đến nay, vượt qua Claude 3 Opus về các tiêu chuẩn thị giác tiêu chuẩn. Những cải tiến vượt bậc này được nhận thấy rõ ràng nhất đối với các tác vụ yêu cầu lập luận trực quan, chẳng hạn như diễn giải biểu đồ.

Claude 3.5 Sonnet cũng có thể sao chép chính xác văn bản từ hình ảnh không hoàn hảo – một khả năng cốt lõi cho bán lẻ, logistics và dịch vụ tài chính, nơi AI có thể thu thập thêm thông tin chi tiết từ hình ảnh, đồ họa hoặc hình minh họa hơn là chỉ từ văn bản.

Artifacts – Cách thức mới để sử dụng Claude

Bên cạnh đó, Anthropic cũng giới thiệu Artifacts trên Claude.ai, một tính năng mới mở rộng cách người dùng tương tác với Claude. Khi người dùng yêu cầu Claude tạo nội dung như đoạn mã, tài liệu văn bản hoặc thiết kế trang web, Artifacts sẽ xuất hiện trong một cửa sổ chuyên dụng cùng với cuộc trò chuyện của họ.

Điều này tạo ra một không gian làm việc năng động, nơi họ có thể xem, chỉnh sửa và xây dựng dựa trên các sáng tạo của Claude trong thời gian thực, tích hợp liền mạch nội dung do AI tạo ra vào các dự án và quy trình làm việc của họ.

Tính năng xem trước này đánh dấu sự phát triển của Claude từ một AI đàm thoại thành một môi trường làm việc cộng tác. Đây mới chỉ là sự khởi đầu của một tầm nhìn rộng lớn hơn cho Claude.ai, nơi sẽ sớm mở rộng để hỗ trợ cộng tác nhóm.

Trong tương lai gần, các nhóm — và cuối cùng là toàn bộ tổ chức — sẽ có thể tập trung kiến thức, tài liệu và công việc đang diễn ra của họ một cách an toàn trong một không gian chung, với Claude đóng vai trò là đồng đội theo yêu cầu.

Cam kết về an toàn và quyền riêng tư

Các mô hình của Anthropic đều phải trải qua quá trình kiểm tra nghiêm ngặt và được đào tạo để giảm thiểu việc sử dụng sai mục đích.

Mặc dù Claude 3.5 Sonnet có bước nhảy vọt về trí thông minh, nhưng các đánh giá của nhóm red teaming đã kết luận rằng Claude 3.5 Sonnet vẫn ở mức ASL-2.

Là một phần trong cam kết về an toàn và minh bạch, Anthropic đã hợp tác với các chuyên gia bên ngoài để kiểm tra và tinh chỉnh các cơ chế an toàn trong mô hình mới nhất này.

Một trong những nguyên tắc cốt lõi hướng dẫn Anthropic phát triển mô hình AI là quyền riêng tư. Anthropic không đào tạo các mô hình tổng quát của mình trên dữ liệu do người dùng gửi trừ khi người dùng cho phép Anthropic làm như vậy. Cho đến nay, Anthropic chưa sử dụng bất kỳ dữ liệu nào của khách hàng hoặc do người dùng gửi để đào tạo các mô hình tổng quát của mình.

Sắp ra mắt

Mục tiêu của Anthropic là cải thiện đáng kể đường cong đánh đổi giữa trí thông minh, tốc độ và chi phí sau mỗi vài tháng. Để hoàn thiện dòng sản phẩm Claude 3.5, Anthropic sẽ phát hành Claude 3.5 Haiku và Claude 3.5 Opus vào cuối năm nay.

Ngoài việc phát triển dòng sản phẩm thế hệ tiếp theo, Anthropic đang phát triển các phương thức và tính năng mới để hỗ trợ nhiều trường hợp sử dụng hơn cho doanh nghiệp, bao gồm tích hợp với các ứng dụng doanh nghiệp.

Nhóm của Anthropic cũng đang khám phá các tính năng như Memory, cho phép Claude ghi nhớ sở thích và lịch sử tương tác của người dùng theo quy định, giúp trải nghiệm của họ thậm chí còn được cá nhân hóa và hiệu quả hơn.