Anthropic vừa công bố bản cập nhật Claude 3.5 Sonnet với tính năng đột phá: cho phép AI điều khiển máy tính như con người. Tính năng “computer use” (sử dụng máy tính) đang trong giai đoạn thử nghiệm công khai, cho phép các nhà phát triển hướng dẫn Claude thao tác trên máy tính, bao gồm di chuyển chuột, nhấp nút và nhập văn bản, hệt như cách con người vẫn làm.
Trước đó, Microsoft Copilot Vision và ứng dụng ChatGPT của OpenAI đã cho thấy khả năng tương tác với màn hình máy tính. Google cũng tích hợp tính năng tương tự trong ứng dụng Gemini trên điện thoại Android. Tuy nhiên, việc phát hành rộng rãi công cụ cho phép AI tự do thao tác trên máy tính như Anthropic đang làm vẫn là một bước tiến táo bạo. Thậm chí, sản phẩm R1 đầy hứa hẹn của Rabbit, vốn nhắm đến mục tiêu tương tự, vẫn chưa thể ra mắt thị trường.
Dù vậy, Anthropic cũng thận trọng cho biết tính năng “computer use” vẫn đang trong giai đoạn thử nghiệm và có thể gặp lỗi. Công ty khẳng định: “Chúng tôi phát hành sớm để thu thập phản hồi từ các nhà phát triển và hy vọng tính năng này sẽ được cải thiện nhanh chóng.”
Theo nhóm phát triển, Claude vẫn còn nhiều hạn chế, ví dụ như chưa thể thực hiện các thao tác kéo, phóng to/thu nhỏ. Việc “lật trang” dựa trên ảnh chụp màn hình khiến Claude có thể bỏ lỡ các thông báo hoặc hành động diễn ra nhanh.
Phiên bản Claude này cũng được thiết lập để tránh xa mạng xã hội, đồng thời giám sát các hoạt động liên quan đến bầu cử, đăng tải nội dung, đăng ký tên miền web hoặc tương tác với trang web chính phủ.
Bên cạnh tính năng độc đáo trên, Claude 3.5 Sonnet còn được cải thiện đáng kể về hiệu suất, đặc biệt là khả năng lập trình và sử dụng công cụ. Điển hình là điểm số trên SWE-bench Verified tăng từ 33,4% lên 49,0%, vượt qua tất cả các mô hình AI công khai khác, bao gồm cả OpenAI o1-preview.
Với bước đi táo bạo này, Anthropic đang thách thức các ông lớn như OpenAI và Google trong cuộc đua phát triển AI. Liệu đây có phải là tương lai của trợ lý ảo, khi AI có thể tự do tương tác và điều khiển máy tính của chúng ta? Chỉ thời gian mới có câu trả lời.