Trong một đợt hợp tác an ninh mạng gần đây với Mozilla, đội ngũ kỹ thuật của Anthropic đã sử dụng mô hình Claude Opus 4.6 để rà soát mã nguồn của trình duyệt Firefox. Chỉ trong vòng hai tuần, công cụ trí tuệ nhân tạo này đã xác định được 22 lỗ hổng bảo mật riêng biệt, trong đó có 14 lỗi được xếp hạng mức độ nghiêm trọng cao. Quá trình thử nghiệm bắt đầu từ công cụ JavaScript và sau đó mở rộng ra các phần khác của cơ sở dữ liệu mã nguồn phức tạp này.
Nhóm nghiên cứu quyết định chọn Firefox làm đối tượng thử nghiệm vì đây là một trong những dự án mã nguồn mở được kiểm tra kỹ lưỡng và có độ bảo mật cao nhất thế giới. Kết quả cho thấy phần lớn các lỗi đã được khắc phục trong phiên bản Firefox 148 ra mắt vào tháng 2 vừa qua. Một số ít lỗ hổng còn lại đang được đội ngũ kỹ thuật xử lý và dự kiến sẽ hoàn tất trong các bản phát hành tiếp theo.
Một điểm đáng lưu ý là khả năng của Claude Opus nghiêng hẳn về phía phát hiện lỗ hổng thay vì xây dựng các mã khai thác. Mặc dù Anthropic đã chi tới 4.000 USD chi phí API để cố gắng tạo ra các bằng chứng khai thác (proof-of-concept), họ chỉ thành công trong hai trường hợp cụ thể. Điều này cho thấy AI hiện tại đóng vai trò như một công cụ hỗ trợ kiểm thử đắc lực hơn là một tác nhân tấn công tự động hoàn chỉnh.
Sự kiện này khẳng định sức mạnh của các công cụ AI trong việc gia cố an ninh cho các dự án phần mềm cộng đồng, dù đôi khi chúng có thể tạo ra những yêu cầu hợp nhất (merge requests) kém chất lượng. Đối với người dùng cuối, việc chủ động cập nhật trình duyệt lên phiên bản mới nhất là hành động thiết thực nhất để bảo vệ thông tin cá nhân trước các nguy cơ tiềm ẩn vừa được phát hiện.