Perplexity Đối Mặt Với Sự Xem Xét Về Những Cáo Buộc Sao Chép

perplexity faces plagiarism scrutiny

Perplexity đang đối mặt với những cáo buộc nghiêm trọng liên quan đến việc sao chép nội dung mà không có sự cho phép. Những hành vi này không chỉ đặt ra vấn đề về đạo đức mà còn kéo theo hệ lụy pháp lý phức tạp. Trong bối cảnh công nghệ AI phát triển nhanh chóng, câu hỏi về quyền sở hữu dữ liệu và cách thức thu thập thông tin trở nên cấp thiết hơn bao giờ hết. Vấn đề này sẽ ảnh hưởng như thế nào đến tương lai của ngành?

Những điểm chính

  • Perplexity bị cáo buộc sao chép nội dung từ các website mà không được phép, vi phạm quy tắc Robots.txt.
  • Cloudflare đã công khai và áp dụng biện pháp kỹ thuật để ngăn chặn bot của Perplexity giả mạo trình duyệt.
  • CEO Perplexity gặp khó khăn khi giải thích về khái niệm plagiarism và nguồn dữ liệu công ty sử dụng.
  • Các nhà xuất bản và cộng đồng mạng bày tỏ lo ngại về đạo đức và pháp lý trong việc thu thập dữ liệu AI.
  • Vấn đề sao chép đặt ra thách thức lớn cho ngành về tiêu chuẩn web và quy định pháp lý tương lai.

Mặc dù được biết đến như một công cụ AI tiên tiến, Perplexity đang đối mặt với những cáo buộc nghiêm trọng về việc sử dụng nội dung mà không được phép, bao gồm việc sao chép dữ liệu từ các website đã chặn AI scraping, khiến công ty chịu sự giám sát chặt chẽ từ cộng đồng và các nhà cung cấp dịch vụ mạng. Cloudflare, một trong những nhà cung cấp dịch vụ mạng lớn nhất, đã công bố nghiên cứu cho thấy Perplexity đã cố tình vượt qua các quy tắc Robots.txt của nhiều trang web nhằm thu thập dữ liệu một cách bất hợp pháp. Họ còn sử dụng các thủ thuật như thay đổi user agent và ASN để che giấu danh tính, khiến việc phát hiện trở nên khó khăn hơn. Hoạt động này diễn ra trên hàng chục nghìn tên miền với hàng triệu yêu cầu truy cập mỗi ngày, gây ảnh hưởng lớn đến hệ sinh thái web.

Phản ứng từ phía Cloudflare không chỉ dừng lại ở việc công khai các hành vi của Perplexity mà còn thực hiện các biện pháp kỹ thuật nhằm ngăn chặn các bot của công ty này tiếp tục hoạt động. Các bot của Perplexity, được phát hiện giả mạo trình duyệt Google Chrome trên macOS, đã bị Cloudflare gỡ khỏi danh sách bot được xác minh, đồng thời áp dụng thêm các phương pháp chặn mới. Hành động này phản ánh sự lo ngại ngày càng tăng trong ngành công nghiệp về việc AI phá vỡ mô hình kinh doanh truyền thống trên internet, đặc biệt khi nhiều nhà xuất bản cảm thấy bị tổn thất do việc thu thập dữ liệu không phép.

Trước đó, Perplexity cũng từng bị cáo buộc sao chép nội dung từ các hãng tin tức mà không xin phép, dẫn đến tranh cãi về đạo đức và pháp lý liên quan đến việc sử dụng dữ liệu cho huấn luyện AI. CEO Aravind Srinivas đã gặp khó khăn khi trả lời câu hỏi về khái niệm plagiarism, làm dấy lên thêm nghi ngờ về nguồn dữ liệu thực sự mà công ty sử dụng. Những tranh luận này đặt ra câu hỏi về tương lai của các tiêu chuẩn web và quy định pháp lý, khi các công ty AI ngày càng dựa vào lượng dữ liệu khổng lồ từ internet trong quá trình phát triển sản phẩm. Qua đó, vấn đề đạo đức và pháp lý trong việc thu thập dữ liệu cho AI vẫn là thách thức lớn đối với toàn ngành.