TIN TIẾNG ANH
KEY TAKEAWAYS
- Amazon investigates Perplexity AI for potentially violating AWS rules by scraping websites that block such activity.
- Perplexity AI is accused of using AWS to scrape content from restricted websites, as highlighted by reports from Forbes and WIRED.
- Perplexity AI CEO attributes questionable activities to a third-party company, while maintaining that their bot respects the robots.txt protocol in most cases.
Amazon investigates Perplexity AI for potentially violating AWS rules by scraping restricted websites.
Amazon’s cloud division has launched an investigation into the search startup Perplexity AI to determine whether it has violated Amazon Web Services (AWS) rules by scraping websites that attempted to block such activity.
The inquiry follows WIRED and other publications reporting concerns over Perplexity’s practices.
Investigation and Findings
An AWS spokesperson, speaking anonymously to WIRED, confirmed that Amazon is examining whether Perplexity has breached its terms of service by disregarding the Robots Exclusion Protocol.
This web standard prevents automated bots from accessing certain web pages. While this protocol is not legally binding, compliance with a website’s terms of service generally is mandatory.
In particular, Perplexity AI is accused of using AWS infrastructure to scrape content from websites that had explicitly forbidden such actions through their robots.txt files. These allegations came to light after Forbes reported that Perplexity had scraped its content, a claim supported by subsequent investigations from WIRED.
Perplexity AI’s Respons
In response to WIRED’s findings, Perplexity CEO Aravind Srinivas initially dismissed the concerns, claiming a misunderstanding of how the company and the internet operate. He later attributed the questionable scraping activities to a third-party company under a nondisclosure agreement.
Despite the controversy, Perplexity spokesperson Sara Platnick stated that the company has responded to Amazon’s inquiries and maintained that PerplexityBot respects the robots.txt protocol in most cases. However, she acknowledged that the bot would ignore the protocol when a user inputs a specific URL.
Perplexity AI has received backing from the Jeff Bezos family fund and Nvidia. It was recently valued at $3 billion.
TIN TIẾNG VIỆT
Amazon điều tra AI gây bối rối cho các vi phạm quy tắc AWS có thể xảy ra
BÀI HỌC CHÍNH
- Amazon đang điều tra Perplexity AI vì có khả năng vi phạm các quy tắc của AWS bằng cách thu thập dữ liệu từ các trang web chặn hoạt động đó.
- Perplexity AI bị cáo buộc sử dụng AWS để thu thập nội dung từ các trang web bị hạn chế, theo báo cáo từ Forbes và WIRED.
- Giám đốc điều hành AI của Perplexity quy các hoạt động đáng ngờ cho một công ty bên thứ ba, đồng thời khẳng định rằng bot của họ tôn trọng giao thức robots.txt trong hầu hết các trường hợp.
Amazon đang điều tra Perplexity AI vì có khả năng vi phạm các quy tắc của AWS bằng cách thu thập dữ liệu từ các trang web bị hạn chế.
Bộ phận đám mây của Amazon đã mở cuộc điều tra về công ty khởi nghiệp tìm kiếm Perplexity AI để xác định xem công ty này có vi phạm các quy tắc của Amazon Web Services ( AWS ) hay không bằng cách thu thập dữ liệu từ các trang web cố gắng chặn hoạt động như vậy.
Cuộc điều tra diễn ra sau WIRED và các ấn phẩm khác báo cáo mối lo ngại về hoạt động của Perplexity.
Điều tra và Phát hiện
Người phát ngôn của AWS, nói chuyện ẩn danh với WIRED, đã xác nhận rằng Amazon đang xem xét liệu Perplexity có vi phạm các điều khoản dịch vụ của mình hay không bằng cách bỏ qua Giao thức loại trừ robot.
Tiêu chuẩn web này ngăn chặn các bot tự động truy cập vào một số trang web nhất định. Mặc dù giao thức này không có tính ràng buộc về mặt pháp lý nhưng việc tuân thủ các điều khoản dịch vụ của trang web nói chung là bắt buộc.
Đặc biệt, Perplexity AI bị cáo buộc sử dụng cơ sở hạ tầng AWS để lấy nội dung từ các trang web đã cấm rõ ràng những hành động như vậy thông qua tệp robots.txt của họ. Những cáo buộc này được đưa ra ánh sáng sau khi Forbes báo cáo rằng Perplexity đã loại bỏ nội dung của nó, một tuyên bố được hỗ trợ bởi các cuộc điều tra tiếp theo từ WIRED.
Phản hồi của AI bối rối
Để đáp lại những phát hiện của WIRED, Giám đốc điều hành Perplexity Aravind Srinivas ban đầu bác bỏ những lo ngại, cho rằng có sự hiểu lầm về cách công ty và Internet hoạt động. Sau đó, ông quy kết các hoạt động thu thập dữ liệu đáng ngờ cho một công ty bên thứ ba theo một thỏa thuận không tiết lộ.
Bất chấp những tranh cãi, người phát ngôn của Perplexity, Sara Platnick, tuyên bố rằng công ty đã trả lời các câu hỏi của Amazon và khẳng định rằng PerplexityBot tôn trọng giao thức robots.txt trong hầu hết các trường hợp. Tuy nhiên, cô thừa nhận rằng bot sẽ bỏ qua giao thức khi người dùng nhập một URL cụ thể.
Perplexity AI đã nhận được sự hỗ trợ từ quỹ gia đình Jeff Bezos và Nvidia. Gần đây, công ty được định giá ở mức 3 tỷ đô la.