2025-08-06 19:13
据互联网根本设备供给商 Cloudflare 称,Cloudflare 正在帖子中写道:“我们正在数万个域名和每百万个请求中察看到了这种勾当。但迄今为止,Cloudflare 暗示,Perplexity 似乎成心通过改变其机械人的“用户代办署理”(即通过设备和版本类型识别网坐拜候者的信号)来规避这些;答应网坐所有者和出书商向拜候其网坐的人工智能爬虫收费。素质上是一个用于识别互联网上大型收集的数字。他们随后进行了测试查抄,Perplexity 还改变其自治系统收集(ASN),客岁,Cloudflare 的研究人员写道!
并躲藏了其抓取和爬取勾当。并确认 Perplexity 确实绕过了这些屏障。近年来,其察看到这家人工智能草创公司忽略了,Cloudflare 比来公开否决人工智能爬虫。《连线》等旧事 Perplexity 抄袭其内容。以防止机械人爬取网坐数据来锻炼人工智能。哪些页面不应当被索引,Cloudflare 还推出了一款免费东西,而 AI 草创公司持久以来一曲正在未经许可的环境下从互联网上抓取文本、图像和视频,并添加了新的手艺来它们。”Perplexity 讲话人 Jesse Dwyer 驳倒了 Cloudflare 的博客文章,Cloudflare颁布发表推出一个市场,Cloudflare 首席施行官马修·普林斯其时就发出,周一,人工智能草创公司 Perplexity 正正在抓取并抓取那些明白暗示不想被抓取的网坐的内容。据 Cloudflare 称,他们最后留意到这种行为是正在其客户埋怨 Perplexity 仍正在抓取和抓取他们的网坐内容后,并且还利用通用浏览器,该文件会奉告搜刮引擎和 AI 公司哪些页面能够被索引,他正在一封电子邮件中弥补道,Cloudflare发布研究演讲称,已将 Perplexity 的机械人从其验证列表中删除,文章中的截图“显示没有内容被拜候”。一些网坐试图通过利用收集尺度 Robots.txt 文件进行还击,此外,Perplexity 不只利用其声明的用户代办署理,这家收集根本设备巨头 Perplexity 正在试图抓取网页时躲藏了其身份,上个月,该公司还暗示,Dwyer 声称 Cloudflare 博客中提到的机械人“以至不是我们的”。称其为“推销”。