百度百科屏蔽谷歌/必应等搜索引擎 防止内容被抓取训练AI
2024-08-28 18:36:16
来源:快科技
0
近日百度百科开始屏蔽谷歌和必应等大多数搜索引擎,预计是为了阻止这些搜索引擎和其他爬虫,未经授权抓取百度百科的内容用于训练AI。
百度百科的robots.txt文件显示,目前仅有百度搜索、搜狗搜索、中国搜索(Chinaso)、YYSpider和宜搜搜索(EasouSpider)等少数几个搜索引擎被允许抓取其内容。
谷歌搜索、必应搜索、微软MSN、UC浏览器的Yisouspider以及其他一切搜索引擎爬虫均被明确禁止抓取百度百科的内容。
虽然360搜索没有在封禁列表中单独列出,但百度百科的策略是禁止一切非白名单爬虫抓取,所以360搜索和其他搜索引擎也都是被屏蔽的。
不过百度百科这种做法其实也只是防君子不防小人,肯定还有很多爬虫通过各种方式继续抓取内容然后拿去训练AI。
相关内容
标签:百度
百度已有18%搜索结果由AI生成:更加准确了!
2024-08-26
0
百度Q2财报:季度总营收339亿元 核心营收267亿元
2024-08-22
0
百度健康发布智能体家族:让大家看得起病看得好病
2024-07-23
0
传百度公关一号位已确认!曾凭高考作文《赤兔之死》一举成名
2024-07-18
0
手游推荐
皇者-0.1折GM刷充版
经典传奇,皇者回归
经典传奇,皇者回归!本游戏承诺所有充值均为0.1折!游戏独创第四职业魔神,上线送万元充值卡登陆就送,更有每日登录领取真充卡,零元党也可以玩的很开心!游戏不但还原了经典的传奇特色,更加入了一些创新元素!让您和您的那些兄弟驰骋沙城,称霸全服!
热门评论
全部评论
还没有评论,快来抢沙发~