加入收藏 | 设为首页 | 会员中心 | 我要投稿 湖南网 (https://www.hunanwang.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 移动互联 > 正文

百度蜘蛛Baiduspider的真假如何分辨

发布时间:2020-09-30 13:08:48 所属栏目:移动互联 来源:网络整理
导读:在windows平台可能IBMOS/2平台下,您可以行使nslookupip呼吁反解ip来判定是否来自Baiduspider的抓

现实上,我们的日记中,有许多的baiduspider是他人伪装的,要想办理这个题目。我们必需在验证baiduspider真伪上下工夫,这篇文章具体的先容了爬虫的辨别要领。

我们在按照网站日记说明搜刮引擎蜘蛛抓取网页的记录时,现实上许多站点都是有一些伪装称baiduspider的到访者的。这些数据会严峻影响我们对日记说明后的判定。

这些到访者,为什么会伪装为baiduspider来会见我们的网站呢?最典范的就是收罗你内容的那些人。他们知道许多器材是可以或许看到哪些ip会见网站的量过大的。譬喻某一个ip本日会见你网站1万次,那正常吗?必定是不正常的。但他要是baiduspdier呢?呵呵,那就正常了。

Mozilla/5.0(compatible;Baiduspider/2.0;+)

Mozilla/5.0(compatible;Baiduspider-render/2.0;+)

Mozilla/5.0(Linux;u;Android4.2.2;zh-cn;)AppleWebKit/534.46(KHTML,likeGecko)Version/5.1MobileSafari/10600.6.3(compatible;Baiduspider/2.0;+)

Mozilla/5.0(iPhone;CPUiPhoneOS9_1likeMacOSX)AppleWebKit/601.1.46(KHTML,likeGecko)Version/9.0Mobile/13B143Safari/601.1(compatible;Baiduspider-render/2.0;+)

如上是包括了百度的通例爬虫,和渲染爬虫render的。这两个爬虫的区别符已经用赤色字体标出来了。

可以通过DNS反查方法来办理这个题目。按照平台差异验证要领差异,如linux/windows/os三种平台下的验证要领别离如下:

1、在linux平台下,您可以行使hostip呼吁反解ip来判定是否来自Baiduspider的抓取。Baiduspider的hostname以.baidu.com或.baidu.jp的名目定名,非.baidu.com或.baidu.jp即为假充。

2、在windows平台可能IBMOS/2平台下,您可以行使nslookupip呼吁反解ip来判定是否来自Baiduspider的抓取。打开呼吁处理赏罚器输入nslookupxxx.xxx.xxx.xxx(IP地点)就能理会ip,来判定是否来自Baiduspider的抓取,Baiduspider的hostname以.baidu.com或.baidu.jp的名目定名,非.baidu.com或.baidu.jp即为假充。

3、在macos平台下,您可以行使dig呼吁反解ip来判定是否来自Baiduspider的抓取。打开呼吁处理赏罚器输入digxxx.xxx.xxx.xxx(IP地点)就能理会ip,来判定是否来自Baiduspider的抓取,Baiduspider的hostname以.baidu.com或.baidu.jp的名目定名,非.baidu.com或.baidu.jp即为假充。

(编辑:湖南网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读