博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
判断IP是否为爬虫IP
阅读量:6871 次
发布时间:2019-06-26

本文共 813 字,大约阅读时间需要 2 分钟。

方法一:

      通过国外网站验证:http://bot.myip.ms/123.125.71.12

返回结果:

      IP/Domain - 123.125.71.12:

 

Baidu Bot on this IP address - See more at: http://bot.myip.ms/123.125.71.12#sthash.Ax4dx8s5.dpuf

方法二:

      在linux平台下,您可以使用host ip命令反解 ip来判断是否来自Baiduspider的抓取。Baiduspider的hostname

      host :

           [root@baoshan temp]# host 123.125.71.12

          12.71.125.123.in-addr.arpa domain name pointer baiduspider-123-125-71-12.crawl.baidu.com.

方法三:

        windows平台

            C:\Users\user>nslookup 123.125.71.12

            服务器: UnKnown

            Address: 218.241.116.153

           名称: baiduspider-123-125-71-12.crawl.baidu.com

           Address: 123.125.71.12

 

参考资料:

    http://blog.goyiyo.com/archives/1978

    http://bot.myip.ms

 

代码:

#!/bin/bash

cat sourceip.txt | while read ip

do
curl bot.myip.ms/$ip | grep "Bot on this IP address" >> ./a.txt
if [ $? -ne 0 ]; then
echo $ip" NOT" >> result
else
echo $ip" Bot" >> result
fi
done

转载地址:http://efpfl.baihongyu.com/

你可能感兴趣的文章
企业数据库合规的最佳实践
查看>>
Exchange 2003 升级 2010地址列表升级
查看>>
Citrix桌面及应用虚拟化系列之三:活动目录架构准备
查看>>
如何在一台ESXi主机上搭建一整套VSAN集群的环境
查看>>
【iOS-Cocos2d游戏开发之十九】游戏数据存储的四种常用方式NSKeyedArchiver/NSUserDefaults/Write写入/SQLite3...
查看>>
“李开复”危机
查看>>
libvirt 网络
查看>>
python 安装 setuptools Compression requires the (missing) zlib module 的解决方案
查看>>
SVN管理公共代码的方法
查看>>
每日英语:Poor Chinese Schools Tell Students: Bring Your Own Desks
查看>>
HDU 4268
查看>>
IE9中FCKEditor弹出层不好使的解决方法
查看>>
JBOSS java.lang.NoSuchFieldError: TRACE
查看>>
轻量级的jQuery表单验证插件 - HAPPY.js
查看>>
JavaScript 生成Guid
查看>>
jQuery+PHP+MySQL简单无限级联实现
查看>>
互联网创业的准备——版本控制与上线
查看>>
网站推广优化教程100条(SEO,网站关键字优化,怎么优化网站,如何优化网站关键字)...
查看>>
用c++和python写GUI程序(python嵌入方式)
查看>>
Code sample – socket client thread in Python
查看>>