今天在公司做日志分析,发现了一个很奇怪的来自国外的蜘蛛,还有个奇怪的名字叫做Ezooms。浏览器标示如下:
Mozilla/5.0 (compatible; Ezooms/1.0; [email protected])
于是去google了一下,发现原来老外也在不解这个是个什么蜘蛛,看起来有自己的名字和网站等等,可是什么信息都没有,而且貌似实际上是不遵守robots.txt 的规定的,非常恶心。
我的这两个ip来自:
208.115.113.85
208.115.113.69
网上分析这个蜘蛛的服务器ip包括:
- 208.115.111.66
- 208.115.111.66
- 208.115.111.68
- 208.115.111.69
- 208.115.111.70
- 208.115.111.71
- 208.115.111.72
- 208.115.111.73
- 208.115.111.74
- 208.115.111.75
- 208.115.113.89
而对于Ezooms.com的whois信息:
Please note: the registrant of the domain name is specified in the "registrant" field. In most cases, GoDaddy.com, LLC is not the registrant of domain names listed in this database. Registered through: GoDaddy.com, LLC (http://www.godaddy.com) Domain Name: EZOOMS.COM Created on: 24-Feb-11 Expires on: 05-Jul-13 Last Updated on: 30-Jun-12 Registrant: SDC 2931 Castle View ST NW Uniontown, Ohio 44685 United States 管理人联系: Hackman, Donald SDC 2931 Castle View ST NW Uniontown, Ohio 44685 United States +1.3309611389 技术联系: Hackman, Donald SDC 2931 Castle View ST NW Uniontown, Ohio 44685 United States +1.3309611389 Domain servers in listed order: NS63.DOMAINCONTROL.COM NS64.DOMAINCONTROL.COM
这种东西完全没有任何价值而且耗费服务器资源和带宽,我相信这个蜘蛛背后肯定是有某些目的,也有人说是用来监视版权等。
但是明显whois有hackman这样的字符,看起来应该不是政府或者正经的行为,还是屏蔽掉吧。于是在采用根据User-agent特征来屏蔽了,起码还算盗亦有道嘛,虚拟主机直接在cpanel屏蔽,或者使用.htacess文件来屏蔽:
RewriteEngine on RewriteCond %{HTTP_USER_AGENT} ^Ezooms RewriteCond %{HTTP_USER_AGENT} ^Ezooms/1.0 RewriteRule ^(.*)$ http://gov.cn/
我使用的是在nginx配置文件中屏蔽,在nginx.conf中的server段加上
if ($http_user_agent ~ Ezooms) { return 403; }
你可能喜欢
本文标题:屏蔽一个奇怪的蜘蛛Ezooms
转载请注明来源,如果喜欢本站可以Feed订阅本站。
技术联系:Hackman 。。。
🙁
蜘蛛可以个人搭建目的搜集有价值信息以备综合利用
确实啊,应该跟数据挖掘什么的有关
我也遇到了类似的情况,决定跟你一样屏蔽
哟,妹子搞代码,难得啊
直接将代码写进 robot.txt 就可以了?
不是的,具体看你什么环境,不是写进robots
http://moz.com/ 是这个网站的蜘蛛。。
恩,精准营销的