首 页 | 精品电影 | 音乐天堂 | 在线游戏 | Flash MTV | 三湘书屋 | 幽默笑话 | 三湘图库 | 美女写真 | IT知识库 | QQ贴图 | 加入书签

网页制作网络编程图形图象操作系统冲浪宝典软件教学网络安全认证考试通信技术电子商务业内动态书籍教程原码

最近更新 文章分类 多媒体类 精品软件

本站搜索:
您的位置:三湘时空 -> IT知识库 -> 文章分类 -> 心得技巧 -> 如何防止robot骚扰你的网页
如何防止robot骚扰你的网页


文章类别:心得技巧 来源: 作者: 发表日期:2006-9-29 字体:[ ]

小游戏 | 在线影院 | 幽默笑话 | 源码下载 | Flash MTV | 音乐试听 | 书屋 | 美女写真

今早在www.aspalliance.com上看到一篇文章(Stopping Automated Web Robots Visiting ASP/ASP.NET Websites
http://aspalliance.com/1018_Stopping_Automated_Web_Robots_Visiting_ASPASPNET_Websites),
主要是讲了下如何采取一些措施,防止robot过度去抓你的网站。看了一下,有的东西还是值得探讨下的,现归纳如下:

1、辨认ROBOT的一些参考标准
    Large numbers of requests from a single IP address or a range of IP addresses within the same subnet (i.e. the first three numbers of the IP address are identical).
·         Large numbers of requests for database driven content compared to the rest of the website.

·         Many requests made from browsers that do not support ASP Sessions.

·         Lots of and increasing numbers of website visitors, but no corresponding increase in transactions (e.g. sales!).

·         Large numbers of spam or automated requests being generated from online forms.
2、到http://www.robotstxt.org/wc/norobots.html上,可以找到一个组织提出的防御robot的建议标准(可惜这个不是什么权威标准拉,没什么约束力),在这里有一些平常我们可以用到的例子和方法,主要是搞一个robot.txt文件,放在网站根目录下,比如
User-agent: *
Disallow: /
禁止所有robot


允许所有的robot访问:

User-agent: *
Disallow:

User-agent: *
Disallow: /cyberworld/map/      不允许robot探访/cyberworld/map目录下的文件


User-agent: cybermapper    允许cybermapper这个robot
Disallow:

User-agent: *
Disallow: /cyberworld/map/
Disallow: /tmp/
Disallow: /foo.html       不允许访问foo.html这个文件了

3、如果不方便设置robot.txt的话,还可以在meta里做手脚,比如用

可以单独对某页设置防御robot

4 减慢robot的疯狂访问。如果发现robot疯狂对你的站访问,而造成效率的降低的话,可以减低
robot的访问,
User-agent: Slurp
Crawl-delay: 10

是针对yahoo的,具体可以到http://help.yahoo.com/help/us/ysearch/slurp/slurp-03.html
去看详细情况。
   但其实有的robot很智能的,有时不会那么蠢真的一拥而上地去访问。

5、如果发现不单是ROBOT,是有恶意的攻击某页的话,文章中说可以找

http://www.peterblum.com/VAM/VISETools.aspx#SDM.
这个工具试试

   当然,之前好象CNBLOGS也受到ROBOT的困扰,因此欢迎各位多发表意见,提下自己的一些
办法。

上一篇:asp.net 2的文件上传 下一篇:清除Windows系统里未知的自启动程序
本栏目热门文章
·Q-Zone空间实用代码三例 2005-10-8
·利用Google Map API在BLOG上显示自己的Google 2006-3-28
·WAP标记语言XHTML基础教程之XHTML简介 2005-10-4
·Google Maps API 简易使用文件 2005-10-9
·网页设计中文字颜色的搭配技巧 2005-10-8
·介绍三种网页播放器好代码 2006-4-16
·RSS 开发教程 2005-10-4
·菜鸟必看 Windows回收站使用攻略 2005-12-13
·初学网站制作须知道什么是静态网页 2006-5-4
·网页设计中的功能与美化 2005-10-4
新近更新文章
·如何防止robot骚扰你的网页 2006-9-29
·下拉菜单遮挡层的解决方案 2006-9-8
·获得网页控件方法大全 2006-9-8
·正则表达式过滤HTML危险脚本 2006-9-8
·正则表达式语法 2006-9-1
·如何隐藏网页中的层DIV 2006-9-1
·网页制作IE功能汇总 2006-9-1
·让广告代码不再影响你的网页加载速度 2006-8-29
·网页屏蔽(左右键,代码等)的非JS方法 2006-8-29
·两分钟做个xhtml+css的网站首页 2006-8-23
首 页 | 软件发布 | 广告联系 | 下载帮助 | 意见反馈 | 网站地图
  CopyRight? 2002-2004 WWW.SXSKY.NET? All Rights Reserved
三湘时空 站长QQ:82675303 Email: