2018-06-21

随意修改robots.txt 不利于搜索引擎收录你的站

Robots.txt是用来告诉bot的访问权限，因Robots.txt协议并不是一个规范，而只是约定俗成的，通常大多数搜索引擎会识别这个元数据，不索引这个页面，以及这个页面的链出页面，使用方法是将robots.txt文件放在网站根目录下。举例来说，当搜索引擎访问一个网站（比如http://www.chinaz.com）时，通常首先会检查该网站中是否存在robots.txt这个文件，如果机器人找到这个文件，它就会根据这个文件的内容，来确定它访问权限的范围。闲话不扯了，进入正题：

经本人的试验，对于一个遵守Robots.txt协议的蜘蛛，如果你修改Robots.txt过于频繁，可直接导致将你的站冷处理！本人的站就已进入该黑洞了，之前百由于不想让百度蜘蛛收录商品列表的老页面，就直接B了百度蜘蛛访问此页，过了约3天，效果果真明显，小CO还暗喜这蜘蛛真听话，于是乎又想到网站内之前使用的几个页面。现在也用不上了，而此前已被搜索引擎收录了N多页，现在一起B了，于是修改了Robots.txt，这一改不要紧，两于过去了，小CO再也高兴不起来了，可爱的百度蜘蛛再也不哪么勤快了（之前每天在站内爬2万以上），现在几天也不到2万，晕死。。。上了当就得找原因：上边说过了，一旦B了某个页面，蜘蛛就不索引这个页面，以及这个页面的链出页面，偶的就中永川网站建设公司了这个奖了！很多人放出了他们自己修改的robots.txt文件，但都忽略了百度蜘蛛的爬行规律：并不是进入一个版块后，就按照人类思维，按文章列表顺序爬行的，我从自己的站点，已经证实这个问题：

比如文章列表第一篇爬完后，并不是接着爬第二篇，而是从第一个篇内容页中的热点文章等继续爬（这就要求站内的贯通性较好！）。从DZ官站的收录页URL就可以看出这个点，如果随意屏蔽阳江网站建设公司/forum.php?mod=redirect* 或者/forum-redirect*这样的路径，可能会导致大部分网页不被收录。

不要用人的思维习惯来判断蜘蛛程序的规律。很多站长放了robots.txt后，就发现百度很少收录自己的内页，很可能就是这个原因。所以用robots.txt文件来解决重复收录问题，是很危险的，从程序上做根本解决才是上策！小CO是上当了。希望有？

（站长网首发，作者http://www.tok8.cn转载请注明出处）

南京牧狼文化传媒有限公司简介：

牧狼传媒，牧者之心，狼者之性，以牧之谦卑宽容之心待人，以狼之团结无畏之性做事！

　　公司注册资金100万，主营众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放以及电商营销推广全案等相关业务，致力于为客户提供更有价值的服务,创造让用户满意的效果！

　　为百度官方及其大客户、苏宁易购、金山WPS秀堂、美的、创维家电、新东方在线、伊莱克斯、宝丽莱等国内国外知名品牌服务过，服务经验丰富！同时，公司也是南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位，可以为您提供更好的服务！

　　主营项目：众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放、竞价托管、网站优化、电商代运营等

　　合作客户：百度、苏宁易购、饿了么、美的、创维家电、新东方在线、宝丽莱、金山WPS秀堂、伊莱克斯

　　资质荣誉：百度商业服务市场2017年度最佳图片服务商、南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位、八戒通TOP服务商、"易拍即合杯"H5创意大赛"三等奖"。

最佳图片服务商-百度商业服务市场.jpg

牧者之心狼者之性

牧狼传媒

随意修改robots.txt 不利于搜索引擎收录你的站

免费获取方案及报价

牧者之心 狼者之性

牧狼传媒

随意修改robots.txt 不利于搜索引擎收录你的站

免费获取方案及报价

牧者之心狼者之性