前段时间seowhy开启未登陆用户禁止访问论坛的权限,让我想到的是,如果用户未登陆不能查看帖子,那百度蜘蛛能否索引到内容呢,我简单的理解为百度蜘蛛的爬行其实就是顺着网站中的锚文本链接爬行,然后形成一张大网,但如果论坛禁止未登陆用户访问,那么蜘蛛爬行的链接就是死链,就抓取不到内容,发帖就没有效果,其实我的想法是错误的,百度蜘蛛其独特的爬行机制不是我们想象的那么简单。
前日(10月22日),我修改公司网站的数据库,而后测试发布了一篇以啊啊为标题、内容的信息,前台并没有生成页面,也就是说这篇文章只有数据库中存在,前台没有它的一点信息(因为我有数据库洁癖,为了不让文章ID错乱,想着不用删除,等第二天更新文章修改掉就行,反正也没生成页面),第二天(10月23日),我把这条测试文章修改了,又发不了一篇新的文章,等待收录查看快照是这样的。
修改的那篇文章是22日的快照,新发布的正常,22日时是啊啊的内容,但点击百度快照进去发现是新的内容,让我又想到,难道百度收录文章的快照与文章更新的时间有关系?于是,今天(10月24日)我又更新了两篇文章,然后进数据库把一片文章的发布时间改为昨天,等待收录。
同一时间发布的两篇文章变成了上面的收录展示形式,可见22日发布的那篇文章其实当天就收录了,只是蜘蛛可能知道内容不是用户要发布的所以一直没放出,23日修改内容后,前台更新,蜘蛛顺着链接爬行到这镇江网站建设公司个网站知道内容是真正内容了,就替换了22日的收录并放不来,但快照没有修改,至于今天发布的两偏文章展示不一样,都只是暂时的,你明天查看,都会变成24日快照,没有什么不同,只不过今日查看一个显示详细收录时间,一个显示当天。
从上面的分析可以看出,百度蜘蛛爬行有时是不按我们的北京网站建设公司常规思考进行的,它会通过各种方法进入你的数据库,抓网站建设服务取内容,而非与网站前台的种种限制能阻挡,除非你用robots文件来限制,seowhy虽屏蔽未登陆用户访问,但其实百度蜘蛛是可以抓取到内容的,因为它与我们用户的访问方法不一样。至于文章的发布时间,一定程度上会影响文章收录的快照,但不是绝对。
原文链接:郑州seo http://www.zzzhu.net/news/?p=401
南京牧狼文化传媒有限公司简介:
牧狼传媒,牧者之心,狼者之性,以牧之谦卑宽容之心待人,以狼之团结无畏之性做事!
公司注册资金100万,主营众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放以及电商营销推广全案等相关业务,致力于为客户提供更有价值的服务,创造让用户满意的效果!
为百度官方及其大客户、苏宁易购、金山WPS秀堂、美的、创维家电、新东方在线、伊莱克斯、宝丽莱等国内国外知名品牌服务过,服务经验丰富!同时,公司也是南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位,可以为您提供更好的服务!
主营项目:众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放、竞价托管、网站优化、电商代运营等
合作客户:百度、苏宁易购、饿了么、美的、创维家电、新东方在线、宝丽莱、金山WPS秀堂、伊莱克斯
资质荣誉:百度商业服务市场2017年度最佳图片服务商、南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位、八戒通TOP服务商、"易拍即合杯"H5创意大赛"三等奖"。