昨天在一个QQ交流群里看到有一镇江网站建设公司个新手发问,如何去简单的分析网站日志,清楚知道网站的一个数据抓取情况,哪些目录抓取较好,有哪些IP段蜘蛛抓取等。
一个网站要发展的更快,走的更远,它离不开日常的一个数据分析,就如携程旅行网页搜索营销部孙波在《首届百度站长交流会》上所言来宾网站建设公司,其利用数据模型对频道改版后,网页索引量从原来的十几万,上升到今年的500多万的索引量。由此可见,数据分析的重要性。
说到每日的网站日志分析,在这里强调下,我需要用到两个工具:Excel和光年日志分析工具。可能也有朋友在对网站的日志分析时,需要另外用到一个工具Web Log Explorer。
其实在网站日志分析中,最需要用到的工具就是Excel(07版Excel或10版Excel),在这里,简单跟大家交流一下我的一点经验。
网站体抓取情况统计:
借助光年日志分析工具,获取各个搜索引擎的蜘蛛总抓取量、蜘蛛总停留时间、蜘蛛来访次数(本人由于只做百度优化,就说说百度蜘蛛抓取情况),如下图1:
把这上面的数据做成Excel即可,如下图2:
平均停留时间=总停留时间/访问次数, 计算公式:=C2/B2 enter键
平均抓取量=总抓取量/访问次数, 计算公式:=D2/B2 enter键
单页面抓取时间==停留时间*3600/总抓取量 计算公式:=D2/C2 enter键
蜘蛛状态码统计:
借助Excel表格,打开日志(最直接的办法,就是它日志拖到Excel表格里),然后再统计蜘蛛状态码,如下图3:
通过Excel表格下的数据功能下的筛选,下面就可以对蜘蛛状态码进行统计了,具体的统计操作如下图4:
点击IP段下拉框,找到文本筛选,选择自定义筛选。
通过图3,可以看出,蜘蛛抓取的状态码200特征是HTTP/1.1" 200,以此类推:状态码500是HTTP/1.1" 500、状态码404是HTTP/1.1" 404、状态码302是HTTP/1.1" 302…..下面就可以筛选出各个蜘蛛状态码,如下图:
如上图5,选择包含关系,即可以统计出百度蜘蛛200状态码的抓取量,其他以此类推。
蜘蛛IP段统计:
如上图,把状态码换成IP段就可以,如:HTTP/1.1" 200换成202.沙坪坝网站建设公司108.251.33
目录抓取统计:
如上图,把状态码换成相应目录名就可以,如:HTTP/1.1" 200换成/tagssearchList/
总结一下:
如何通过简单的Excel分析网站日志数据,就介绍到这里。不知道身为seo的你平常有没有分析网站日志呢。反正我平常都分析这个东东的。自认对网站的日志进行分析是很有必要的。至于分析的这些数据,有什么作用,如何通过这些数据查到网站的不足之处,然后列出调整方案,有步骤的去调整网站的结构,相信有很多人已经写过了,我在这里,就不再多说了。
本文由许余波博客原创,转载请注明来源http://xuyubo.cn/weiboke/62.html
南京牧狼文化传媒有限公司简介:
牧狼传媒,牧者之心,狼者之性,以牧之谦卑宽容之心待人,以狼之团结无畏之性做事!
公司注册资金100万,主营众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放以及电商营销推广全案等相关业务,致力于为客户提供更有价值的服务,创造让用户满意的效果!
为百度官方及其大客户、苏宁易购、金山WPS秀堂、美的、创维家电、新东方在线、伊莱克斯、宝丽莱等国内国外知名品牌服务过,服务经验丰富!同时,公司也是南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位,可以为您提供更好的服务!
主营项目:众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放、竞价托管、网站优化、电商代运营等
合作客户:百度、苏宁易购、饿了么、美的、创维家电、新东方在线、宝丽莱、金山WPS秀堂、伊莱克斯
资质荣誉:百度商业服务市场2017年度最佳图片服务商、南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位、八戒通TOP服务商、"易拍即合杯"H5创意大赛"三等奖"。