搜索引擎对网页的排序一直是站长们关注的一个问题,而搜索引擎的投票原理一直是网页排序的一个重要因素,从之前的外链投票到现在的用户投票,投票排序始终百度在更改百度算法时的重点关注点,今天木木SEO也闲不住,根据百度搜索研发部对网页搜索排序的做一些浅谈。
好了,假设蜘蛛数据库系统里有n个网页,有m个特征(页面质量、页面加载速度、页面内容丰富度、页面超链、文本相关性等),现在对这n个网页的m个特性有不同的打分,那么:
一、如何根据这些特征的投票,选出最适合放在第一位的网页呢?
百度搜索研发部的看法是这样的:
1. 设计算法时,要避免出现赢者通吃带来的信息丢失问题。
什么叫赢者通吃?很简单,比如美国总统选举制度,每个州根据其人口多少得到相应的州票,州里的人对总统候选人进行选举,在某个州获得票最多的那个候选人,获得这个州所有的州票,然后统计所有候选人的州票多少,获得最多州票的候选人获胜。打个比方只有A州500个人,而B州400南京网站建设公司个人,那么对应州票分别是是500和400,如果某候选人小布在A州以251:249获胜,另一个候选人老奥在B州以400:0获胜,这样老奥在全国范围内获得了649投票,而候选人小布只有在A州的251投票,但是由于赢者通吃,小布获得了A州的全部500张州票,老奥只获得了B周的400张州票,在全国只有少数民众支持的小布居然会获得了选举的胜利。
很明显这个排序法如果在搜索引擎的算法中,那问题是很大的,为了排序结果NO.1(最相关的网页),找到了一个特征A(页面质量),而肇庆网站建设公司如果决定结果NO.1的不是特征A,而是由特征A推导出来的特征B(页面加载速度),那么在特征A向特征B的推导过程中,除开页面加载速度外的其他页面质量信息就丢失了,这样就造成赢者通吃。
2. 不要因为某几个特征特别好,就把某个网页排到最前,或者因为某几个特征特别差,就把某个网页抛弃。
这个也很简单,还是说选举,如果有4个候选人,有1000个选民,其中候选人A、B、C都是一个派系的,很受推崇,大概有700人是支持他们的,而D单独一个派系只有300人支持他,但是在选举投票过程中由于ABC都非常淄博网站建设公司好,导致这700个支持的民众不知如何选择,结果票数分散,每人只要200多票,而D尽管比较差就得到300票,但却胜利。
所以在排序网页过程中网页也可能出现各个特征都非常好而得到的投票比较平均的情况,也有可能由于优质特征少而投票集中的情况,这样就引出了第三条。
南京牧狼文化传媒有限公司简介:
牧狼传媒,牧者之心,狼者之性,以牧之谦卑宽容之心待人,以狼之团结无畏之性做事!
公司注册资金100万,主营众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放以及电商营销推广全案等相关业务,致力于为客户提供更有价值的服务,创造让用户满意的效果!
为百度官方及其大客户、苏宁易购、金山WPS秀堂、美的、创维家电、新东方在线、伊莱克斯、宝丽莱等国内国外知名品牌服务过,服务经验丰富!同时,公司也是南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位,可以为您提供更好的服务!
主营项目:众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放、竞价托管、网站优化、电商代运营等
合作客户:百度、苏宁易购、饿了么、美的、创维家电、新东方在线、宝丽莱、金山WPS秀堂、伊莱克斯
资质荣誉:百度商业服务市场2017年度最佳图片服务商、南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位、八戒通TOP服务商、"易拍即合杯"H5创意大赛"三等奖"。