主流搜索引擎都遵循robots文件指令,设置了robots文件的网站搜索引擎都不再抓取其中指定的页面或者文件,但是被robots文件禁止抓取的URL还是有可能出现在搜索结果中,只要有导入链接指向这个URL,搜索引擎就知道有这个URL存在,虽不会抓取页面内容,但是可能将以下几种形式显示在搜索结果中:
1.只显示URL,没有标题,描述,Google常这么处理。
2.显示开放目录或雅虎等重要目录收录的标题和描述。
3.导入链接的锚文本显示为标题和描述,百度常这么处理。
要想URL完全不出现在搜索结果中就需要使用页面上的meta robots标签。
通常标签会设置为:meta name="robots" content="noindex"
使用以上标签的效果是禁止索引本页面,但允许蜘蛛跟踪页面上的链接,也可以传递权重。
接下来为大家详细介绍下meta robots标签的使用:
Meta robots标签是页面head部分meta标签的一种,用于指令搜索引擎禁止本页内容。
最简单的meta robots标签格式:
meta name="robots" content="noindex,nofollow"
上面标签的意义是禁止所有搜索引擎索引本页面,禁止跟踪本页面上的链接。
content参数里面可以有一下几个参数:
noindex:告诉蜘蛛不要索引本页面。
nofollow:告诉蜘蛛不要跟踪本页面上的链接
nosnippet:告诉搜索引擎不要在搜索结果中显示说明
noarchive:告诉搜索引擎不要显示快照
noodp:告诉搜索引擎不要使用开放目录中的标题和说明
Google,必应,雅虎支持以上标签,但是百度的官方说法是目前只支持nofollow和noarchive
meta robots 标签要注意几点:
1.标签内容可以并列写,两个中间可以以逗号或者空格隔开,也可以没有
比如说 meta name="robots" 洛阳网网站建设公司站建设公司 content="noindex"
meta name="robots" content="nofollow"
这两句可以写为meta name="robots" content="noindex,nofollow",这是与robots文件设置的格式有点区别的。
2.标签不区分大小写
3. meta name="robots" content="index,follow"使用这句是没有任何意义的,普通需要被收录、索引、链接需要被跟踪的页面不用写meta robots标签。
【相关文章】
新手站长应学会如何运用禁止收录机制(一)
原文地址:http://www.yidunseo.com/blog/ynfx.html 转载请注明!
南京牧狼文化传媒有限公司简介:
牧狼传媒,牧者之心,狼者之性,以牧之谦卑宽容之心待人,以狼之团结无畏之性做事!
公司注册资金100万,主营众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放以及电商营销推广全案等相关业务,致力于为客户提供更有价值的服务,创造让用户满意的效果!
为百度官方及其大客户、苏宁易购、金山WPS秀堂、美的、创维家电、新东方在线、伊莱克斯、宝丽莱等国内国外知名品牌服务过,服务经验丰富!同时,公司也是南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位,可以为您提供更好的服务!
主营项目:众筹全案服务、网站营销全案服务、网站建设、微信小程序开发、电商网店设计、H5页面设计、腾讯社交广告投放、竞价托管、网站优化、电商代运营等
合作客户:百度、苏宁易购、饿了么、美的、创维家电、新东方在线、宝丽莱、金山WPS秀堂、伊莱克斯
资质荣誉:百度商业服务市场2017年度最佳图片服务商、南京电子商务协会会员单位、猪八戒网官方认证签约服务商、江苏八戒服务网联盟、南京浦口文化产业联合会会员单位、八戒通TOP服务商、"易拍即合杯"H5创意大赛"三等奖"。