时间:2013-08-20 6:58:34 浏览:2608次
回顾去年在研究医疗网站优化的时候,接触到一些网站的导航链接处都用了nofollow属性。nofollow在我的印象里一直是用于友情链接防止权重流失和恶意网站的不利影响,然而这个也能在网站内链中用么?大站都这么做了,还有什么可怀疑的呢?那我们就来分析一下导航以及页面上nofollow应该怎么用吧。
Google对于nofollow:最近的google搜索引擎优化初学者指南中明确指出:如果您把某一链接的“rel”属性设置成“nofollow” , 这意味着您是在向Google传达这样的信息 : 您不希望Google继续跟踪抓取这些特定链接所指向的页面 , 并且也不希望将自己网页的声誉传给这些链接指向的网页
百度对于nofollow:网页级nofollow不跟踪链接,不传递权重及锚文本,链接级nofollow则是跟踪链接并记录锚文本,但不传递权重。
现在大多数网站尤其是电子商务网站和门户网站,好多链接都加了rel=nofollow,毋庸置疑这都是为了权重的节约和网站资源的节省。下面拿网络上SEO做得相当出色的网站Tradekey来分析一下他对nofollow的使用情况。
很多做英文SEO的人都应该知道,在google上搜索很多的产品关键词,Tradekey都能有不错的排名,它的SEO流量非常的可观。加上和那些热门平台相比,它的供应商数量不是很多,所以大家的效果相对都能得到保证一些。现在很多人都会把类似“注册”或“登录”这样的链接nofollow掉,这是因为google官方就建议这样做,当然tradekey也做了。
但是很少有人能敢把导航条上的链接nofollow掉,理论上来说,如果一个网页上的内容更新得不是很频繁,那这个网页一天被抓取一次就可以了。对于那种已经被收录而且内容一直不变的页面,一天被抓取一次都太多了。就算是更新很频繁的网页,一天被访问50次也完全够了。不过实际情况远比理论上的糟糕,就像上面的这个抓取数据,一个无关紧要的页面,百度爬虫一天都能抓取166次。大中型网站更糟,有一次我们分析完一个大型网站的数据,发现这个网站爬虫每天的抓取量虽然有120多万,但是其中有16万次抓取都是在抓首页这么一个网页,可以想象其他网页又有多严重。
为什么我们要这么在意一个网页被重复抓取的几率呢? 这是因为一个网站中还有很多其他的网页,爬虫根本就抓取不到。哪怕你的网站只有几百个网页,都可能面临着这个问题。一个网站如果每个页面平均被重复抓取10次,尽管可能爬虫每天的抓取量有100万,那也只有10万个页面被抓取了。一天之内的情况是如此,时间拉长到一个月内、半年内,情况不会有多大改善。虽然搜索引擎也试图解决重复抓取的状况,但是由于各种原因,会导致今天重复抓取的页面,明天还是会重复抓取的。所以很多的大中型网站,一年下来,还有一半的网页,爬虫压根都没看到过。 如果不是分析了很多网站的数据,很多人都是无法想象情况有这么严重的。
在抓取量一定的情况下,适当减低一些页面的重复抓取量,那会有更多的其他页面会被抓取到。 一个网站中,最容易被过度抓取的页面,就是那些经常曝光的页面,导航条上的链接就是经常曝光的。所以Tradekey的解决办法很简单,就是在首页这么一个页面上,给爬虫留下入口去抓取导航条上的链接,但是在其他网页上,就把导航条上的链接nofollow掉。这样处理,会使导航条上链接的抓取量,从以前被抓取上万次降低到现在被抓取几十次。虽然不能达到理想中的状况,但是也比以前好了非常多。
结合上面Tradekey对nofollow的实例的描述,相信做SEO的你对nofollow属性的用法应该有了更深入的了解了吧。想让你的产品更快的被抓取到,记得给搜索引擎蜘蛛一个“绿色通道”,也就是把那些“绕弯子”的道路用nofollow封闭住,让蜘蛛顺着你的意愿爬行。
上一篇:网站建设常识之动态网站静态网站
下一篇:搜索引擎相似网页去重算法
24小时服务热线:400-1180-360
业务 QQ: 444961110电话: 0311-80740308
渠道合作: 444961110@qq.com
河北供求互联信息技术有限公司(河北供求网)诞生于2003年4月,是康灵集团旗下子公司,也是河北省首批从事网站建设、电子商务开发,并获得国家工业和信息化部资质认证的企业。公司自成立以来,以传播互联网文化为已任, 以高科技为起点,以网络营销研究与应用为核心,致力于为各企事业单位提供网络域名注册、虚拟主机租用、网站制作与维护、网站推广和宣传、网站改版与翻译、移动互联网营销平台开发与运营、企业邮局、网络支付、系统集成、软件开发、电子商务解决方案等优质的信息技术服务,与中国科学院计算机网络信息中心、腾讯、百度、阿里巴巴、搜狗、360、电信、联通、中国数据、万网、中资源、阳光互联、点点客、北龙中网、电信通等达成战略合作伙伴关系。