Google索引和301重定向等问题解答
这篇访谈有点早了,是今年3月份时的事。Matt Cutts针对Google的爬行,索引机制以及对301重定向,重复内容处理的问题做出了些回答。访谈的原文比较长,SEOmoz有人以插图的形式很好的再现了这次访谈的大致内容,比较直观,这里我进行下转载。
#1. 关于爬行和索引
关于索引问题,我想应该很多朋友都有体会,为什么我的站Google收录的很少?为什么我发的反链Google都没有收录?
Google目前的索引量到底有多大,大家可以在Google里搜索a试试,从这个结果应该能看出个大概。
About 25,420,000,000 results (0.17 seconds)
然后,根据资料,截止到2007年2月,互联网上已经发现的网站数量是108m,810,358个。
我们暂且拿当今的Google索引量,除以两年前的网站数目,也就是平均下来,每个站的Google收录量不到300。那么实际情况呢?
很多时候,并不是Google没有发现你的页面或者反链,只是觉得这些页面或者反链不够重要,没什么必要加入到他们的索引数据库里以供用户查询时返回结果。
那么什么样的页面才是重要的页面?Google又是怎么判断的呢?PageRank是这份插图所列举的一个例子。
#2. 站内重复内容
这里提到了尽量使用canonicalization来避免站内重复内容导致的索引问题。
#3. 关于aff链接
通常情况下,直接用AFF链接也不会输出link credit。
#4. 301跳转无法传递全部PR或者链接权重
Google官方年初就已经公开说明了301跳转时权重会有所损失
Matt Cutts: That’s a good question, and I am not 100 percent sure about the answer. I can certainly see how there could be some loss of PageRank. I am not 100 percent sure whether the crawling and indexing team has implemented that sort of natural PageRank decay, so I will have to go and check on that specific case. (Note: in a follow on email, Matt confirmed that this is in fact the case. There is some loss of PR through a 301)。 |
说说我自己最近的一次301,是站内的301重定向跳转。之前有个站拿XsitePro做的静态页面,后面转到WordPress后,花了一个多月的时间才慢慢恢复(其中也有我自己的原因,页面地址首字母大写没注意先),也有人说Mayday更新后也对301跳转传递权重有影响。[来源]
另外,如果有朋友有机会转移域名的,可以试下跨域名的canonical标签,Google在09年底开始支持这个标签,其后便在10年年初降低了301跳转的作用。也许是用301重定向用来作弊的人太多,总之感觉这个做法比较像Google的习惯,启用一个新的解决方案来逐步替换掉老的实现同样的功能。
更多关于canonical标签的资料请Google。
#5. 低质量的网页内容会影响你的索引
Autoblog就是一个很明显的例子。做英文SEO时,这种类型的垃圾站不是说你装几个插件用scrapebox发两下就能有好的收录表现。Google也有类似对新站的考察期,这点Autoblog Blueprint上也有讲到。
#6. 关于PageRank Sculpting
之前很多人利用nofollow来控制PR流动,以此来提高特定页面的权重/排名,这项技术被称为Pagerank Sculpting(PR剪枝)。之后Google修改了nofollow的规则。
Matt Cutts: So what happens when you have a page with “ten PageRank points” and ten outgoing links, and five of those links are nofollowed? Let’s leave aside the decay factor to focus on the core part of the question. Originally, the five links without nofollow would have flowed two points of PageRank each (in essence, the nofollowed links didn’t count toward the denominator when dividing PageRank by the outdegree of the page)。 More than a year ago, Google changed how the PageRank flows so that the five links without nofollow would flow one point of PageRank each. |