搜索引擎如何识别垃圾链留言
这篇文章跟本人之前发表的“垃圾网站大清洗运动”在本质上面存在共同之处,而本文又对搜索引擎识别垃圾链接的方法进行了补充。)
昨天谈到博客作者对垃圾留言的厌恶。今天再谈谈搜索引擎可能怎样鉴别垃圾留言。在点石论坛里看到了太多帖子讨论博客留言群发软件以及各种各样的经验。很多人都认为,有不少网站靠博客垃圾留言提高排名,效果不错,网站也没被惩罚。不过有两点需要考虑:
1)我们看到的大量垃圾留言不一定是网站排名的原因。为减少误杀,搜索引擎通常忽略垃圾留言,而不会直接惩罚留垃圾留言的网站,不然太危险了,很容易被人利用来陷害竞争对手网站。这些网站的排名很可能是我们没发现的原因,比如有一些很强有力的外部链接。
2)现在不惩罚,不一定就意味着以后也不惩罚。说惩罚其实不太准确,准确的说当搜索引擎发现这些垃圾留言时,去除这些垃圾链接的权重和投票力,使网站排名下降,看似是惩罚,但其实只是使网站排名回到它应有的地方。
搜索引擎怎样判断垃圾留言呢?可能有以下方法。
看留言的时间关系。比如同一个博客几秒钟内,在不同帖子出现同一个网站的留言链接,这肯定不正常。或者同一个网站的垃圾链接,在几乎同一时间段出现在多个博客上。这对单个博客作者来说看不出来,但对搜索引擎来说,检测到这些易如反掌。
留言中是否含有URL?URL只是文字还是做成一个超链?有的垃圾留言软件或留垃圾留言的人野心比较大,不满足于仅留下签名,还在留言内容里留下URL。在被过滤的垃圾留言中,我经常看到长达几页的垃圾。这种垃圾留言,我估计再蠢的搜索引擎也能判断出来。
留言长度。很多垃圾留言往往只是说,好文章,说的不错,顶之类的话。这种短小而又没什么意义的话,也会增加被怀疑的可能性。
上了黑名单的IP及网站。就像上个帖子所说的,反垃圾软件会收集那些垃圾网站及IP地址。一旦上了这些黑名单,就直接被过滤掉了。我相信搜索引擎也有类似数据库。
博客帖子有多老以及最新留言情况。如果博客帖子已经是两年前的,而且一年半没有新留言了,冷不丁冒出一个留言,这多少也有点可疑。
留言相关性。搜索引擎可以通过语义分析,判断留言与博客帖子是否有一定的相关性。群发软件留下的垃圾,通常都是没什么意义,放在哪儿都相关,也都不相关的话。
多个博客留言模式。群发软件都会往大量博客发垃圾,而且留的域名及留言内容都一样或相似,这种模式一定会引起怀疑。
垃圾链接出现的速度。与真正的读者留下的有意义的留言不同,群发软件都是快速留下大量链接,搜索引擎也可以检测到这一点。
上面列出的垃圾留言特征,有一些肯定已经被反垃圾软件及搜索引擎在使用,但不一定是全部。也肯定还有其他因素,咱们想不到,但搜索引擎想到的。搜索引擎永远比咱们聪明。
如果哪位做出一个软件,能避免上面所说的所有可能被怀疑的地方,那你是个高手.