Yahoo申请了一项新的专利,“Link based spam detection”,引起了不少人的注意,应该说,这是Yahoo试图通过剔除来自link farms或其他非自然类型连接对网页排名的影响,以更好地提高SERP返回结果相关度的又一种尝试。
比较有意思的是,一般意义上的PageRank与TrustRank,多是指Google算法的参数,好象这两个词也被Google做过注册保护(?不敢确定)。不过,在Yahoo的专利申请中,似乎又赋予了这两个字新的涵义:
搜索引擎使用PageRank来计算其索引数据库中超链接文件(或网站或网页)的权重。PageRank的数值通过一系列的数学模型,基于链接信息计算得出,反映超链接文件的重要程度。 TrustRank是与PageRank相关的链接分析技术,用以将来自Spam的链接与优质内容带来的真正意义上的好评区别开来,其计算的基础是大部分优秀的文件很少链接至Spam。在处理上TrustRank分两个步骤,源目标的选定和评分的传递。一个超链接文件的TrustRank用来评价其是否具有真正的权威性。
可以看出,虽然Yahoo在其专利申请中使用了PageRank和TrustRank这两个同样用于Google算法的名词,但在具体处理上,还是与Google有所区别的。
Yahoo如何使用PageRank和TrustRank来识别Spam
在专利申请书中,Yahoo解释了如何借助于PageRank和TrustRank,来更有效地发现Spam
使用本技术,搜索引擎可以自动地发现不良网页(spam页面),同时,更具体地,找到这些不良页面的服务目标,即Spammer制作这些不良网页的目的对象——他们希望提高页面重要性与权威度的网页。 更具体地,综合PageRank与TrustRank技术,可以使搜索引擎的输出结果不再受到Link Spam的影响或左右。
链接的建立要更谨慎
搜索引擎的工程师不是笨蛋,随着Internet的发展,搜索引擎算法的调整越来越快,Spam的空间自然也越来越少。基于这种考虑,类似于那种号称可以在一夜间让网站获得成百上千链接的自动处理方案应该淘汰了,因为这类链接几乎可以来自link farm,而link farms几乎是所有搜索引擎的打击对象。现在是Yahoo,下一个是谁呢? |