随着2006年Web2.0技术的发展,搜索引擎也在不断地调整自己的 网站抓取策略和网站排名算法,下面就从这两方面谈一下Web2.0技术对SEO(Search Engine Optimization,搜索引擎优化)的影响。 中国.站长站
搜索引擎针对RSS的改进
SEO技术一直都专注更有质量的原创内容、更有针对性的文章标题和更吸引人的文章摘要上。自从2006年Blog兴起后,RSS订阅也同时开始流行起来,这在很大程度上也改变了很多人的网络阅读方式,而搜索引擎总是跟随用户的关注而不断地改进自己的排名算法,所以为你的网站内容系统提供一个RSS订阅功能会是一个非常重要的方面,而且你会发现效果非常好。
现在无论是通过Google、MSN, 还是Yahoo进行搜索,RSS都会出现在搜索结果中,例如,当你用Google搜索一个非常流行的Blog——boing boing,你会发现排名第三的就是FeedBurner记载该Blog的Flog,实际上我们会发现Google确实给拥有Flog的网站额外的PR值。
当然某些网站不希望部分RSS被搜索引擎索引,RSS2.0已经可以为RSS Flogs添加标示,类似noindex, follow,搜索引擎将不再索引你的RSS。
补充材料问题
Google的补充材料问题是今年比较受关注的SEO问题。
补充材料(Supplemental Result), 是Google辅助索引的一部分。对辅助索引进行抓取的限制少于主要索引。例如,一个网址的参量可能使该网站无法被抓取到主要索引中,但仍可能被抓取到Google的补充索引里。
根据Google的说法,作为补充材料的网页,只是一种辅助、补充的索引,并不作为主要索引。也就是说,这些网页并非在Google的主数据库中,而是在辅助数据库中。一般情况下,当我们在Google上进行搜索时,它展现给我们的结果是主数据库中的网页,并非辅助数据库中的网页。由此可以得出结论,作为补充材料的网页,在Google的表现会非常差。
根据一些搜索引擎关注者的观察,作为补充材料的网页,被Google爬虫爬行的间隔时间非常长,很多时候几个月、甚至半年都不会被Google爬虫造访,严重影响网页在Google数据库中的更新。同时,这些网页的排名非常差,只有在搜索结果很少的时候,才会被Google列出来。一般情况下,根本无法在搜索结果里看见这些网页。
如果网页被Google列为补充材料,这对于网站来说是一件不幸的事情。被列为补充材料的网页,在搜索结果中的排名,都会表现非常差。如果网站本身的PR值较高,情况会稍好一些。
是什么原因造成了网页被Google认为补充材料呢?从Google自己提供的信息中,我们看不到任何有价值的资料。主要原因可能是网页的Head部分的Description书写不规范造成的和网页内容是复制的。
某位搜索引擎关注者曾经有6个相同主题的网站,这些网站都是用同一个数据库生成的,其中有100多个网页的内容几乎完全一样,而且都是用XHTML+CSS技术制作。在这些网站中,只有一个网站的所有网页不是补充材料,其他的网站的页面,除了首页之外全部都是补充材料。因此怀疑补充材料是由于复制网页造成的。
在复制网页的情况下,补充材料是某一个特定的URL,而不是一个网页或者一个文件。比如说xxx.com和www.xxx.com,一般来说是同一个文件,但是是两个不同的URL。这两个URL有可能其中一个是正常网页,另外一个却是补充材料。
补充材料是针对特定的日期所抓取的网页快照,也就是说即使是相同的URL,在Google数据库中也可能存在多个版本,其中一个版本是日期A所抓取的新的内容,这个URL+这个特定的日期和网页快照,可能是在正常的数据库中。而另外一个日期B所抓取的内容(同一个URL,比较老的内容),却可能是在补充材料数据库中。
在分析了不是补充材料的网站的网页后,还发现只有这个网站的Description书写规范,Description内容由成段的句子组成,与网页的内容吻合; 而被作为补充材料的网页,Description内容书写得都很不规范,都是将关键词堆砌几遍。发现这个问题后,搜索引擎关注者将其中某些网站网页的Description修改为规范的写法,以期观察。但是由于Google几个月都不更新这些页面,无法观察到结果。于是,搜索引擎关注者又用同样的数据库,做了两个网站,这两个网站的内容与以前的网站几乎完全相同,但是Description采用规范的写法。这两个网站被Google收录后,所有网页都不是补充材料。
由此,得出结论,Google补充材料形成的原因是: 网页的Description写法不规范。
补充材料对排名的影响
这个问题就比较复杂,要具体情况具体分析。
像前面讲的,同一个URL可能出现在不同的数据库中,新版本的URL可能会出现在正常的主要关键词的搜索中。但是在其他关键词搜索中,它也可能出现在补充材料中。
如果你的网站有很多补充材料,有可能影响排名。但是如果这些补充材料都有一个相应的新的URL+日期+网页快照版本,对排名的影响就不大。如果这些补充材料没有新的版本,影响就比较大。
怎样避免出现补充材料?
1. 网页的Description写法不规范
解决网页被Google列为补充材料的主要方法,就是规范书写Description。不要在Description里堆砌关键词,Description的内容要与页面的内容吻合; 保持合理的网站结构,确保每个页面都有连接指向,并且连接不被埋藏得很深。
2. 有网址规范化问题。也就是带有www和没有www的两个网址版本都在数据库中,其中一个就有可能被标为补充材料。
目前可以通过Google提供的管理员工具来统一www和无www域名的网站。
3. 有时候已经被删除的网页,也就是实际上应该返回404错误的URL,会被列为补充材料; 或者域名已经过期了,也有时会被标成补充材料。 中.国.站.长.站
4. 有时候站长在改动网页之后,新旧内容的两个版本的网页都会出现在Google索引中; 糟糕的是,其中一个会被标为补充材料。
站.长.站
5. 复制内容网页。很多转载或抄袭的内容会被标为补充材料。因为Google也没办法判断哪一个是原创的,所以有时候原创者也会遭殃。
6. 网页上相同或相似的内容太多。比如导航系统占网页内容比例比较大,而正文部分比较小。 |