随着互联网的信息量越来越大,搜索在生活中的应用也越来越普遍,越来越多的企业也加入到了搜索这片没有边界的市场中。Google作为行业内公认的技术领跑者,在近些年也不负众望,推出了多项创新型的搜索技术,比如商品搜索、基于地理位置的搜索、加密搜索等等。
相对于百度、必应等其他搜索引擎,我们能从大量的仔细分析中感受到Google在提供更有价值的结果页面所做的努力。尤其是作为一个SEO从业人员,对搜索引擎的分析也是不可或缺的,Google搜索或许已经在下面列举的这些技术细节上有了突破:
1、Google已经开始尝试感知信息的来源地址,并在为保护原创作出努力
众所周知,中国的互联网是一片抄袭的天地,国外虽然有比较强烈的版权意识,但转载也是非常普遍的事情,这就给许多坚持内容为主的中小型网站带来了毁灭性的打击:既打击了原创作者的积极性,也对互联网的健康发展有着非常消极的影响。并且在这一大的互联网环境下,也催生了许多以转载、采集为主要内容、以各种广告联盟为资金来源的“垃圾网站”。
从对Google的大量分析来看,Google已经在开始逐步清理这种垃圾网站了,并且会刻意降低此类网站的权重。
例如,对于某些站长聚集的原创网站,往往都会有大量的垃圾网站进行采集。而当这个原创站发布新的新闻之后,就会马上被垃圾站进行转载。然后在百度等搜索引擎进行搜索,很可能垃圾网站上的这篇文章的排名比原创站上的这篇文章的排名还要高得多。因此,百度对文章内容是否原创的判断是,网上是否还有其它相同文章,如果没有,放出页面再说;而Google则不然,Google会检索大量的类似页面,然后做出一个判断,这篇文章的原创来源应该是哪一个网站,然后再放出页面并将这个网站的排名放于其它转载的网站之前。
或许以上只是我的个人推断,但实现这一原创识别技术并不困难,比如原创的文章一般会带有来源网址,原创网站大部分都是原创文章,原创的文章会带有网站的特殊标识,比如网站名等等……只写ogle应该有能力进行模糊判断。 从网络上摘写的 希望对你们有用