搜索引擎的认识误区与技术展望

标签: 推荐阅读 搜索引擎 | 发表时间:2012-09-17 12:40 | 作者:P迪
出处:http://www.alibuybuy.com

搜索结果越多越好,技术差距决定优劣,SEO可以提高搜索排名……,媒体和公众对搜索引擎的这些普遍认知,其实都是严重的认识误区。聚合规则,排序方法,展现方式,将成为未来搜索引擎竞争的关键,而竞价排名,将随着竞争的展开逐步退出历史舞台。

随着360搜索的上线以及3B大战的展开,网络爱好者们对搜索引擎技术及市场的讨论成为近期的互联网小热点。笔者也向多位搜索技术专家进行了求教,并与身边朋友进行了探讨,结果发现,人们对于搜素引擎普遍存在严重的认识误区。

误区一:搜索结果越多越好

描述:“搜索一个关键词,哪个搜索引擎给出的结果多,哪个搜索引擎就比较好。”这是最普遍存在,但也是最不科学的一种认识误区。不仅很多普通用户这样认为,就是很多大众媒体,在报道搜索市场大战时,也会采用这种简单的评判方式来对比搜索引擎的性能。

分析:大 量专业研究资料显示(笔者自查),在搜索结果中,首页首条的关注度是100%,前3条的关注度超过90%,前10条的关注度约为80%-85%,其后各条 结果的关注度和点击率便直线下降,翻看第二页的用户只有20%左右,而翻看第三页的用户通常不超过1%。所以说,2页(最多3页)以后的搜索结果,对于 99%以上的用户来说是毫无意义的。

另外,搜索结果多也不一定代表搜索的信息量更大。比如,我们搜索某条热点话题,搜索引擎往往会将不同网 站转载的同一篇文章依次罗列,甚至会将同一篇文章的各页回复也罗列出来。有时,同一个网页也会多次出现在一次搜索的结果当中。通常来说,在10万条搜索结 果中,真正有价值的差异化信息往往不足1000条。

结论:搜索结果有1万条还是100万条,其实没有本质差别,因为几乎没有人会查看100条以后的搜索结果。 比较搜索引擎好坏的关键是要看谁能在前三页,特别是首页前几条,向用户提供最可靠和最有价值的信息。

技术展望:搜 索结果的“聚合”与“排序”方式的创新会成为未来几年重要的发展方向:首先,大量同质化的信息会被聚合成一条或两条搜索结果,而具体网页的罗列则会展现在 二级页面或扩展窗口中,从而大大提高搜索首页显示的信息量;其次,搜索引擎还会像微博那样,标示相似信息最初的发布源头。 在未来的竞争中,谁能提供更好的聚合与排序,谁就能吸引更多的用户使用。

误区二:搜索引擎之间的技术差距很大

描述:Google技术最好,百度次之,其他搜索引擎的技术都很拦,而且不是一天两天能够杆上的。这是很多JY人士的共同观点。

分析:这是典型的不懂技术的人的技术观点。Google问世已经有14年了,但从应用的角度看,搜索技术仍然停留于文字检索或符号检索。虽然图像检索和视频检索的研究已经持续了近10年之久(笔者是这个领域的专家),但由于应用成本太高,因此至今尚未实现大规模的民用化。

也就是说,目前在搜索领域占绝对主导地位的文字检索,实际上已经经历了10余年的广泛应用,其主要的或核心的技术方法不仅早为业界熟知,而且在各类学术期刊上也都可以查到,实在谈不上还有什么像样的技术秘密了。

结论:文字搜索是一种非常成熟的搜索技术,虽然不同引擎的具体技术实现会有一定的差别,但核心的技术方法都是大同小异。造成搜索结果存在差异的主要原因,其实是搜索结果更新周期的不同,以及信息的排序方法和整合方法的不同。

技术展望:未来搜素引擎的竞争,将不再是核心技术方法的竞争,而是内容整合,结果聚合以及信息排序等外围技术和展现方式的竞争。当然,更新速度的比拼在一定时间内还会持续,不过不会持续很久。

误区三:网页优化(SEO )可以提高搜索排名

描述:SEO(Search Engine Optimization),意为搜索引擎优化。主要目的是增加特定关键字的曝光率以增加网站的能见度。具体方法是通过研究各类搜索引擎的抓取规则和排序 规则,对网页进行相关的优化,从而提高网页在搜索结果中的排名。SEO是比较专业的技术方法,目前已经形成产业,很多规规矩矩的网站都希望能通过SEO来 增加访问量。

分析:自从某些主流搜索引擎推出竞价排名之后,SEO就沦为一种垃圾技术。这是因为,如果不能在热搜词中排名靠 前,那么做SEO的价值就不大;但是,一旦某个词汇成为热搜词,那么这个词汇就会被竞价拍卖。到头来,做再多的网页优化,也会被竞价系统挤出前3页。如前 所述,上不了前3页,所有的劳动就都是无用功,纯属瞎掰。

结论:竞价排名没啥技术含量,但却足以谋杀任何专业的SEO技术。 在中国,钱永远是 TMD 老子,技术永远是TMD 孙子。

技术展望:竞价排名不死,还瞎展望个啥!

误区四:搜索结果由搜索引擎自动生成

描述:搜索引擎的信誉就是搜索结果的公正性。因此,每一家搜索引擎都会宣称其搜索结果是搜索引擎自然生成的。不过,这一点很少会有用户相信。

分析:在竞价排名体系中,含热搜词的网页搜索结果的前3页基本都是人工干预出来的。竞价上去的自然是人工干预的,那些看起来不像竞价上去的,其实也是人工干预出来的,是用来给搜索结果的公正性作伪装的。

结论:进行热搜词搜索时,99% 的用户看到的都是人工干预的结果,但翻过前几页之后,我们还是可以看到自动生成的排序结果。

技术展望:如果没有激烈的市场竞争,竞价排名下的人工干预还将是中国搜索的主流。搜索技术的研究实际上已经没有什么意义了,反正都是钱说了算。

误区五:新闻搜索是网络热点的聚合

描述:主流搜索引擎大多声称其新闻首页是网络新闻和热点的聚合。从内容和结果来看,似乎也是八九不离十。

分析:中国最大的新闻网站莫过于四大门户(搜狐、新浪、网易、腾讯)、凤凰网和新华网等。不过,我们点开百度新闻首页的链接,进入的基本都是一些不知名的小网站,很难看到上述大站的身影,甚至连知名报刊杂志的网页版内容也很难上百度的新闻首页。

Google新闻首页的情况好得多,至少一半的新闻链接来自门户及大站。而让笔者最为惊讶的是,在搜狗的新闻首页中,东家搜狐的连接竟然与另外三大门户网站差不太多,而四大门户及凤凰网和新华网等的连接总量占比超过,70%。

上述情况大家可以亲自验证一下。

结论:即便是相同的新闻内容,某些搜索引擎也会根据自身的利益需求来选择新闻源。所谓的热点聚合,其实只是利益驱使的外部伪装而已。当然,也可能有人会认为,上述情况表明,百度的搜索范围最广,能力最强。

技术展望:如何在可靠性,时效性以及盈利能力上进行平衡,考验的是搜索公司的社会良知。

来源: woodfish2004


© 推荐 for 互联网的那点事, 2012. | Permalink | No comment | Add to del.icio.us
Post tags:

你可能也喜欢:

搜索引擎工作的基础流程与原理

第一财经周刊:搜索引擎未来卡壳

互联网上五个最高级的搜索引擎

iResearch:搜索引擎媒体价值实证研究

福布斯评出最具发展潜力10大搜索引擎(组图)
无觅

Feed enhanced by Better Feed from Ozh

相关 [搜索引擎 认识 技术] 推荐:

搜索引擎的认识误区与技术展望

- - 互联网的那点事
搜索结果越多越好,技术差距决定优劣,SEO可以提高搜索排名……,媒体和公众对搜索引擎的这些普遍认知,其实都是严重的认识误区. 聚合规则,排序方法,展现方式,将成为未来搜索引擎竞争的关键,而竞价排名,将随着竞争的展开逐步退出历史舞台. 随着360搜索的上线以及3B大战的展开,网络爱好者们对搜索引擎技术及市场的讨论成为近期的互联网小热点.

【技术贴】9个基于Java的搜索引擎框架

- - 行业应用 - ITeye博客
9个基于Java的搜索引擎框架. 1.Java全文搜索引擎框架Lucene. 毫 无疑问,Lucene是目前最受欢迎的Java全文搜索框架,准确地说,它是一个全文检索引擎的架构,提供了完整的查询引擎和索引引擎,部分文本分析引 擎. Lucene为开发人员提供了相当完整的工具包,可以非常方便地实现强大的全文检索功能.

IBM收购搜索引擎初创企业Blekko技术及团队

- - 36氪
蓝色巨人今天在博客 宣布已收购了搜索引擎初创企业Blekko的技术,后者的团队已经加盟IBM Watson. 打开Blekko网站我们看到先是弹出如下的页面,然后网站被跳转到Watson的博客上. Blekko原本是一家做垂直搜索引擎的初创企业,由全球首个病毒制造者Rich Skrenta与人联合成立于2007年.

将搜索引擎的机器学习技术用于风控,氪信希望指数级提高金融模型的训练效率

- - 36氪
氪信的创始人朱明杰之前是搜索引擎的数据工程师,现在他把技术应用在了金融风控上,近期获得了真格基金700万人民币的天使投资. 氪信的产品包括非或然引擎(下文简称“引擎”)和XCloud两部分,“引擎”是一套数据模型处理系统,解决的是不同场景下的风控模型校正问题. 以物流行业为例,通过输入企业ERP数据、位置信息数据等场景内数据,以机器学习的技术调整各数据维度的权重,从而建立针对场景的风控模型.

人眼启发视觉搜索引擎

- feng823 - Solidot
Google上周宣布将支持声音和图片进行搜索,但一家创业公司在图像搜索方面走在了Google前面. 源自伦敦帝国学院研究项目的创业公司Cortexica,开发出视觉搜索工具,通过手机拍摄产品照片,它会自动呈现价格信息. Cortexica已经发布了一个用于比较酒价格的工具WINEfindr. Cortexica的视觉搜索技术是受到了人眼视觉系统的启发,它能识别出一个目标的关键特征,不受方位、大小、光线亮暗的影响.

比较好的学术搜索引擎

- hfut_chen - C++博客-首页原创精华区
     摘要: 1、http://scholar.google.com/. Google学术搜索滤掉了普通搜索结果中大量的垃圾信息,排列出文章的不同版本以及被其它文章的引用次数. 略显不足的是,它搜索出来的结果没有按照权威度(譬如影响因子、引用次数)依次排列,在中国搜索出来的,前几页可能大部分为中文的一些期刊的文章.

uSniff:BT种子搜索引擎

- leqoqo - 软件志
一、uSniff相关信息: 1、官方主页:http://www.usniff.com/ 2、简介:uSniff是一个BT种子搜索引擎,简单、易用、实时是其最大的优点,其搜索引擎数据库包含了17个知名种子站点的种子信息,目的是想发展成为世界上最大的BT种子搜索引擎,而且对于每个种子,该搜索引擎都会进行安全认证,以保证用户的正常使用.

Mr.Icons:图标icon搜索引擎

- 壮壮爱 - 够趣堂
之前Anliu在如何更换更好的icon文章里面推荐了4个icon搜索引擎,目前部分已经不复存在. 不过Mr.Icons倒是又一个不错的选择,可以搜索图标icon进行下载,有PNG、ico格式以及不同大小提供下载. Mr.Icons还提供图标icon集打包下载,比如动物图标等. 和之前的介绍几款搜索引擎一样,依然不支持中文.

Blekko 对搜索引擎的新探索

- thinkingit - 知乎的博客
Blekko 这款搜索产品做的如何. 从目前我的使用过程来看,Blekko还是很让人激动的. 在谈Blekko之前就要先问:为何在搜索这个看似已经垄断的行业还会有人想去分一杯羹,这些小团队能与Google或微软这样的巨头抗衡吗. 比如之前的Powerset,后来的Cuil,和现在的Blekko. 在Google之前Yahoo是靠人工收录网页,Google的算法和蜘蛛革了搜索的命,一直垄断搜索业十余年,而现在随着WEB 2.0的发展,让人又看到了搜索业革命的火种,可以说Blekko就是这样的一个产品.

迅搜全文搜索引擎 XunSearch

- Le - 开源中国社区最新软件
迅搜(xunsearch)是采用 C/C++ 基于 xapian 和 scws 开发的全文搜索引擎解决方案,提供 PHP 语言的开发接口. 支持海量数据高速检索,功能强大,简单易用. 本项目旨在帮助一般开发者针对既有的海量数据,快速而方便地建立自己的全文搜索引擎. 全文检索可以帮助您降低服务器搜索负荷、极大程度的提高搜索速度和用户体验.