谷歌知识图谱功能带来的是什么?
近日,谷歌(暂限于英文版谷歌)正式推出被称为知识图谱(Knowledge Graph)的新搜索功能。只要在谷歌搜索引擎里键入单词或短语,在传统搜索结果的右侧就会多出一个栏目直接显示该词条的相关信息,这些信息来自维基百科与其他提供信息服务的网站。与之前的浏览方式相比,用户免去了自己访问信息出处网站这一过程——谷歌直接把信息呈现在搜索页面中。
站在用户的角度,谷歌的创新的确提供了更加快捷的搜索体验——只需轻轻一敲,信息尽在眼前。不过需要点击量的网站们听到这个消息肯定开心不起来了。知识图谱的出现给他们的生存带来了威胁,甚至对现存互联网产业的商业模式造成了冲击。可以预测,知识图谱将导致一系列网站关门,而网站的减少又将造成网络信息的流失。信息是网络的基石,谷歌此举究竟会带来什么呢?
技术进步
知识图谱仅作为一项新功能,就已经收录了约5亿个词条,信息量也已达到35亿条,而且这个数据还在不断地膨胀。对于一个语义搜索引擎而言它的确足够强大,老牌语义搜索引擎维基百科只有3000万个页面,相比于谷歌足足少了一位数。功能推出后的谷歌搜索搜索结果分为左右两个部分,左侧是传统的搜索结果,右侧是知识图谱功能提供的语义信息。
谷歌搜索布朗克斯动物园,在右侧会出现动物园的相关信息
上图为对美国布朗克斯动物园(Bronx Zoo)的搜索结果。在搜索结果新增的右侧,谷歌给出了一张布朗克斯动物园的地理位置图,地图下方是对动物园的基本描述。描述的右下角标注了维基百科的链接,表示此条信息选取自维基百科。在基本描述之外谷歌还列出了布朗克斯动物园的一些玩点与看点。与传统搜索结果中的第一条——动物园官方网站相比,这些信息还是略显单薄。但对于那些没有官方网站的词条而言,这样的信息应该算是很具参考价值的了。
谷歌 vs. 必应:不同的发展之路
在谷歌利用互联网上的已有信息把自己打造为一个语义搜索引擎之际,微软的必应在做着另一方面的尝试——把搜索引擎和社交网站结合起来。必应试图从用户的社交网络中提取信息以做出更加全面的回答。只要用户登陆Facebook时激活必应的工具栏,必应便会从Facebook内的好友主页中拉取信息,显示在搜索结果中。比如用户通过必应搜索某一景点,它就会显示出好友相册里关于该景点的照片;搜索某一部电影,它就会显示出好友对此影片的评论。不过这项功能还有待完善,有用户反应自己在搜索地名时获得的信息却是“几百年没见的老朋友曾经居住在距离此地100英里(约161公里)外的地方”,而搜索印度泰姬陵景区时弹出的却是名为“泰姬陵(Taj Mahal)”的音乐家最近新开了博客。
相比谷歌,必应的新搜索功能还是落在了后头。它着眼的社交搜索功能不仅需要用户在Facebook上有足够数量的好友作为支持(好友数越多信息量越充足),而且暂时还无法给出令人满意的结果。就搜索布朗克斯动物园为例,必应大概只能拉取出Facebook上好友在该地的照片,或是某某好友曾在纽约州(布朗克斯是纽约州的一个市区)居住过,这些都不具备足够的参考意义。必应的另一个新功能是“咨询亲友”,当用户进行搜索时可以选择“咨询亲友”选项,向自己所有Facebook上的好友同时发问,不由得让人想起了开心辞典。目前该功能也没有完善,用户只能向所有的好友一起发问,不允许主动选择范围人群。谷歌旗下也有“Google Circles”(由Google+发展而来)这一社交产品。对于谷歌是否也会发展出自己的“咨询亲友”功能还很难说,不过笔者相信,让用户有选择咨询对象的能力,是这项功能不变的核心。
谷歌也在把社交网络与搜索引擎相结合起来的方向做了尝试,并推出了Search Plus Your World。和必应的社交搜索功能相比,它的不足点在于没有把传统网络搜索结果和社交网络搜索结果分列显示,这给用户造成了不必要的麻烦。有用户有时只想搜索新内容,却不得不在搜索结果中重温社交网络中的言语图片。必应在此方面做得更好,它把两者分而处之,给用户提供了更大的自由空间。
行业冲击与信息垄断
回到谷歌知识图谱对互联网产业的冲击这一话题。知识图谱功能确实损害了信息来源网站的利益,谷歌正在把网络上的信息一步步地搬到自己的数据库中(正如它已经对维基百科进行的侵蚀与同化),用户们逐渐不用再点击信息来源网站进行访问。而点击量对于网站而言意味着价值,维基百科依赖着用户的使用才获取了关注及捐款。点击量的下降必将导致网站提供信息量的下降,这种上层建筑侵蚀下层基础结构的不稳定性不用多说。如同触尾即毙的贪吃蛇,问题迟早会浮出水面。
谷歌对于这个质疑也给出了自己的回答,谷歌搜索业务的高管艾米特·辛格尔(Amit Singhal)对此话题给出了回应。他指出,搜索引擎的技术进步将扩大使用搜索引擎的总人数,而扩大的用户基数将给网站带去更多的访问量。辛格尔回避了这样一个事实:谷歌此次的新功能与他所言及的技术进步不同。之前谷歌在搜索引擎上所做的努力在于如何将搜索结果定位到更加满足用户需求的网站,而现在他们改变了用户习惯——用户不用再去访问网站了。所以无论这个基数有多大,网站方都不会看到自己想要看到的结果。
辛格尔还回应道,网站方与其指责搜索引擎的进步,倒不如在自己身上下工夫,提升自己的价值,而不是只回答搜索引擎就能搞定的问题。在他举出的例子里,这个“搜索引擎就能回答的问题”是“2加2等于几”。很明显,谷歌和辛格尔都没有在严肃地对待这个问题。至今没有人能够指出谷歌的边界在哪里,也许只有技术瓶颈能够成为他们的障碍。不过这倒是给整个互联网行业提了个醒——只要能提升自己的服务、为自己创造价值,谷歌绝不手软。
用谷歌搜索“全球变暖”,右栏出现的是一个支持者和一个反对者。
假设谷歌的知识图谱完全成熟,它将涵盖地球上所有书籍以及网站上的内容信息。也就是说,它将具备信息垄断的能力。届时假设有一个网站对于“气候变化”和“知识产权”这样颇具争论性的问题拥有一个不同于常的论点,此时用户们使用谷歌的搜索引擎就无法找到它。历史经验无数次告诉我们,一旦有机构能够代表权威,它就有能力扼住信息的咽喉。
令人担心的是,谷歌把自己定位为信息的权威方,而不是一个互联网信息搬运工的角色。同时,它仅仅把这种权威的身份赋予自己——只有谷歌有能力对知识图谱上的内容进行判断和修改。老牌语义搜索引擎维基百科对自己的定义是“自由的百科全书”,主张“动态、可自由访问和编辑”的理念。但谷歌不是这么想的,它把这扇门向公众关闭了。