语义互联网的三大死因
语义互联网(Semantic web)确实有趣,但人们忽视了更大的背景图,那就是人们其实并不关注 知识图谱,人们只关心他们周边的人和“当下”的事。
语义互联网憧憬着将web变成数据和知识的交互网络,计算机组成的全球知识网络将最终能够理解人们的意图,并成为人们的获取信息和情报的新前线。
但在经过二十多年的尝试后,语义互联网已经成为投资者和消费者眼中的票房毒药。到底哪里出了问题,为什么我们的互联网依然与憧憬的语义智能互联网相去甚远?这是因为:
一、过期知识与活在当下
大多数web知识库的创建都不过是将“专家知识”转化成web数据。这些是相当无聊的web数据,从Google知识图谱的 推广视频已经可以看出,语义web将变得多么无聊:“你准备搜索文艺复兴时期的画家吗?”有没有搞错,这年头有几个人还关心这个。
如今,导致信息爆炸的根源是消费端科技的繁荣,这导致知识的寿命变得越来越短(编者按:飞机上打手机或吃转基因食物到底是安全还是不安全还是安全?)Alvin Toffler在他开创性的《 革命性财富》一书中曾杜撰了Obsoledge一词,来形容大量过期的知识。
如果我们要创建的数据互联网,我们必须将知识的定义扩展到“过期知识”和琐碎事实之外,例如我们不会关心达芬奇的身高或者哪些诺贝尔奖获得者生于1945年之前。我们更多关心的周围的人如何评价昨天晚上的电视热播剧大结局,还有什么剧集或者电影值得一看?
我们都活在当下。“当下“吸引着越来越多的注意力,过去正被快速尘封,人们的注意力、情绪和情感才是今日信息时代的关键元素,这些才是数据web的核心所在。
二、文档已死
从维基百科的文档中获取结构化信息的做法有着根本的缺陷。这不但催生了一个无聊的数据web,而且假定文档才是知识的源头,但事实不是这样的。文档(帖子、网页、文件、视频…)只是重要信息的一小部分,其背后的讨论和活动才是真正重要的(知识来源)。 参考阅读:Google与Bing的搜索战略分歧
我们使用web的方式正在发生巨变,我们正在进入web的第二阶段——革命性的实时web,或者我们称之为“信息流”。“信息流”的重点是消息而不是web网页。海量的消息来自社交互动、讨论、关注、想法等等,大量思想都被释放并汇聚成海量的数据流。 参考阅读:沃尔玛掘金快数据
这也改变了机器之间的通信方式。机器依然由人类编程操控,而人类,尤其是程序员们,总是容易犯懒。他们使用最容易的方式来实现机器间通讯。他们可不会花费很多天时间学习复杂的RDF或OWL规范,他们喜欢使用JSON来完成简易的沟通,最酷的那帮孩子们都已经抛弃了XML。
三、信息是用来“推”的,不是“拉”的
信息获取方式的问题也许不那么凸显,因为过去二十多年我们都已经习惯了在Google上用关键词搜索。但不幸的是,关键词搜索的根基已经崩溃。“外面”的信息越来越多,而关键词搜索的效果则越来越差。
类似Facebook的高级查询系统或者Wolfram Alpha仅仅比关键词搜索的效果好一点而已。甚至Siri这样的对话引擎也存在根本性的问题,因为人们不知道问什么问题。
事实上,我们需要的是这样一个web,信息能根据你对世界的关注、情绪和思想推送给你。
迎接神经突触网络(Synaptic Web)
关键词搜索已经过气,人们都浸泡在信息巨流中。人们对新一代信息获取方式的需求空前强烈。语义互联网将会成为下一个范型吗?恐怕未必。
是时候抛弃基于文档、知识和关键词搜索的范型了。我们生活在大数据时代,漂浮在实时信息流和情绪之上。我们需要的web应当是动态的以人为核心的web,能够理解个体需求并推送匹配数据和信息的web。这样的web看上去不太像数据库或者图谱,因为它是动态的、智能的甚至是混乱的。这更像是数字化的人类大脑,我们称之为神经突触网络( Synaptic Web)。
Via: GigaOM
关于作者:Dominiek Ter Heide是Bottlenose的创始人兼CTO,Bottlenose的专注将大数据技术与专业化数据挖掘技术整合,对数据流进行实时分析。