语义互联网的三大死因

标签: 互联网 动态 大数据 热点 Obsoledge | 发表时间:2013-11-04 05:23 | 作者:Cashcow
出处:http://www.ctocio.com

data scientist

语义互联网(Semantic web)确实有趣,但人们忽视了更大的背景图,那就是人们其实并不关注 知识图谱,人们只关心他们周边的人和“当下”的事。

语义互联网憧憬着将web变成数据和知识的交互网络,计算机组成的全球知识网络将最终能够理解人们的意图,并成为人们的获取信息和情报的新前线。

但在经过二十多年的尝试后,语义互联网已经成为投资者和消费者眼中的票房毒药。到底哪里出了问题,为什么我们的互联网依然与憧憬的语义智能互联网相去甚远?这是因为:

一、过期知识与活在当下

大多数web知识库的创建都不过是将“专家知识”转化成web数据。这些是相当无聊的web数据,从Google知识图谱的 推广视频已经可以看出,语义web将变得多么无聊:“你准备搜索文艺复兴时期的画家吗?”有没有搞错,这年头有几个人还关心这个。

如今,导致信息爆炸的根源是消费端科技的繁荣,这导致知识的寿命变得越来越短(编者按:飞机上打手机或吃转基因食物到底是安全还是不安全还是安全?)Alvin Toffler在他开创性的《 革命性财富》一书中曾杜撰了Obsoledge一词,来形容大量过期的知识。

如果我们要创建的数据互联网,我们必须将知识的定义扩展到“过期知识”和琐碎事实之外,例如我们不会关心达芬奇的身高或者哪些诺贝尔奖获得者生于1945年之前。我们更多关心的周围的人如何评价昨天晚上的电视热播剧大结局,还有什么剧集或者电影值得一看?

我们都活在当下。“当下“吸引着越来越多的注意力,过去正被快速尘封,人们的注意力、情绪和情感才是今日信息时代的关键元素,这些才是数据web的核心所在。

二、文档已死

从维基百科的文档中获取结构化信息的做法有着根本的缺陷。这不但催生了一个无聊的数据web,而且假定文档才是知识的源头,但事实不是这样的。文档(帖子、网页、文件、视频…)只是重要信息的一小部分,其背后的讨论和活动才是真正重要的(知识来源)。 参考阅读:Google与Bing的搜索战略分歧

我们使用web的方式正在发生巨变,我们正在进入web的第二阶段——革命性的实时web,或者我们称之为“信息流”。“信息流”的重点是消息而不是web网页。海量的消息来自社交互动、讨论、关注、想法等等,大量思想都被释放并汇聚成海量的数据流。 参考阅读:沃尔玛掘金快数据

这也改变了机器之间的通信方式。机器依然由人类编程操控,而人类,尤其是程序员们,总是容易犯懒。他们使用最容易的方式来实现机器间通讯。他们可不会花费很多天时间学习复杂的RDF或OWL规范,他们喜欢使用JSON来完成简易的沟通,最酷的那帮孩子们都已经抛弃了XML。

三、信息是用来“推”的,不是“拉”的

信息获取方式的问题也许不那么凸显,因为过去二十多年我们都已经习惯了在Google上用关键词搜索。但不幸的是,关键词搜索的根基已经崩溃。“外面”的信息越来越多,而关键词搜索的效果则越来越差。

类似Facebook的高级查询系统或者Wolfram Alpha仅仅比关键词搜索的效果好一点而已。甚至Siri这样的对话引擎也存在根本性的问题,因为人们不知道问什么问题。

事实上,我们需要的是这样一个web,信息能根据你对世界的关注、情绪和思想推送给你。

迎接神经突触网络(Synaptic Web)

关键词搜索已经过气,人们都浸泡在信息巨流中。人们对新一代信息获取方式的需求空前强烈。语义互联网将会成为下一个范型吗?恐怕未必。

是时候抛弃基于文档、知识和关键词搜索的范型了。我们生活在大数据时代,漂浮在实时信息流和情绪之上。我们需要的web应当是动态的以人为核心的web,能够理解个体需求并推送匹配数据和信息的web。这样的web看上去不太像数据库或者图谱,因为它是动态的、智能的甚至是混乱的。这更像是数字化的人类大脑,我们称之为神经突触网络( Synaptic Web)。

Via: GigaOM

关于作者:Dominiek Ter Heide是Bottlenose的创始人兼CTO,Bottlenose的专注将大数据技术与专业化数据挖掘技术整合,对数据流进行实时分析。

相关 [语义 互联网] 推荐:

语义互联网的三大死因

- - IT经理网
语义互联网(Semantic web)确实有趣,但人们忽视了更大的背景图,那就是人们其实并不关注 知识图谱,人们只关心他们周边的人和“当下”的事. 语义互联网憧憬着将web变成数据和知识的交互网络,计算机组成的全球知识网络将最终能够理解人们的意图,并成为人们的获取信息和情报的新前线. 但在经过二十多年的尝试后,语义互联网已经成为投资者和消费者眼中的票房毒药.

移动互联网=移动+互联网?

- 可可 - It Talks-魏武挥的blog
从名词上看,移动互联网似乎就是互联网加上一个移动. 但移动互联网远不是“移动的互联网”那么简单. 它的本质——网络部分,就和互联网大不相同;而它的表现——移动部分,也正因为移动,造就了很多和互联网相当不一样的商业机会. 而更重要也是很多人并没有注意到的是,它可能会改变整整一代人的信息处理习惯. 从网络部分而言,我们都知道,理论上互联网是没有拥有者的.

重新索引互联网

- keso - 爱范儿 · Beats of Bits
重新索引互联网 Facebook 雇佣公关抹黑 Google 的过程已经水落石出. 问题是: Google 那么多产品, Facebook 为何对 Social Circle 这么敏感. Google 号称自己的使命是“索引互联网”. 这件事的难点并非派出多少爬虫,而是对收集来的海量内容做排序:怎样让真正重要的网页,的排到 Google 搜索结果的前面来.

中美互联网差异

- leeking001 - 互联网的那点事
在互联网以指数的速度发展的今天,人们的生活已经离不开网络,那么,这两个打过在互联网方面有什 么差异呢. 我们从下面一系列与互联网相关的参数来比较两个国家,比如:互联网用户数量,互联网普及率,互联网连接的速度,域名数量,受欢迎的网站,网页浏 览器,操作系统等等. 十年前,美国是世界上的互联网头号大国,而现在很明显已经不是,取而代之的是中国.

重新索引互联网

- Ray - 最新文章 - UCD大社区
重新索引互联网 Facebook 雇佣公关抹黑 Google 的过程已经水落石出. 问题是: Google 那么多产品, Facebook 为何对 Social Circle 这么敏感. Google 号称自己的使命是“索引互联网”. 这件事的难点并非派出多少爬虫,而是对收集来的海量内容做排序:怎样让真正重要的网页,的排到 Google 搜索结果的前面来.

互联网七巧板

- Ray ma - 云科技
话说天下事势,合久必分分久必合. 大半年前在一辆宝马车里,一互联网大佬爆料说“百度可能收购新浪,肯定在谈”. 半个月前又开始传,百度高管去硅谷跟Facebook谈合资了. 前天又听到,搜狐可能和另一家互联网巨头合资做微博. 互联网的谣言和互联网的股价一样,起起伏伏. 不过,本文主题不是关于百度或者搜狐或者新浪,而是关于合资.

被选择的互联网

- Jacqueline - 月光博客
  连线杂志的那篇《互联网死了》确实震动业界,而现在,百度的框计算似乎正在验证他的话. 无论是高兴也好,无论是哀嚎也罢,百度的框计算终究给最终用户带来了一些实际的东西. 他改变了人们对于传统搜索的认知. 而百度这类似的行为,正成为互联网的一种趋势. 可以说,商业化的大潮,正在人为的割裂互联网,让他的边界越来越明显.

互联网的锤子(三)

- 盛开 - 月光博客
  对微博的讨论思路仍将从信息的获取和发布两个方面结合微博的特征来讨论,这将是我们的思维定势.   2006年twitter诞生,在blog之后,在rss,digg,youtube之后. 在这些应用出现之后,网民创造的信息内容与日俱增,对新闻资讯,博文的评论散落在网络的各个角落. Twitter生逢其时,将网民集合在一个平台上,最初将这一优势显现出来的是对突发新闻的报道,在现场的网民发布现场图片信息,通过twitter直接将图片传送给其他网民,经过转发评论,现场的新闻图片传播到整个twitter平台上,实现即时广泛的传播.

Facebook = 未来的互联网?

- iamsure - 爱范儿 · Beats of Bits
或许现在许多人看到这个标题的时候还会认为是危言耸听,可这一天似乎已经离我们越来越近. 社交网络可能就是未来互联网的代名词. 毋庸置疑的是,互联网依然增长迅猛,但从以下三组数据我们发现,互联网的增长重心在向特定方向聚集. 线上视频保持着爆炸性增长,每年用户使用增长率 45%. 移动设备用户上网使用时间较去年增长了28%,其中智能手机用户上网使用时间翻倍.

关于物的互联网

- 瑾 - 爱范儿 · Beats of Bits
2008 年,连接到互联网的设备已经超过了人类的数量. 随着移动互联网的发展,与互联网相连的物品数量更是急速上涨,Cisco 的一副信息图展示了与互联网关联的物品之增长. 到 2020 年,连接到互联网的物品数量将达到 500 亿. 这些不仅仅是智能手机和平板,它们可以是任何东西. 荷兰一家初创公司 Sparked 在奶牛的身上使用无线感应器.