Narrative Science:让计算机像人一样写作

标签: 业界趋势/Trend 公司 应用 Narrative Science Siri | 发表时间:2011-10-12 01:35 | 作者:李 栋 EK
出处:http://www.ifanr.com

人工智能技术或许比我们大多数人想象中来得更快。

如果说 Siri 企图在信息输入上有所突破,那么 Narrative Science 的努力方向就是更加拟人化的“输出”。过去,计算机“写作”技术只停留在利用庞大文本库所进行的简单拼凑。因此,生成的结果当然不尽如人意。

西北大学教授 Kristian Hammond 联手前 Double Click 管理团队的成员,Stuart Frankel 和西北大学计算机系和新闻系的精英们花费了两年时间在2010年共同研发出了新一代的智能写作软件 Narrative Science,将新闻报道和电脑工程进行了一次新世代的结合。

这个在学校实验室代号为“Stats Monkey”的项目,通过对给定主题的数据分析,会自动选择合适的写作角度,快速“写就”一篇具有标准新闻报道结构的文章。神奇的是,程序甚至可以根据不同的出版社特点用不同的行文风格“写作”。Narrative Science 最初被应用在即时报道西北大学棒球和垒球的比赛中。自此以后,Narrative Science 也被应用在财经报道等领域,包括 Forbes 等网站都已经开始与 Narrative Science 建立了合作伙伴关系。

Hammond 教授认为 Narrative Science 的特别之处就在于满足了人们倾向读故事的心理。在此之前,虽然计算机已经拥有了强大的运算能力,可以图形化复杂的数据,却依然不能根据数据以自然语言输出成一篇人性化的文章。而Narrative Science 就是为解决这个问题而设计的。当前,该程序的写作表现足以达到一位八年级学生的写作水平。

随着技术的持续完善,有业界专家大胆预测,类似计算机记者将在未来二十年内成为普利策(Pulitzer)新闻奖的有力竞争者。虽然 Hammond 教授始终在强调 Narrative Science 是在真正地进行“创作(Composition)” 而非生搬硬套,仍有相当部分人对此技术持保留态度。在这群人中(相当一部分是记者),主要认为再先进的计算机算法始终也无法模仿人类的感性流露,这项技术最终只能生成低质量的数据报告式的文章。

同时,自动化写作也让诸如 Google 等在线搜索公司产生隐忧。如果程序已经能自动生成如此高质量的“拟人化”文章,那么辨别在线垃圾内容的任务将会变得异常艰巨。华盛顿大学人工智能的专家 Oren Etzioni 在谈及这个问题时,毫无掩饰地将 Narrative Science 比作数字化装备竞赛中的核武器。而 Narrative Science 则表示,他们不会将此技术转让/部署到这些网站中。

最后,我们提供了两段文字,其中一段就是 Narrative Science 自动生成的,你能分辨出是哪一段吗?请在下面的留言中给出你的答案。

A: “Michigan held off Iowa for a 7-5 win on Saturday. The Hawkeyes (16-21) were unable to overcome a four-run sixth inning deficit. The Hawkeyes clawed back in the eighth inning, putting up one run.”

B:”The Iowa baseball team dropped the finale of a three-game series, 7-5, to Michigan Saturday afternoon. Despite the loss, Iowa won the series having picked up two wins in the twinbill at Ray Fisher Stadium Friday.”

成长于和互联网一起奔腾的时代。慎思,明辨,笃行。

© TonyL1sh for 爱范儿 · Beats of Bits | 原文链接 · 9 热评 · 新浪微博 · 订阅全文 · Google+ · #ifanrlive · 加入爱范社区!


原创的新鲜趣味,@乐活制造,点击关注

相关 [narrative science 计算机] 推荐:

Narrative Science:让计算机像人一样写作

- EK - 爱范儿 · Beats of Bits
人工智能技术或许比我们大多数人想象中来得更快. 如果说 Siri 企图在信息输入上有所突破,那么 Narrative Science 的努力方向就是更加拟人化的“输出”. 过去,计算机“写作”技术只停留在利用庞大文本库所进行的简单拼凑. 因此,生成的结果当然不尽如人意. 西北大学教授 Kristian Hammond 联手前 Double Click 管理团队的成员,Stuart Frankel 和西北大学计算机系和新闻系的精英们花费了两年时间在2010年共同研发出了新一代的智能写作软件 Narrative Science,将新闻报道和电脑工程进行了一次新世代的结合.

一本叫nature and science 的杂志

- Gong - 新语丝
◇◇新语丝(www.xys.org)(xys5.dxiong.com)(www.xinyusi.info)(xys2.dropin.org)◇◇   一本叫nature and science 的杂志   方舟子先生,   您好. 近日在推上看到这么一条消息(附后),出于好奇,我点击了这个链 接,是一本叫《Nature and Science》的学术杂志,发现里面的作者大部分为中 国人.

建筑摄影 – Phaeno Science Center / JOHANNES HEUCKEROTH

- Dylen - 60designwebpick
摄影师:目前是设计专业学生,来自德国的 Johannes Heuckeroth. Phaeno Science Center 坐落于德国沃尔夫斯堡市中心,是建筑大师 Zaha Hadid 于2005年完成的作品,也是德国的首个自然科学馆. Phaeno Science Center 以“引发好奇与发现神秘”作为设计构想,进入建筑内部将能体会某种程度的复杂甚至不可思议的感觉,这些感受是以非常精确的系统所控制,Zaha Hadid 认为一座科学中心要有这种特殊的设计.

七个用于数据科学(data science)的命令行工具

- - 博客 - 伯乐在线
数据科学是 OSEMN(和 awesome 相同发音),它包括获取(Obtaining)、整理(Scrubbing)、探索(Exploring)、建模(Modeling)和翻译(iNterpreting)数据. 作为一名数据科学家,我用命令行的时间非常长,尤其是要获取、整理和探索数据的时候. 而且我也不是唯一一个这样做的人.

计算机学科漫谈

- - 编程 - 编程语言 - ITeye博客
    PHP设计模式之观察者模式. 在这篇博文里,我想和大家聊一聊自己对计算机学科的理解. 当下本科阶段的计算机专业教学涉及计算机学科的方方面面,分类繁杂,有时可能令新人茫然不知所措. 那么,对计算机专业的学者来说,什么是最重要的呢. 我相信,一千个读者,一千个哈姆雷特,同样的,每个计算机的学习者都有自己对专业的一番认识.

天才计算机程序员 -- fabrice bellard

- 山石 - 小美的部落格
这位老兄就是写jslinux的那位,它的主页是:. 上面有他的几个作品,包括qemu,ffmpeg,tcc等. 这个世界从来不缺天才,只缺乏利用天分坚持理想和信念不断创新的人,这些人用恒心和努力缔造一个又一个传奇. 法国人Fabrice Bellard 就是这样一个了不起的程序员. Fabrice Bellard1972年生于法国,曾就读于巴黎高等综合理工学院和法国电信研究院.

计算机爱好者 VS. 程序员

- kapster - 博客园新闻频道
  本文是从 Hackers vs. Coders 这篇文章翻译而来.   优秀的计算机爱好者具有一种无价的技能. 可作为一名程序员会跟计算机爱好者一样吗. 难道程序员跟那些不知道如何编码的计算机爱好者们相比,会在创造性上处于劣势吗.   下面的这个故事让我看清了他们之间的不同.   我最近被邀请在一个周末创业活动中做指导.

计算机的10大经典错误

- chris - 伯乐在线 -博客
10、DOS的Abort,Retry, Fail. 85年以后出生的人可能不知道DOS是什么了,只有那老家伙还知道这是什么. 我还记得当时的我对于Abort和Fail这两个选择还是比较清楚的, 不过,今天完全忘记了Abort和Fail的差别是什么. 这个出是DOS下的经常出现,也相当的经典,以至于在Wikepedia上都有专门的业面 Abort, Retry, Fail?.

当计算机算法控制世界

- 洞箫 - cnBeta.COM
感谢Bluehost中国的投递. BBC的报导称,看不见的 算法正在控制我们在数字世界里的互动,而糟糕的是我们正失 去对这些代码的控制. 从图书和电影推荐算法,到Facebook的朋友推荐和图像标记服务,到搜索引擎,算法已经渗透到了我们生活之中.

[图]计算机10大经典错误

- wu - cnBeta.COM
感谢404NotFound的投递. 10、DOS的Abort,Retry, Fail.