真正的“人工”智能?——让人意外却有惊喜的“土而奇机器人”

标签: Apple/iOS 业界趋势/Trend 观点 Mechanical Turk 乐助理360 | 发表时间:2011-08-08 08:00 | 作者:Wilson Wang apuar
出处:http://www.ifanr.com

看到一个很让人惊喜的八卦故事。

一位叫赵行德的人在豆瓣上发了一个消息,谈到他在和联想产品经理聊天,了解到了一个手机应用背后牛逼的故事。这个故事显然把他击倒了。而我,也被击倒了。

先说说故事的引子乐助理 360,这是一个很省心的日程应用。

来举个例子吧。这个应用,有三种方式为用户设定手机日程,语音、文字和直接的电话。你对着手机说:后天 9 点飞北京,然后上传,几分钟之内,iPhone 日历就增加了一条在 9 点“飞北京!”的日程。文字呢?当然更好理解,你再也不需要在手机的日程管理软件中反复输入了,直接在这个应用输入你的计划,和短信一样发送,随后,你的日程也如你所愿就自动添加到系统日程了。

你会发现它相当方便。智能设备,特别是全触屏的手机,输入一直是很多使用者的心头痛。语音可以帮助用户方便地跨越这类门槛。不过,这类应用的成本还不仅仅在于单纯的输入,而是在于它需要你进行太多的选择。一个标准的场景是,拿出 iPhone,用拇指扫开屏幕,找到日程应用,然后填充一堆的表单区域。完成一个简单的日程,也需要点击很多很多次,耗费颇长时间。喜欢 GTD 的人,也许会乐于享受这种编辑归类过程,但是对于普通人来说,这种体验实在太差了。

且慢,还不光是你简单动动嘴皮的问题。你会发现它非常精确,它很听话,它很懂你,它支持所有的自然语义。这可不简单啊!

为何语音识别可不简单?它必须要解决各种场合下精确的识别处理问题。一方面,它需要对所识别语言规律和语句的高度理解,另外,它还需要解决各种噪音和干扰情况下(这是语音识别环境的常态)的识别问题。语音识别技术在商业和人机交互上一直以来缺乏足够的表现,正是由于无法精确的识别人类语音的表达。苹果去年 4 月耗巨资收购 Siri,看中的就是它就是可以很准确地识别人们的语音,针对人们提出的问题进行回答。人们认为,这个在语音识别领域浸淫已久的 Nuance 开发的语音技术,有可能让苹果开启下一扇人机交互的大门。

但是一个来自联想的应用,解决了这个问题?是联想在和科大迅飞搞的语音云合作项目?科大迅飞是联想投资的一个项目,上市前就获注资数千万元,而 2010 年底科大迅飞发布语音云系统时,柳传志也亲自出席了,这不得不让你有这样的联系联想。

反正我信了。马上就要和朋友感慨现在科技的日新月异了,CPU 已经可以代替人脑,云计算吧!脑海浮现出机器人统治世界的场景。

“人工”智能

然后,赵行德告诉你“让人崩溃”的真相:它背后的故事是——它的“高科技”,它的精确,它的“人工智能”,就在于,它真的是人工的!——他们在远端用人听这些语音消息,然后输入进去 ……

我不知道这个消息是否属实,但是我在测试中发现,它确实有很强的“人工”迹象。一是我试用这个软件的时候,使用了粤语,然后这个应用就在远端“死机”了——日程记录并没有自动推送过来,听闻说四川话是 ok 的。二是上传了语音后,推送日程的处理时间差别蛮大,感觉不太象是计算机即时处理的。三是精确度确实很高,在不同噪音环境下和不同腔调下,效果都相当不错,很难让你相信这是机器识别的。

不过,这只算一个八卦消息,真实的情况仍然待验证,特别是语音识别系统和呼叫中心的结合也有商用的案例。简单粗暴的直接判断它是完全人工的不太合适。但是真正有趣的,却是这个八卦故事所折射出的“创新”智慧。

初看,这个故事包括后续的回复都让人忍俊不禁,但是,回头一想,也许这真是一个非常棒的创新,一个非常聪明的商业模式的创新。

为何商业创新需要高科技呢?商业创新的意义在于更小的成本创造更大的价值。据说这个服务主意还是联想呼叫中心的人想出来的。它利用到了现有的成熟模式,并在这个成熟的商业模式上派生出了另外一种创新价值。

这个服务的“极其牛逼”之处,在于它把一个复杂的问题彻底的简单化了——而简单化,确实牛逼的商业模式最为宝贵的特质。你不会看到真正可行的商业模式是复杂的,让人看不懂的。

它用非常简单的方法(人工听),解决了语音识别精确度问题,解决了输入问题(远端人工编辑推送),解决了随时随地服务的问题(24小时的呼叫中心)——至少,让语音识别达到了非常好用的程度。它用超低廉的成本,完成了“高科技”很难做到的效果。它还是可扩展的。scalable 这个词在互联网模式中很热呢。

而高科技的云计算,本质和人脑简单集合处理并无不同,也许只是成本问题。科技本来是要降低成本的,如果在一个可以用人工比科技更好的降低成本的场合,为何不使用人工呢?

“土而奇机器人”

这种智能众包这也并非是联想呼叫中心的独创。

亚马逊就 2005 年推出一个叫土耳其机器人(Mechanical Turk)的服务,其理念,就是让人力众包来完成电脑力有不逮的细碎、精确的智能工作。这种众包让计算机调用人的智慧智能,把人和电脑的角色颠倒过来,让人成为任务的完成者,而电脑成为任务的分配者。起名叫土耳其机器人本身也映射了这个项目的性质:

这个名字源自于臭名远扬的能下象棋的“自动装置”,它是匈牙利男爵沃尔夫冈·冯·肯佩伦(Wolfgang Von Kempelen)1770年建造的。这个木制机器外形像一个坐在大机箱前的土耳其魔法师,它能自动而快速地下象棋,用复杂的齿轮和杠杆系统来移动棋子。在维也纳皇宫的首次表演中,它就迅速击败了对手Cobenzl伯爵,让在场的皇室成员看得十分高兴。从此关于这个惊人聪明的机器人迅速闻名于世,于是肯佩伦带着它在欧洲各地表演,击败了一系列著名的挑战者,包括拿破仑和本杰明·富兰克林。直到几年之后,这个骗局才被揭穿。原来机箱里藏了一名象棋大师,他用一个磁铁系统来跟踪对手的举动并移动自己的棋子,这个人实际是在模拟一种人工智能。(摘录自 比特云

这也是我们笑称它为“土”而“奇”机器人的来历。

可行性?

理论上的问题解决了,我们再来看看现实的商业问题。这得多大的人工成本?!别着急,看看赵行德的初步概算:

我测算了一下,平均每个活跃用户每天提交0.5条语音,每个人每分钟处理3条语音,每天工作7小时,可以服务2500个活跃用户,100人的数据中心可以服务25万活跃用户。

如果把数据中心建在西部贫困地区,月薪800元估计就足够了,25万工资成本才8-10万,100人的数据中心,每人2500元的电脑,投资25万,数据中心投资30万元,办公家具设备5万元,偏远贫困地区租个办公室,月租不到5000元,100人工资8万元,宽带月租2万元,10个产品开发人员,每月5万元,5个打杂行政人员,1万元。

总投资60万元,每月运营成本16.5万,就能办出给至少25万活跃用户,100万注册用户服务。

可行吗?

对的,它很土,很奇异,但是,它靠谱(it works),它可行。这个“土而奇”机器人很棒。

这不正是商业创新的意义吗?

目前,这个服务是免费的。而且所定义的日程服务类型所限,用户群也许并不算很大,每天下载量据说是 2000。但是它显然是一个可行的商业模式,同样的思路,你也许可以把它扩展到其他的移动互联网服务领域,有拾音功能的移动设备天然就是一个命令录入装置,天然就是一个可以收集多样服务需求进行集中处理的终端,智能手机已经为很多“云计算”的概念提供了坚实的应用基础。

你会为这样的管家类服务掏钱吗?至少,我会的。我觉得,与其把时间浪费在各种纠结上,还不如出钱让自己在零碎的时间发发呆。

这正是服务的意义呢。

Pics by Flickr ForbeChina

信奉科技和潮流的可能,相信激情和坚持的力量。

© Wilson Wang for 爱范儿 · Beats of Bits | 原文链接 · 67 热评 · 新浪微博 · 订阅全文 · Google+ · #ifanrlive

需要 Google+ 邀请?请[ 点击申请 ] 并填写您的邮件地址,enjoy~

相关 [人工 智能 意外] 推荐:

真正的“人工”智能?——让人意外却有惊喜的“土而奇机器人”

- apuar - 爱范儿 · Beats of Bits
看到一个很让人惊喜的八卦故事. 一位叫赵行德的人在豆瓣上发了一个消息,谈到他在和联想产品经理聊天,了解到了一个手机应用背后牛逼的故事. 先说说故事的引子乐助理 360,这是一个很省心的日程应用. 这个应用,有三种方式为用户设定手机日程,语音、文字和直接的电话. 你对着手机说:后天 9 点飞北京,然后上传,几分钟之内,iPhone 日历就增加了一条在 9 点“飞北京.

人工智能技术新进展

- - 生命奥秘
新的计算机人脑模型可以模拟更加复杂的人类行为. 人类的大脑是一个高度复杂的器官,在众多对人类大脑的研究工作当中就包括了从分子水平到人类行为活动水平等多个层面采集大脑相关信息的工作. 这种超大范围的研究方式很有可能会让大脑研究走向专业不断细化的发展方向,这种趋势虽然有利于大脑研究的不断深化,可是同时也会带来知识碎片化的结果.

由人工智能管理的港铁

- - Solidot
港铁公司运营香港地铁跻身全世界最出色地铁系统之列,它的准时抵达记录高达99.9%,超过了伦敦和纽约地铁. 数百公里长的繁忙地铁系统需要大量人力维护,港铁公司平均每周有多达1万人执行2600项维护工作,工人们工作都是提前规划好的,由人工智能进行管理. 港铁公司计划将人工智能推广到它在其它城市运营的地铁系统,其中北京有可能第一个采用.

[微言]人工智能有多可怕?

- - 海德沙龙(HeadSalon)
@whigzhou: 花了两个多小时思考强人工智能引出的问题,得出的结论是:相信陪审团. 然后发现,这不就是 我去年得出过的结论嘛~哈. 不过,其间经历的逻辑链条那是相当漫长,而且有了一些新想法,容我慢慢道来. @whigzhou: 1)强人工智能很快(也就是几十年内)会出现;2)强AI的出现会让世界很不一样,但并不像有些人所想象的#那么#不一样;3)其实,“只有一小撮人(或组织)有能力做一些绝大多数人做不到、甚至完全无法理解的事情”——这早就不是什么新鲜事了.

注意:人工智能非你所想!

- - 译言最新精选
译者: 果果向前冲 原文地址: gizmodo.com. 艾萨克·阿西莫夫的机器人三定律还不足以控制人工智能. 上图是幻想插画家之父迈克尔·蕙兰为《曙光中的机器人》设计的封面. 近20年前“深蓝”与盖里·卡斯帕罗夫对战象棋获胜一事被誉为史上最具意义的机器智能测试. 时至今日,谷歌的“阿法狗”与国手李世石在围棋锦标赛中决一胜负,对决前三局两次告捷,表明多年来人工智能经历了显著进化.

恰到好处的人工智能

- - 可能吧
技术不应该给用户带来使用难度,而是提高效率,并恰到好处地提供帮助. 这是我在使用 Google 智能音箱 Google Home 之后的总结. 智能、AI,是今年创投圈的关键词. 如果你在京东、淘宝上搜索各种家电,多多少少这些产品都会说自己是「智能」的,到底什么是智能. 把安卓系统塞到硬件里,这个硬件是不是就是智能了.

2017年人工智能研究报告

- - 互联网数据中心-199IT
81%的IT公司正在或者计划投资人工智能(AI). Cowen预测人工智能将会将人类的生产力提升到一个新的水平,而微软会冲在最前面. 数字化市场或市场自动化、Salesforce自动化(CRM)和数据分析将成为人工智能最为成熟的三大应用领域. 据angel.co的数据显示,目前有2200多家人工智能初创公司,其中超过50%的初创公司是在最近两年成立的.

我第一次谈人工智能

- - IT瘾-dev
不知道谁这么坏,给起了一个人工智能这个词,让通过科幻片才了解啥叫智能的普罗大众老误解人工智能,就像现在我仍然对智能手机这个词有微言,这怎么就智能了呢. 从现在表现出来的人工智能规模应用来说,本质上就是个概率统计的事,和智能根本不沾边,倒是和人工挺沾边,需要人工做大量的数据标准化加工、数据标注,再喂给算法.

ChatGPT背后人工智能算法

- - 今日话题 - 雪球
ChatGPT背后人工智能算法,关键的原创技术,其实全部都是国外公司发明的. 这里做一点简单的科普,人工智能原创性研究,中国还有很大进步空间,ChatGPT也不是普通的公司能够复刻的出来的. 深度残差网络(ResNet)由微软(亚洲)研究院发明. 在此之前,研究员们发现深度神经网络的效果要比浅层神经网络要好得多,这也就是所谓的深度学习.

人工智能碰上人工智能:两个机器人的爆笑对话

- 地安门城管 - cnBeta.COM
大家都听说过判断人工智能(AI)的图灵测试吧. 或者都和一些聊天机器人说过话吧. 不过那只是人与机器人之间的故事. 如果两个机器人放在一起会发生什么事呢. 其实这是一个名为Cleverbot(聪明机器人)的两份复制品,彼此是完全相同的,为了便于识别而分别做成女性和男性,但依然显示了不同的“人格”,其中男性比较单纯,女性则有些狡猾.