人工智能技术新进展

标签: 新闻特写 热点 top | 发表时间:2012-12-12 05:59 | 作者:cyq
出处:http://www.lifeomics.com

 

新的计算机人脑模型可以模拟更加复杂的人类行为。

人类的大脑是一个高度复杂的器官,在众多对人类大脑的研究工作当中就包括了从分子水平到人类行为活动水平等多个层面采集大脑相关信息的工作。这种超大范围的研究方式很有可能会让大脑研究走向专业不断细化的发展方向,这种趋势虽然有利于大脑研究的不断深化,可是同时也会带来知识碎片化的结果。解决办法之一就是将各个方向的研究成果全都整合到一个大脑模型当中。可是这种用各个不同的“零件(指各个研究方向取得的研究成果)”简单拼凑出一个人工大脑的方式是无法表现出大脑的精髓的,人类大脑最重要的功能就是可以行使复杂的行为(complex behavior)。就好像工程师们可以制造出汽车、电脑是因为他们之前已经掌握了汽车和电脑的工作原理,所以如果科学家们要构建出一个人工大脑模型,那么首先也得知道我们大脑的工作原理,具体来说就是要先了解大脑里每一个部分负责的运算任务,以及这些运算功能在神经网络系统上的实现原理。Eliasmith等人向我们介绍一种大规模的人体大脑运算模型,这种大脑运算模型就能够模拟各种复杂的人类行为,这一成果标志着科学家们在人工智能研究领域又前进了一大步。

Eliasmith等人开发的这个人工大脑模拟模型叫做语义指令结构统一网络(Semantic Pointer Architecture Unified Network),简称Spaun系统,该系统能够观察图像,并使用配套的模型手臂做出相应的动作。Eliasmith等人开发的这套Spaun系统可以完成八种各不相同的任务,在所有这八种任务中都会包含对各种图形(主要是数字图形)的介绍,以及根据图形做出相应的动作(用人工臂画出“看到”的数字)。在这些任务中既包括简单的图像识别任务,也包括记忆性的任务(按照看到数字的先后顺序重新写一遍),还包括强化学习任务(比如赌博任务)和更加复杂的认知任务(类似于智商测试题一类的任务)。Spaun系统会依靠它所拥有的那250万个神经元细胞来完成这些测试,这些神经元细胞按照我们人类大脑的组成方式形成了多个子系统(subsystem),这些子系统分别对应了我们人类大脑的不同区域(brain area),最后这些子系统之间又互相联系起来具备了大脑最基本的功能。

人工大脑看到的视觉图像信息首先会被“压缩”处理,去除掉不相关的、或者冗余的信息。Eliasmith小组在对图形信息进行压缩处理时使用的是一种多层次有限波尔兹曼机(hierarchy of restricted Boltzmann machines)的算法,这种算法属于一种前馈神经网络系统(feed-forward)的运行机制,每一层有限波尔兹曼机处理都可以得到一种图形特征信息,经过多轮(层)有限波尔兹曼机处理之后就可以得到整个图形的所有相关信息。然后,将这些图形信息一一分配给人工大脑里与真正人类大脑视觉中枢(ventral visual stream)对应的各个子系统,它们分别对应初级视觉皮层(primary visual cortex)和次级视觉皮层(secondary visual cortex)、纹状体外皮层(extrastriate cortex)和颞下皮层(inferior temporal cortex)。在运动功能方面,Spaun系统也采取了一种类似的方法,他们将简单的动作命令,比如画出数字“6”,也分解为很多个简单的动作,然后将这些动作组合起来就可以画出一个“复杂的”6。所有相关的运算全都基于最佳控制理论(optimal control theory),其中还包括辅助运动中枢(supplementary motor area)和初级运动中枢(primary motor cortex)的运算。这种对信号的压缩处理同时伴以动作的人工大脑模型解决了大脑在与环境发生相互作用时需要处理的“广度难题(curse of dimensionality)”,以往的人工模型在处理这类问题时总是不知道该如何处置大量的感觉信息,同时也不知道在面对众多动作备选方案时应该做出哪种选择。

Spaun系统的认知装置(cognitive machinery)实际上包括两个相互交叉的组成部分,它们分别是相当于人类大脑额前皮质区(prefrontal cortex, PFC)的记忆工作系统(working memory system)和相当于人类大脑基底神经节(basal ganglia)和丘脑(thalamu)的动作选择系统(action selection system)。这套动作选择系统控制着人工大脑当前的状态,同时也部分受到了强化学习(reinforcement learning)理论和当前流行的基底神经节(basal ganglia)模型的启发。Spaun系统的记忆工作系统采用了一套全新的算法,这套算法借鉴了计算神经科学(computational neuroscience)领域的神经系统算法和来自数学心理学(mathematical psychology)领域的卷积记忆理论(convolution memories)。这套神经系统算法使Spaun系统拥有了一个网络化的信息存贮机制,而卷积记忆理论又让Spaun系统可以将以往的信息和最新接收的信息有效的结合在一起。所以Spaun系统可以有效地做出重复行为,比如写出一列数字中的第一个数字和最后一个数字,这是其它人工大脑模型无法比拟的。

Eliasmith等人还使用了另外一个记忆工作系统来自动推测以往和当前信号之间的关系。这种自动推理功能意味着最初级的句法功能(syntactic generalization),Spaun系统呈现出的数字识别并再现功能预示着这种句法功能在将来的某一天一定会实现。这种再现功能与符号运算(symbolic computation)功能有着直接的联系,这种符号运算在计算机科学(computer science)和联通理论(connectionist)著作里非常常见。Spaun系统使用这些计算方法居然还通过了最基础的智商测试考核。

在Spaun系统里对应PFC的那些子系统起到了连接抽象运算、符号运算和单个神经元细胞活动的作用。说到卷积记忆功能,Eliasmith等人做了一个非常有意思的预测,他们估计神经元细胞激活的速率(在单位时间内出现的动作电位的平均数量)会随着不断的连续完成记忆工作而逐渐加快。这一预测非常有价值,值得开展试验进行验证。科学家们在对猴子开展的电生理学试验工作中也早就采用了让猴子连续完成记忆工作任务的试验方式,所以我们可能早就已经积累了大量这方面的数据了。

在Spaun系统的每一个模块当中,实际的信息都是通过大量被激活的神经细胞来完成处理的。而在生理条件下借助神经网络开展的高水平的运算与依靠单个神经元细胞开展的低水平的运算之间的这种联系在Spaun系统中是依靠所谓的“神经工程结构(neural engineering framework)”来重建的,这套神经工程结构系统尤其善于在活化的神经网络里完成任意数学矢量运算(arbitrary mathematical vector operation)。这套系统假定信息会按照神经激活速度的线性被读取,然后再以非线性的方式将信息转换成神经活动功能。这样每一个子系统里处理的信息都会被分配给每一个神经元细胞,这种模式也非常符合大脑电生理研究工作得到的结论,比如我们的大脑对不同的感觉刺激(输入)信号或运动输出信号的响应速度是不一样的等。

基于Eliasmith等人的开发思路,当这套Spaun系统在某些方面不能很好的模拟真实大脑情况时我们一点也不感到奇怪。比如这套系统多个部分的响应活性在好几个方面(其中包括最基础的统计范畴)都和大脑的实际情况有明显的不同。我们现在还不知道将来这些问题能够被改善到何种程度,也不清楚这些偏差在多大程度上其实只是我们大脑内部基础响应水平不一致情况的真实反映。Spaun系统的最大问题还是它硬连接(hard-wired)的本质以及不能学习新任务(功能)的特点。不过Spaun系统的结构具有非常大的灵活性,并不拘泥于某一项任务,而且在Spaun系统中有多个部分都是具备学习功能的,比如图形信息多层处理系统和动作选择系统都有这种学习的潜力。至于说更广义的学习能力,比如学习一项全新的任务,这也许是Eliasmith等人故意留下的一个空白。实际上,Spaun系统所欠缺的恰恰就是我们在对自身大脑认识上还有所不足的部分。Eliasmith等人已经将大量的大脑研究成果纳入了这个Spaun系统,这件工作本身就已经向我们展现了一个大脑工作理论,当然其中并不包括与学习相关的机制。在统计学家George Box看来这个Spaun系统也许是错的,不过这个系统绝对是有用的。此外,Eliasmith等人也提供了一种大规模的、自上而下开发人工智能系统的可能性。Spaun系统的出现为这方面的工作设立了一个新的标杆,也提供了一条新的途径,不要只想着如何将尽可能多的神经细胞或信息量集中在一起,注意力应该集中在尽可能的重现大脑功能,行使更复杂的行为这方面。

 

 

原文检索:

Christian K. Machens. (2012) Building the Human Brain. Science, 338:1156-1157.

YORK/编译

相关 [人工智能 技术] 推荐:

人工智能技术新进展

- - 生命奥秘
新的计算机人脑模型可以模拟更加复杂的人类行为. 人类的大脑是一个高度复杂的器官,在众多对人类大脑的研究工作当中就包括了从分子水平到人类行为活动水平等多个层面采集大脑相关信息的工作. 这种超大范围的研究方式很有可能会让大脑研究走向专业不断细化的发展方向,这种趋势虽然有利于大脑研究的不断深化,可是同时也会带来知识碎片化的结果.

五大可识别图片的人工智能技术

- - ITeye资讯频道
很长一段时间以来,人工智能的研究都停留在文字层面,比如著名的图灵测试(Turning Test),证明了机器能够像人类一样智能地回答书面问题. 而如果让机器变得更聪明,仅仅处理文字显然是不够的. 事实上,人类心智非常善于视觉处理. 从所见当中识别图案、物体以及文本情景的能力让我们很智能,这种能力也是人的本质特征.

微软对话语音识别技术达至人类专业水平,开启人工智能新征程

- - 微软亚洲研究院
一个月前,2016年9月14日,微软的对话语音识别技术在产业标准Switchboard语音识别基准测试中实现了词错率(word error rate, 简称WER) 低至6.3%的突破 ,创造当时该领域内错误率最低纪录. 一个月后,10月18日,微软进一步将词错率降低至5.9%,首次达成与专业速记员持平而优于绝大多数人的表现:上周末,微软人工智能与研究部门的研究员和工程师在论文中展示了他们这一创纪录的语音识别系统.

凯文·凯利来华再谈人工智能,并预测未来 25 年的技术发展趋势

- - 雷锋网
近日,凯文·凯利在成都进行了一个名为《回到未来》的 主题演讲. 主要分享了对 AI 等前沿科技的看法. KK 提到:“要预测未来是非常困难的. 但是我们有我们的优势,因为技术都是有偏见的. 通过技术的物理的特性,我们能够预见、能了解未来技术会到哪里去,未来技术很长一段时间会是怎样……”. 以下是凯文·凯利的演讲内容:.

腾讯发布战略产品“智能云” 向外界开放人工智能技术平台

- - 穿过记忆的河流
腾讯发布战略产品“智能云” 向外界开放人工智能技术平台. 澎湃新闻2017-06-21 . 在BAT(百度、阿里巴巴、腾讯)互联网三巨头中,腾讯是最后一家向外界开放人工智能技术平台的公司. 6月21日,腾讯(00700.HK)旗下的云计算公司腾讯云在深圳举行腾讯云 未来峰会上,发布战略产品“智能云”,宣布开放腾讯在计算机视觉、智能语音识别、自然语言处理的三大核心能力.

由人工智能管理的港铁

- - Solidot
港铁公司运营香港地铁跻身全世界最出色地铁系统之列,它的准时抵达记录高达99.9%,超过了伦敦和纽约地铁. 数百公里长的繁忙地铁系统需要大量人力维护,港铁公司平均每周有多达1万人执行2600项维护工作,工人们工作都是提前规划好的,由人工智能进行管理. 港铁公司计划将人工智能推广到它在其它城市运营的地铁系统,其中北京有可能第一个采用.

[微言]人工智能有多可怕?

- - 海德沙龙(HeadSalon)
@whigzhou: 花了两个多小时思考强人工智能引出的问题,得出的结论是:相信陪审团. 然后发现,这不就是 我去年得出过的结论嘛~哈. 不过,其间经历的逻辑链条那是相当漫长,而且有了一些新想法,容我慢慢道来. @whigzhou: 1)强人工智能很快(也就是几十年内)会出现;2)强AI的出现会让世界很不一样,但并不像有些人所想象的#那么#不一样;3)其实,“只有一小撮人(或组织)有能力做一些绝大多数人做不到、甚至完全无法理解的事情”——这早就不是什么新鲜事了.

注意:人工智能非你所想!

- - 译言最新精选
译者: 果果向前冲 原文地址: gizmodo.com. 艾萨克·阿西莫夫的机器人三定律还不足以控制人工智能. 上图是幻想插画家之父迈克尔·蕙兰为《曙光中的机器人》设计的封面. 近20年前“深蓝”与盖里·卡斯帕罗夫对战象棋获胜一事被誉为史上最具意义的机器智能测试. 时至今日,谷歌的“阿法狗”与国手李世石在围棋锦标赛中决一胜负,对决前三局两次告捷,表明多年来人工智能经历了显著进化.

恰到好处的人工智能

- - 可能吧
技术不应该给用户带来使用难度,而是提高效率,并恰到好处地提供帮助. 这是我在使用 Google 智能音箱 Google Home 之后的总结. 智能、AI,是今年创投圈的关键词. 如果你在京东、淘宝上搜索各种家电,多多少少这些产品都会说自己是「智能」的,到底什么是智能. 把安卓系统塞到硬件里,这个硬件是不是就是智能了.

2017年人工智能研究报告

- - 互联网数据中心-199IT
81%的IT公司正在或者计划投资人工智能(AI). Cowen预测人工智能将会将人类的生产力提升到一个新的水平,而微软会冲在最前面. 数字化市场或市场自动化、Salesforce自动化(CRM)和数据分析将成为人工智能最为成熟的三大应用领域. 据angel.co的数据显示,目前有2200多家人工智能初创公司,其中超过50%的初创公司是在最近两年成立的.