我们能从机器人世界杯学到什么
(《新知客》,2010年6月)
“如果你不知道往哪踢,就往门里踢”,多年以前施拉普纳曾经这样教中国队。也许这只是德国人调侃,但很多球队即将怀着这样简明易懂的战术参加本届世界杯赛 — 好在他们不是去南非,而是去新加坡参加另一场世界杯足球赛:机器人的世界杯。这项由日本发起的赛事规模越来越大,它的目标是在2050年,让一支机器人足球队战胜人类世界杯冠军。人类球员对此不必过分担心,从目前的发展水平来看,我们距离把足球比赛外包给机器人的那一天还非常遥远。
即使是这样,我们仍然能从机器人比赛中学到非常有价值的东西,这个价值不是关于机器,而是关于我们。通过考察机器人球员的弱点,我们可以了解人的优势到底是什么。更进一步,我们可以了解人到底是怎么学会各种技能的。
最引人瞩目的比赛是类人组。这是目前最先进的机器人球员,他们身高相当于一两岁到四五岁的小孩,本届世界杯甚至首次有了成人身高组。他们直立行走,用脚来踢球,而不像小型组球员那样被装在轮子上。除了发现球,追上球和射门这些基本功能之外,如果机器人在比赛中跌倒,还必须能以一个变形金刚式的动作自行站立起来。看他们做这些动作的时候你会几乎觉得他们是活的。然而面对近在咫尺的球门线上一个几乎不会动的守门员,球就在停脚下,在没有干扰的情况下,一个机器人球员需要30秒的时间来调整自己跟球的相对位置,然后才能完成一个很轻的射门动作。这已经足够成为一个必进球,因为距离太短,球速太“快”,守门员来不及做出任何反应。比赛不但谈不上技战术,甚至谈不上拼抢,大多数情况下能踢到球就很不错了。
相对于机器人研究的现状而言,能踢到球已经是一个相当了不起的成就。据悉尼技术大学的Williams教授介绍,作为机器人,你要在各种状态之间切换。如果你处于无球状态,程序给你的任务是“找到球”,而在球场上的众多物体中判断哪个是球已经是很难的技术。发现球以后你的状态变成“走向球”,你要计算球的方位,调整自己的姿态来面向球,然后才能迈步走过去,这还不算球可能在移动。一旦球在你脚下了,你的状态将变成“拿球”,然后你不必考虑什么复杂的传切配合,只需听从施拉普纳的简单忠告,射门。不过在此之前你还必须完成一个复杂的任务,那就是首先找到球门,然后计算射门角度并寻找一个合适的你跟球和球门的相对位置。
问题在于,人踢球的时候并不做任何数值计算。MIT的计算机科学家Rodney Brooks最近指出, 要想让机器人拥有人的基本智能,它至少需要2岁儿童的物品认知能力,4岁儿童语言能力,6岁儿童的动手能力,和8岁儿童的社交认知能力,而目前的技术水平据此相距甚远。实际上,当前机器人科学家正在研究的问题,是如何让机器人学会怎么区分不同的物体,怎么伸手去把一个物体拿起来,而这些都是人类在一岁以前就掌握的技能。小孩伸手拿东西的时候既不计算出手角度也不用考虑手指组合的姿态,他们几乎是无意识的就能把各种复杂的物体,使用每次都不太一样的姿势抓取过来。我们都会做,可是我们都不知道我们怎么做的。
绝大多数计算机程序,比如传统的专家系统,本质上都是融合了海量知识的一系列 “if… then…”逻辑判断,而这样的系统无法适应真实世界的千变万化,不能算真正的“智能”。在人工智能领域的最前沿,科学家必须一边研究计算机,一边研究人脑。现在美国国家科学基金的 Project One 项目中,来自多个大学的计算机科学家,认知科学家和发展心理学家正在团队合作,目标是创造一个具备一岁婴儿的认知和交流能力的机器人。他们邀请婴幼儿到最尖端的计算机实验室来跟妈妈玩躲猫猫之类的游戏,使用高速摄像机记录每一个动作和反应。在这个项目中,发展心理学家 Lev Vygotsky 发现了婴儿在一岁左右的一个智力跃进:当一个婴儿想要一个玩具而够不着的时候,他会示意妈妈把这个玩具递给他!Project One 正在努力研发世界上第一个具备这种能力 — 不是人指导机器人,而是机器人反过来指导人 — 的机器人。
科学家们发现与其说他们现在更加了解怎么造一个机器人,不如说他们现在更加了解人类自己。当前的一个共识是小孩出生的时候大脑里并没有预存任何关于怎么拿一个物体之类的程序,家长也没给输入,是孩子自己在实践中的不断摸索,试错和练习使他们掌握了这些技能。我们不是通过阅读说明书学会的开车,我们通过上路练习,被人鸣笛抗议,被教练和交警训斥学会开车。人的学习过程不是对动作要领的记忆,而是通过反复练习使得控制身体的各个脑神经元之间不断地连接,以至于从硬件层面对大脑重组。
人工智能研究的趋势就是让机器像人一样具有学习能力,使用软件模拟人的神经网络。机器人球员不再是一出厂就会,他们也需要大量的训练和比赛。比如当机器人做对了一个动作,就给他一个正面的激励,做错了给一个惩罚。通过神经网络的训练,机器人已经学会了从众多物体中识别一个人脸之类的技能。
人的这种学习和判断过程往往是无意识的。畅销书《异类》的作者格拉德威尔的另一本书,Blink(《决断两秒间》)中,就记载了大量的无意识判断的神奇例子。比如一个网球教练每次看电视转播都能预知运动员的发球失误,可是他无法解释自己是根据什么做出的判断。格拉德威尔说不清这个能力来自哪里,归结为人具备的一个超级计算机系统。清华大学赵南元教授在《认知科学揭秘》一书中指出,这套系统来自进化,人工智能研究必须考虑人是进化的产物这个事实。Jonah Lehrer 的 How We Decide 一书也提到,人脑的确有两套计算系统:一套是有意识的用于数值和逻辑计算,这套系统在人类历史中出现较晚,所以速度很慢;而另一套系统,靠神经元的连接重组形成的感情系统,则是数十万年进化的产物,其速度要快得多。
所以人的优势在于“感觉”,在于对“感觉”的训练。美式足球联盟曾经认为球员应该像计算机一样打球。鉴于四分卫的重要性,他们给四分卫候选新秀进行很高难度的智商和数学测验,内容是12分钟内50道越来越难的数学题,认为四分卫在最短的时间内判断场上形势需要用到这些能力。然而事实证明很多最好的四分卫在这种考试中得分很差,他们不是用数学比赛。如果你采访一个四分卫是怎么在关键时刻传出绝妙一球的,他的回答很可能是“我不知道。传球并没有一定之规,我只是感觉应该把球传向那里。”
人类中的大师都这样。在机器人学会说“我只是感觉”之前,他们不可能战胜人类冠军。