当Google谈论机器学习时,它在谈论什么?
Google 一年一度的开发者大会 I/O 2018,本周在硅谷隆重上演。这你已经知道了,关于大会报道,请移步 这里。
开幕前一天,Google 在总部举办了一堂名为“机器学习 101”的人工智能课,尝试用最接地气的方法介绍谷歌在机器学习方面正在做的事情。
这堂课的老师 克里斯汀·罗伯森 (Christine Robson) 是 Google AI(原 Google Research)研究员,主攻人机交互方向。
机器学习是人工智能这个庞杂范畴中的一个重要技术。“人工智能就是让事物变聪明的科学,”罗伯森说。“机器学习技术则是制造能够学习变聪明的机器。”
她用最简单的语句概括 Google 眼中机器学习的定义:
机器学习就是一个新的解决问题的系统。
真的只是数学
首先我们需要理解旧系统和新系统的区别。旧的系统指的是基于规则的系统(rule-based system),需要程序员告诉机器一件事情的规则。
过去几乎所有的程序都属于基于规则,而告诉机器规则的过程就是编程。强大如曾经击败卡斯帕罗夫的深蓝 (Deep Blue),也是基于规则的。但机器学习是通过新的算法,让机器并不需要太多的编程就可以自动学习,自动创造解决问题的系统,
罗伯森使用了“自动” (Automatically) 一词,而非人工智能里的“人工” (artificial) 。
这似乎是为了减少对后者的过分使用,避免因此带来的人工智能“妖魔化”趋势。Google 正意识到围绕人工智能产生的负面效应。
在谢尔盖·布林 (Sergey Brin) 署名的《创始人信》中,这位 Google 的联合创始人提到了人工智能潜在的负面影响,包括对人工智能具有科幻般感知能力的恐慌,以及更近在眼前的,无人驾驶的稳定性问题等。
近两年,人们对人工智能的恐惧明显有所加深,而几乎每一种对这种恐惧的描述中,都有 AlphaGo 的身影。不少人认为,机器学习创造的人工智系统,存在超越人类认知能力的可能性——大量不同算法的结合,可能会带来一个只有机器可以理解的系统。
罗伯森并不这么认为。她希望让对这门学问不熟悉的人知道,“机器学习就只是数学,真的只是数学。而且还是最简单的数学。”
机器学习都是建立在最简单形式的线性代数基础上的。“这么说听起来确实很吓人。但我并不想吓人。我并不认为机器学习系统很难理解。”
而对于机器学习系统会变成一个黑箱的观点,也即大量不同算法融合进一个复杂系统后,人类无法确切知道系统内具体发生了什么——她也认为是个常见的“误解”,不熟悉的人和刚开始接触机器学习者都会遇到。
“机器学习并非一个真的黑箱,如果你研究了一段时间,你会发现在神经网络里,每个结果是可以确切回溯 (trace) 的。“
那么,如何定义回溯?罗伯森认为并不需要准确找到具体哪一个原始数据出了问题。“Google 在这方面做了很多努力,确保我们清楚网络里发生了什么。你想知道输出结果为何出错的时候,把里面的数学部分抽出来分析就行。”
猫咪无处不在
和互联网以及社交网络一样,机器学习这个圈子里,最有存在感的是猫。
罗伯森引用 YouTube 学习识别猫咪图像的案例,来介绍了神经网络通过多个层级来完成学习的过程,在强调 Google 拥有强大的计算能力时,罗伯森也用猫咪做例子:“Google 能够分析网上所有猫咪图片,尽管猫咪图片的数量真是多的可怕。”
猫俨然成了让机器学习走进人间的利器。“在 Google,我们很擅长关于猫的事情。”
医学应用取得突破
不过,光有猫肯定不够。“当我们把分析猫的技术,应用于其他领域,这就更加令人兴奋。”罗伯森说。
目前,Google 在机器学习方面最骄傲的应用领域是医学。近几年的 I/O 开幕演讲中,CEO 颂达尔·皮柴 (Sundar Pichai) 经常提到 机器学习帮助识别糖尿病视网膜病变的案例,该公司使用一个 26 层的卷积神经网络进行训练,得到的诊断敏感度和准确率都高于职业眼科医生。
医学领域不像猫一样,Google 最初使用的图像数据库只有几千张,但该公司的机器学习系统依然能够取得令人满意的结果,为医生的诊断提供重要帮助和效率提升。比如在识别乳腺癌的研究中,Google 只用了 270 张图片做训练。
罗伯森形容自己是一个“Machine Learning person”,而 Google 给了她充足支持。“我的 CEO 对人工智能充满激情,这也让我对我的工作感到兴奋。”
“Google 的目标是让人工智能普及化,每个人都可以使用。”
罗伯森指出,Google 在机器学习和人工智能上所做的事情主要有三个:第一,让 Google 的产品更加好用,这在今年 I/O 宣布的 Android、Google Assistant 等产品上有很强的体现;第二,把最尖端的技术开放给大众,让每个人都可以参与进来,这个目标通过 AutoML、ML Kit 等开发者工具实现了。
第三,就是为人类现在面对的问题带来变革。人工智能很有可能是人类在漫漫的历史长河中,迄今为止开发出的最重要的技术。就像人们掌握了取火和发电的能力那样,人工智能将作为一种更高效率和变革性的存在,帮助人类解决被认为不可解决的难题,迈向更好的世界。
Google 的每一位人工智能研究者都对此坚信不疑。