当Google谈论机器学习时，它在谈论什么？

标签： google 机器学习 | 发表时间：2018-05-12 19:05 | 作者：

出处：http://news.cnblogs.com/

Google 一年一度的开发者大会 I/O 2018，本周在硅谷隆重上演。这你已经知道了，关于大会报道，请移步这里。

开幕前一天，Google 在总部举办了一堂名为“机器学习 101”的人工智能课，尝试用最接地气的方法介绍谷歌在机器学习方面正在做的事情。

这堂课的老师克里斯汀·罗伯森 (Christine Robson) 是 Google AI（原 Google Research）研究员，主攻人机交互方向。

机器学习是人工智能这个庞杂范畴中的一个重要技术。“人工智能就是让事物变聪明的科学，”罗伯森说。“机器学习技术则是制造能够学习变聪明的机器。”

她用最简单的语句概括 Google 眼中机器学习的定义：

机器学习就是一个新的解决问题的系统。

真的只是数学

首先我们需要理解旧系统和新系统的区别。旧的系统指的是基于规则的系统（rule-based system），需要程序员告诉机器一件事情的规则。

过去几乎所有的程序都属于基于规则，而告诉机器规则的过程就是编程。强大如曾经击败卡斯帕罗夫的深蓝 (Deep Blue)，也是基于规则的。但机器学习是通过新的算法，让机器并不需要太多的编程就可以自动学习，自动创造解决问题的系统，

罗伯森使用了“自动” (Automatically) 一词，而非人工智能里的“人工” (artificial) 。

这似乎是为了减少对后者的过分使用，避免因此带来的人工智能“妖魔化”趋势。Google 正意识到围绕人工智能产生的负面效应。

在谢尔盖·布林 (Sergey Brin) 署名的《创始人信》中，这位 Google 的联合创始人提到了人工智能潜在的负面影响，包括对人工智能具有科幻般感知能力的恐慌，以及更近在眼前的，无人驾驶的稳定性问题等。

近两年，人们对人工智能的恐惧明显有所加深，而几乎每一种对这种恐惧的描述中，都有 AlphaGo 的身影。不少人认为，机器学习创造的人工智系统，存在超越人类认知能力的可能性——大量不同算法的结合，可能会带来一个只有机器可以理解的系统。

罗伯森并不这么认为。她希望让对这门学问不熟悉的人知道，“机器学习就只是数学，真的只是数学。而且还是最简单的数学。”

机器学习都是建立在最简单形式的线性代数基础上的。“这么说听起来确实很吓人。但我并不想吓人。我并不认为机器学习系统很难理解。”

而对于机器学习系统会变成一个黑箱的观点，也即大量不同算法融合进一个复杂系统后，人类无法确切知道系统内具体发生了什么——她也认为是个常见的“误解”，不熟悉的人和刚开始接触机器学习者都会遇到。

“机器学习并非一个真的黑箱，如果你研究了一段时间，你会发现在神经网络里，每个结果是可以确切回溯 (trace) 的。“

那么，如何定义回溯？罗伯森认为并不需要准确找到具体哪一个原始数据出了问题。“Google 在这方面做了很多努力，确保我们清楚网络里发生了什么。你想知道输出结果为何出错的时候，把里面的数学部分抽出来分析就行。”

猫咪无处不在

和互联网以及社交网络一样，机器学习这个圈子里，最有存在感的是猫。

罗伯森引用 YouTube 学习识别猫咪图像的案例，来介绍了神经网络通过多个层级来完成学习的过程，在强调 Google 拥有强大的计算能力时，罗伯森也用猫咪做例子：“Google 能够分析网上所有猫咪图片，尽管猫咪图片的数量真是多的可怕。”

猫俨然成了让机器学习走进人间的利器。“在 Google，我们很擅长关于猫的事情。”

医学应用取得突破

不过，光有猫肯定不够。“当我们把分析猫的技术，应用于其他领域，这就更加令人兴奋。”罗伯森说。

目前，Google 在机器学习方面最骄傲的应用领域是医学。近几年的 I/O 开幕演讲中，CEO 颂达尔·皮柴 (Sundar Pichai) 经常提到机器学习帮助识别糖尿病视网膜病变的案例，该公司使用一个 26 层的卷积神经网络进行训练，得到的诊断敏感度和准确率都高于职业眼科医生。

医学领域不像猫一样，Google 最初使用的图像数据库只有几千张，但该公司的机器学习系统依然能够取得令人满意的结果，为医生的诊断提供重要帮助和效率提升。比如在识别乳腺癌的研究中，Google 只用了 270 张图片做训练。

罗伯森形容自己是一个“Machine Learning person”，而 Google 给了她充足支持。“我的 CEO 对人工智能充满激情，这也让我对我的工作感到兴奋。”

“Google 的目标是让人工智能普及化，每个人都可以使用。”

罗伯森指出，Google 在机器学习和人工智能上所做的事情主要有三个：第一，让 Google 的产品更加好用，这在今年 I/O 宣布的 Android、Google Assistant 等产品上有很强的体现；第二，把最尖端的技术开放给大众，让每个人都可以参与进来，这个目标通过 AutoML、ML Kit 等开发者工具实现了。

第三，就是为人类现在面对的问题带来变革。人工智能很有可能是人类在漫漫的历史长河中，迄今为止开发出的最重要的技术。就像人们掌握了取火和发电的能力那样，人工智能将作为一种更高效率和变革性的存在，帮助人类解决被认为不可解决的难题，迈向更好的世界。

Google 的每一位人工智能研究者都对此坚信不疑。

本文链接

当Google谈论机器学习时，它在谈论什么？

相关 [google 机器学习] 推荐：

Google 开源机器学习数据集可视化工具 Facets

当Google谈论机器学习时，它在谈论什么？

Google 发布关于机器学习工程的最佳实践

前提条件和准备工作 | 机器学习速成课程 | Google Developers

机器学习五步走

机器学习之路

机器学习算法Boosting

Mahout实现的机器学习算法

国内的机器学习几个人

Apache Mahout 0.8 发布，机器学习库

相关文章

订阅