国内人工智能公司在国际大赛上拿了一堆第一,但你知道他们到底在比什么吗?

标签: 国内 人工智能 公司 | 发表时间:2017-10-30 21:13 | 作者:
出处:http://main_test.geekpark.net/rss.rss

作为人工智能的一个重要分支领域之一,计算机视觉在商业化上已经取得了不可小觑的成绩,这同时也让商业群体开始关注到学界在计算机视觉领域的研究。

此时此刻,在意大利的威尼斯,刚刚结束的 2017 年国际计算机视觉大会上,来自中国的旷视科技研究院在 COCO 和 Places 竞赛中参加了 4 项比赛,并拿下了三项第一,一项第二,领先于微软、Facebook 和 Google 等科技巨头。

关注到这一优秀的成绩,极客公园第一时间通过远程语音采访了远在威尼斯的旷视科技参赛团队的带头人姜宇宁,请他来为我们科普一下这场备受行业瞩目的竞赛。


两个大赛:一个针对东西,一个针对背景

首先介绍一下 COCO 和 Places 这两个竞赛。

COCO 的全称是常见物体图像识别(Microsoft Common Objects in Context),起源于微软出资标注的一个数据集,与此前著名的 ImageNet 比赛同样被视为是计算机视觉领域最受关注和最权威的比赛之一,也是目前该领域在国际上唯一能汇集 Google、微软、Facebook 以及国内外顶尖院校和优秀创新企业的大赛。

相较于更关注整体图像分类的 ImageNet,COCO 重在图像中的物体检测,打个比方,对于一张几条狗的照片,ImageNet 更注重参赛者能否将这张图片归类到「狗图」那一类,而 COCO 则注重于你能否识别出图片中的动物是不是狗,有几条,分别出现在图片上的什么位置等。

目前 COCO 已经举办到了第三届,前两届的冠军分别是微软和 Google。

今年的 COCO 比赛包含 4 个子项,分别是 物体检测物体分隔人体关键点检测和背景语义检测,旷视科技参加了前三项的比赛,姜宇宁也向我们解释了这几项比赛的具体内容。

物体检测在上面已经有了基本的介绍,在计算机的交互界面上主要表现为用矩形框将物体框住。

物体分割则是在物体检测上更进一步,不仅仅要确定物体在某一区域,还要对物体在图片上的形状做一个更加细节性的定位。接着拿上面的「狗图」举例,在物体分割的比赛中,参赛选手要让计算机识别出每条狗在图片上的具体形状,最终表现在二维图片上的效果类似于画图中的「描边」。

人体关键点检测技术主要针对于图片中的人体,计算机不仅仅要识别出人的位置、确定在图上的细节形状,还要确定人的手、肩膀、腿等关键点的具体位置。

不同于 COCO 对物体的着重,与之同期举办的 Places 竞赛则更注重场景的检测。今年的 Places 开放了 3 个子项, 场景分割物体分割以及 边缘检测。旷视科技参加了物体分割,并在挑战中击败 Google,赢得了该问题的冠军。

据姜宇宁解释, 场景分割即把物体和背景分割开来,继续「狗图」的例子,假使两条狗在一起,物体分割就需要把两条狗分割开来,而场景分割「只需要描 1 个边就可以了」。

至于 边缘检测,则是对不同物体的边缘进行「分辨」,假使「狗图」中还有一只猫,那么猫与狗的边缘和狗与狗的边缘在这项任务中是不同的。姜宇宁提到,这项技术比较难,今年只有 6 支队伍参加,并且没有一支队伍取得了「看得过去的成绩」,所以最后并没有对这项比赛进行颁奖。


这些高大上的技术都有什么用?

姜宇宁提到,其实 物体检测是「所有计算机视觉的技术中最基本、最重要但却最不容易被大众察觉到的一个关键步骤」。

就好像吃饭前要洗手一样,现在计算机视觉一个比较热门的应用是人脸识别,而在人脸识别系统中第一个步骤就是人脸检测,「第一步就是把人脸找到并抠出来,再进行人脸识别。」

在旷视最重要的产品 Face++上,这样的基础性技术就非常重要。「在安防的视频结构化的场景中,行人、车牌、车辆的目标分析,第一步就是找到目标;同样在无人驾驶这样的应用中,物体检测技术也是一个非常非常基本的条件。」

人体关键点检测技术则更多地应用于行为动作分析和人机交互的场景。

比如在监控和无人超市这样的场景中,机器需要知道顾客有没有拿东西,第一步就是检测顾客的手「有没有伸出去」,对机器来说,这需要它确定摄像头拍摄下的顾客的手上一帧在哪,现在这一帧在哪,从而分析出顾客的手是否发生了移动。

在很多体感游戏机上, 人体关键点检测技术就得到了广泛的应用。

总的来说,竞赛的各项技术都是人工智能应用中的基础型技术,用姜宇宁的话来说,就是人工智能企业的「内功」。

从某种程度上来说,包括旷视、商汤在内的多家国内企业和高校在 COCO 和 Places 这种国际权威的大赛上取得不错的成绩,其实是国内人工智能行业硬实力的体现。当极客公园问到姜宇宁为什么要出去参加这项比赛时,他说道,「最重要的是检验自己的『内功』,在比赛中发现平时的研究是否有疏漏不足的地方,其次是要锻炼年轻的研究队伍,这次参加比赛的团队平均年龄大概只有 22 岁,很多人还是本科在读。」

「没想过要出去秀一下肌肉吗?」

姜宇宁笑着回答说,「这也算是原因之一吧。」


头图来源:视觉中国

责任编辑:早优夫斯基


相关 [国内 人工智能 公司] 推荐:

国内人工智能公司在国际大赛上拿了一堆第一,但你知道他们到底在比什么吗?

- - 极客公园
作为人工智能的一个重要分支领域之一,计算机视觉在商业化上已经取得了不可小觑的成绩,这同时也让商业群体开始关注到学界在计算机视觉领域的研究. 此时此刻,在意大利的威尼斯,刚刚结束的 2017 年国际计算机视觉大会上,来自中国的旷视科技研究院在 COCO 和 Places 竞赛中参加了 4 项比赛,并拿下了三项第一,一项第二,领先于微软、Facebook 和 Google 等科技巨头.

全球最值得关注的100家人工智能公司(中国27家)

- - 互联网的那点事
 We believe AI should be an extension of individual human wills and, in the spirit of liberty, as broadly and evenly distributed as possible.    「AI00 ,这是一个开源项目」.

人工智能技术新进展

- - 生命奥秘
新的计算机人脑模型可以模拟更加复杂的人类行为. 人类的大脑是一个高度复杂的器官,在众多对人类大脑的研究工作当中就包括了从分子水平到人类行为活动水平等多个层面采集大脑相关信息的工作. 这种超大范围的研究方式很有可能会让大脑研究走向专业不断细化的发展方向,这种趋势虽然有利于大脑研究的不断深化,可是同时也会带来知识碎片化的结果.

由人工智能管理的港铁

- - Solidot
港铁公司运营香港地铁跻身全世界最出色地铁系统之列,它的准时抵达记录高达99.9%,超过了伦敦和纽约地铁. 数百公里长的繁忙地铁系统需要大量人力维护,港铁公司平均每周有多达1万人执行2600项维护工作,工人们工作都是提前规划好的,由人工智能进行管理. 港铁公司计划将人工智能推广到它在其它城市运营的地铁系统,其中北京有可能第一个采用.

[微言]人工智能有多可怕?

- - 海德沙龙(HeadSalon)
@whigzhou: 花了两个多小时思考强人工智能引出的问题,得出的结论是:相信陪审团. 然后发现,这不就是 我去年得出过的结论嘛~哈. 不过,其间经历的逻辑链条那是相当漫长,而且有了一些新想法,容我慢慢道来. @whigzhou: 1)强人工智能很快(也就是几十年内)会出现;2)强AI的出现会让世界很不一样,但并不像有些人所想象的#那么#不一样;3)其实,“只有一小撮人(或组织)有能力做一些绝大多数人做不到、甚至完全无法理解的事情”——这早就不是什么新鲜事了.

注意:人工智能非你所想!

- - 译言最新精选
译者: 果果向前冲 原文地址: gizmodo.com. 艾萨克·阿西莫夫的机器人三定律还不足以控制人工智能. 上图是幻想插画家之父迈克尔·蕙兰为《曙光中的机器人》设计的封面. 近20年前“深蓝”与盖里·卡斯帕罗夫对战象棋获胜一事被誉为史上最具意义的机器智能测试. 时至今日,谷歌的“阿法狗”与国手李世石在围棋锦标赛中决一胜负,对决前三局两次告捷,表明多年来人工智能经历了显著进化.

恰到好处的人工智能

- - 可能吧
技术不应该给用户带来使用难度,而是提高效率,并恰到好处地提供帮助. 这是我在使用 Google 智能音箱 Google Home 之后的总结. 智能、AI,是今年创投圈的关键词. 如果你在京东、淘宝上搜索各种家电,多多少少这些产品都会说自己是「智能」的,到底什么是智能. 把安卓系统塞到硬件里,这个硬件是不是就是智能了.

2017年人工智能研究报告

- - 互联网数据中心-199IT
81%的IT公司正在或者计划投资人工智能(AI). Cowen预测人工智能将会将人类的生产力提升到一个新的水平,而微软会冲在最前面. 数字化市场或市场自动化、Salesforce自动化(CRM)和数据分析将成为人工智能最为成熟的三大应用领域. 据angel.co的数据显示,目前有2200多家人工智能初创公司,其中超过50%的初创公司是在最近两年成立的.

我第一次谈人工智能

- - IT瘾-dev
不知道谁这么坏,给起了一个人工智能这个词,让通过科幻片才了解啥叫智能的普罗大众老误解人工智能,就像现在我仍然对智能手机这个词有微言,这怎么就智能了呢. 从现在表现出来的人工智能规模应用来说,本质上就是个概率统计的事,和智能根本不沾边,倒是和人工挺沾边,需要人工做大量的数据标准化加工、数据标注,再喂给算法.

ChatGPT背后人工智能算法

- - 今日话题 - 雪球
ChatGPT背后人工智能算法,关键的原创技术,其实全部都是国外公司发明的. 这里做一点简单的科普,人工智能原创性研究,中国还有很大进步空间,ChatGPT也不是普通的公司能够复刻的出来的. 深度残差网络(ResNet)由微软(亚洲)研究院发明. 在此之前,研究员们发现深度神经网络的效果要比浅层神经网络要好得多,这也就是所谓的深度学习.