腾讯杰出科学家写给2029的信:计算机视觉AI技术的爆点在哪里?
在数不清的视觉AI应用中,我们认为未来技术的爆发点可能来自三个方面:信息的整合和提取、医疗和自动驾驶。
文 | 腾讯杰出科学家、腾讯优图实验室负责人 贾佳亚
腾讯优图实验室总监 戴宇荣博士 郑冶枫博士
编者按:
本期杂志封面人物沈南鹏说过,投资人要思考十年后的情况。不光是投资人,在迷雾重重、混沌不明的当下,市场中的每一个理性人都需要放长眼量,将锚抛在时间之河中较远的地方,以未来丈量现在,才能站立得更坚实安稳。《中国企业家》为此推出特别策划《商业宏宝书·写给2029的信》,组织9位企业家、科学家、经济学家及艺术家,请他们每人写下一封给2029年的信,预测他们眼中10年后的世界,希望能对读者有所裨益。
近年来,计算机视觉AI技术发展迅速,尤其是人工智能的引入大大提升了算法的能力和实用性。在数不清的视觉AI应用中,我们认为未来技术的爆发点可能来自三个方面:信息的整合和提取、医疗和自动驾驶。腾讯优图实验室的AI技术布局也可大致分为上述的三个模块。
信息的整合和提取,主要指内容分析,包括人物识别、行为分析、场景识别、物体检测、语义分割等能够从丰富的图像或视频中提取有意义和结构化的信息,结合落地场景的应用,产生有价值的数据,给予用户或消费者精准的建议。这个领域在近几年进展迅速。举例来说,通过分析用户的点击或搜索行为,建立用户画像,让内容服务平台能够更精准地推荐用户感兴趣的内容。这是Google、Facebook等大公司正在做的事情。在视觉AI技术成熟前,他们的用户画像主要以文字搜索记录的分析为主。但随着视觉AI技术的发展,往后将会有更多的用户行为是从多媒体内容直接提取。并且,信息的整合和提取不会只局限于线上的行为。在大数据和5G普及的未来,将会产生大量的线下数据。通过提炼线下的数据,能够更有效地分析人们的行为,小至商品推荐,大至城市规划,均会使用视觉AI技术,让人们的生活更方便、舒适和安全。
医疗AI的宗旨在于辅助诊断,在人口众多、医师资源分配不均的时代,减少医生的重复性劳动,帮助基层疾病筛查的覆盖。临床上,疾病治疗秉持的观点是:早诊断、早治疗、疾病筛查、及时就医以及精准微创型治疗对整个社会以及人类医疗水平的提高有着前所未有的重大意义。未来十年,智能问诊、智能挂号指引、医疗影像上的自动筛查,如X光肺炎自动检测、心脏影像结构自动分析等将会大量减少医生的工作,让医生更专注解决和处理危疾病人的需求。并且,医疗AI有望实现大部分疾病初筛普及,大数据化以及智能分析有望改变传统就医繁杂的过程,虚拟手术的发展增加医师手术经验,智能手术机器人实现更多疾病的精准微创手术治疗。
自动驾驶是在未来十年必定会到来的技术。当中核心需要解决的问题在于环境识别。目前,在自动驾驶的落地测试中,因为环境识别的错误产生的交通意外,占了90%以上。简单地解释一下,如果自动驾驶是发生在游戏世界,所有环境的数据都能够精准地反馈到负责车控的AI,而AI只需要做决策,那么在这个问题之上,AI的决策能力绝对在人类之上。这个从AlphaGo战胜人类的案例中可以看出,在完全的封闭环境之下,AI的决策能力已经超越人类。而自动驾驶目前还处于测试阶段的原因,是因为对环境信息的不完全理解,因而做成决策错误。而解决这个环境识别的问题,是会随着在路上行车测试数据的不断增加而趋于完美的。这样考虑下来,自动驾驶就是一个必定会到来的技术。同时,基于自动驾驶所产生的应用,为人们带来生活的便利,将会越来越多。
未来十年,首先确定无疑的是,AI算法的各项指标会越来越高,计算机视觉的算法也会在实用的道路上越走越深入:更贴近使用场景、效果更精准。软硬件的进步让基于AI的视觉算法不再受限于特定的计算硬件,而且将成为计算设备看懂世界的常用工具。如今的“多媒体计算机”能够记录并播放多种媒体,未来的计算机将能够读懂多种媒体信息的含义。
计算机视觉AI技术的发展也势必会直接影响我们衣食住行的方方面面。
畅想一下,2029年,商店自动推断出顾客的体型、肤色、年龄,进而推荐合适的穿衣搭配;吃东西之前,自动帮你判断新鲜程度、营养成分、推荐健康的膳食搭配;智能家居进入千家万户,语音、手势可以自由地控制家电,智能安防摄像头帮你照料家中小孩的活动;在医疗方面,疾病检查过程简便化,基层医疗设备更加完善,少数医护人员就可建立疾病筛查点;对某些疾病,便携式的成像设备涌现,傻瓜式的操作、筛查过程进入寻常百姓家,让患者实现自我筛查。十年后的就医,我们不用再为“肚子疼”应该挂哪个科室而烦恼,智能对话分析助手可以通过简单的对话帮患者确定疾病范围、选择科室、做出最佳的检查时间、就医时间安排,简化就医流程。智能手术机器人变得更加智能化、微细化,术后愈合快,减少手术带来的痛苦。
无人驾驶汽车的普及,将会大量释放物流业的人力成本,让B to C的生意更容易和快捷,物价将会因为人力成本的减少变得更合理。泊车时将不再需要忙于寻找车位,长途汽车旅游将会有更多的休息时间,无人计程车让人们能够即叫即走,女士晚上叫车将会更安全,城市交通也会因为更好的路线规划而减少阻塞。
AI将赋予计算机理解世界的能力,计算机能更好地帮助人类分析规划,作出决策。当然,计算机视觉AI技术的想象空间无限大。但是从技术研究到实际落地应用还有很长的路要走,这也是所有相关研究人员努力的方向和愿景。
转载:中国企业家杂志