我第一次谈人工智能
不知道谁这么坏,给起了一个人工智能这个词,让通过科幻片才了解啥叫智能的普罗大众老误解人工智能,就像现在我仍然对智能手机这个词有微言,这怎么就智能了呢?从现在表现出来的人工智能规模应用来说,本质上就是个概率统计的事,和智能根本不沾边,倒是和人工挺沾边,需要人工做大量的数据标准化加工、数据标注,再喂给算法。所以,有必要理解人工智能需要啥基础、人工智能为啥火了、人工智能能干啥。
(1)主航道
20年前,我来北京的时候带了六本书:Windows核心编程、TCP/IP协议第一卷、数据库原理、CORBA系统结构(2000年在北京买的)、人工智能专家系统、Delphi高级开发指南。这六本书基本把从操作系统层到网络层,从数据层到逻辑层到UI层全都涵盖。
20年后,2018年,我提出了技术下半场:UI人机交互靠人工智能视觉识别/语音交互、传感器/IOT万物物联,逻辑处理靠人工智能关联推荐算法,数据靠区块链来整合各方数据源,算力靠云计算(量子计算还谈不上)。我们各种应用应该在这样一个基础技术环境下来重新考虑用户的问题、用户的应用场景、用户的应用设计。
20年前,我和同寝室的舍友讲:未来是你要找的正在找你,未来手机就是能移动的电脑,未来汽车也是能移动的电脑。说这话,已经过去了快20年。这三个都是极其高的门槛。
未来是你要找的正在找你,这里面涉及三个问题:你是谁,你在哪儿,怎么触达你。你是谁,在今天来说,就是用户主数据、就是统一ID、就是画像标签、还包括你的关系网络;所谓统一ID,就是唯一识别你,如你的身份证号、你的手机号/邮箱地址、你的设备MAC号和cookies、你的社交网络账号如微信/QQ/微博、你的交易支付账号如支付宝,当然也包括你这张脸;你在哪儿,所以各种定位你的方式都有用,如GPS、4G、WIFI、人脸识别(车牌识别)都是关键需要。怎么触达你,所以各种通信通达也很有价值,如短信/电话、邮件、IM、移动app消息/手机通知中心、智能助手/智能音箱。
未来手机就是能移动的电脑,目前已经实现。产生了诸多巨头公司,如在芯片层面的ARM和高通,操作系统层面的iOS和Android、手机层面的iPhone和小米。应用层面更是百花齐放,有语音消息之于微信、GPS之于滴滴、摄像头AI美颜之于直播抖音。
未来汽车也是能移动的电脑,这个目前正在如火如荼之中。Google先铺垫了十年,在很多基础技术方面积累很深。2017年开始,百度人工智能方面的科技人才纷纷离职百度创业,不少人投身的方面就是新能源无人驾驶汽车产业链。新能源动力引擎简化了不少汽车的研发设计、零部件、制造工艺、成本,直接跳过了传统汽车最复杂最核心的内燃机和变速箱,这为互联网企业造车提供了基础条件,但电池又成为了新的核心技术。车辆控制方面需要的芯片和OS,环境感知方面需要的传感器和摄像头,路径规划方面需要的GPS和地图,这条产业链很长。互联网造车是个必经的阶段,来自易车网和易鑫汽车金融的李斌的蔚来汽车、来自汽车之家的李想的车和家、来自UC创始团队的何小鹏的小鹏汽车、还有大家说的“大忽悠”贾跃亭的FF汽车,只有这些来自互联网的人,才能把未来汽车造成移动电脑的本质。
我之所以在这篇文章开首这么谈,主要想告诉大家:未来人工智能技术的应用主航道在哪里。
(2)人工智能基石完备了
人工智能三大关键基础基石:算法、算力、数据。
人工智能三大技术领域:视觉识别、语音交互、自然语言处理。
人工智能这个技术领域,已经六十年了,主要在算法层面在钻研。但缺乏算力和数据,所以算法的优化一直很慢。
2016年,人工智能热潮再次引爆,为啥引爆?这是因为Google做了四件大事:
1、算法:简化了多层深度神经网络算法,让算法复杂度大大降低一个等级,让算力需求量缩小,让数据需求量缩小,便于在算力、数据存储都很受限的移动设备、物联设备环境内使用。因为移动设备、物联设备是未来主要的应用场景
2、算力:于2016年发布了专门AI运算的TPU芯片,专门为AI运算优化
3、工具:于2016年开源了Tensorflow最初始版本,把算法内置在代码工具里,可以让普通公司也能使用AI技术
4、应用:于2016年发布了AlhpaGo,并全世界挑战围棋大师,数战成名。想起上世纪90年代人工智能热的时候,也是IBM的深蓝服务器搞了国际象棋应用挑战了全球国际象棋大师一战成名。
至于数据嘛:
1、数据产生:人手一部的智能移动手机、智能设备OS、摄像头/麦克风/传感器,让多媒体数据(语音/照片/视频)产生数量级的爆炸;
2、数据传输:4G5G有利于数据随时随地高速传输带宽
3、数据存储:NOSQL有利于各种数据扩展存储;
4、数据计算力:以Spark为代表的大数据技术平台有利于海量数据处理;
这些基础技术的大规模商用,让数据产生、采集、传输、存储、计算,提供了完整的基础支撑。所以这次人工智能又再次活了过来。
现在,在计算世界:IOT端-边缘端-管端-云端,人工智能需要的:算力、算法、数据三大核心要素,全都具备了。
而中国人喜欢做的,是解决方案,从芯片/处理服务器(云计算),到软(AI处理引擎)硬件(商用摄像头/语音交互音箱)具体应用,到行业场景,一揽子。这是中国的特点,只有这样在中国才能挣钱、中国客户才买单。
(3)过去:自然语言处理
其实在2016年AlphaGo火爆、人工智能创业热和VC投资热之前,人工智能已经被广泛应用了,只不过我们那时候不把他们当做人工智能这么酷的词来看待。
那就是自然语言处理这一大人工智能分支,它崛起于文字内容互联网时代。算法用的最多就是分类聚类。
在文本内容生产方面,如何做到热点选题,如何做到智能起标题党可以提高文章打开率,如何智能提取关键内容让读者很快抓住重点,如何内容结构化让文章更思路清晰,如何快速且精准地审核防范内容风险,如何给内容自动分类、智能打标签,这都得益于自然语言处理技术。
在文本内容消费方面,应用最广的就是:精准搜索、关联推荐。Google和百度的精准搜索、关联广告,淘宝京东的商品关联推荐、千人千面商品展示,今日头条的关联推荐、滴滴的人车物流最佳匹配调度、菜鸟网络的车货物流最佳匹配调度,皆是此技术的代表应用。舆情监控与自动处理也算这个范畴。
在文本内容交互方面,如今所谓流行的文本智能交互机器人(IM),其实也是这个技术的价值应用,省却了很多售前售后接待的工作量。
自然语言处理技术通过分类聚类算法,还能实现一个非常有价值的应用,那就是关联图谱。人和人之间的关系图谱、企业和企业之间的关系图谱、商品之间的关系图谱、人和企业之间的关系图谱、人和商品之间的关系图谱。这给精准营销、交易转化带来了很高的价值。
自然语言处理技术最成熟,开源的引擎也很多,我们只要在自己的行业的各个场景充分应用它,就能发挥巨大价值。我现在在各行各业的企业信息化领域也很少看到应用自然语言处理技术的,大多数企业信息化都以业务流程处理为重心,不以数据处理为重心。
再着重重复讲一句话:咱们都是技术的先驱者。咱们认为一场技术大战已经格局已定没什么机会了,其实在广袤的中国各行各业,它的应用机会才刚刚规模化来临。
(4)现在:视觉识别
人工智能目前火爆并实用的第一波应用就是:视觉识别。更确切地讲,应该是人脸识别。
为啥视觉识别这么宽的领域,独独是人脸识别应用先崛起?无他,智能手机高清摄像头普及后,自拍人脸数据量增多了,美颜萌照应用需求也在拉动,所以才会被规模性引爆。
一、视觉识别在数字内容方面的应用
1、美颜、萌照
2、媒体:内容审查与内容处理。想起小编为了波叔处理了三天三夜就觉得这视觉识别价值真高
3、医疗:影像对比识别
4、教育:在线教育题库拍照识别搜题
二、人脸识别在社会基础设施方面的应用
人脸识别首先在安全要求高的场景中被广泛应用:如雪亮工程城市安防、公检法、社保民政(不知道你给你爸爸妈妈在手机App上做过养老金续领的人脸认证不);如交通要塞(机场/火车站/地铁);如和钱交易支付有密切关系的金融(不知道你体验过眨眨眼睛或动动嘴摇摇头的人脸识别支付不 )。
三、人脸识别在线下营销方面的应用
媒体行业是内容吸引用户流量,靠营销广告变现。现在线下广告,如电台电视台、户外路牌、楼宇海报、报纸杂志,都做不到流量统计、用户识别、用户行为跟踪,这为他们的广告业务增长带来了阻力。户外路牌、楼宇海报首先进行了自我革命,加装了摄像头,加入了人脸识别技术,各个广告被多少人看了,人们看的行为反应是什么,这些人都是些什么特征的人,全都知道。
四、人脸识别在线下零售方面的应用
亚马逊的Amazon Go智能无人零售商店,顶棚安满了摄像头进行商品识别、消费者人脸识别、消费者购物路径的跟踪、消费者购物行为跟踪。只有这样做,才能做到和线上同样的功效。因为在在线上很容易很低成本做到的用户流量统计、用户识别、用户行为跟踪,在线下需要很复杂的技术才能做到。电子商务就是得益于用户流量统计、用户识别、用户行为跟踪这三大基础应用,所以能比线下零售做到更优秀的智能广告投放流量吸引、智能选品、智能陈列、智能关联推荐、智能定价、智能促销活动、智能实时优惠券,而线下零售就是受制于这些线下技术达不到线上的效果,所以线下的零售转化率不高。
(5)未来:语音交互
我最早应用语音合成(文字转语音)是在做企业信息化的时候,主要的应用场景是:医院门诊药房叫号让患者来窗口取药、客服中心自动语音导航播报。所以现在只要使用语音播报的地方,都大量采用了人工智能语音合成,不需要人工。
现在最火的是语音-语音识别,在教育领域实用性最强,如口语测验与矫正,如音乐弹奏(演唱)测验与矫正。所以作为中国语音技术第一股科大讯飞,主要就扎堆在教育应用领域。现在火热的智能音箱、儿童陪伴机器人创业,其实利用的也都是这个技术。
语音技术什么时候可以赚大钱,可能真的需要等互联网造车成熟。在车上,手、脚、眼睛都在忙碌,只有语音可以解放出来。
记住,没有消费级的应用出现,技术无处安放。