线性资本王淮:人工智能,中国比美国进展更快
编者按:本文来自微信公众号 ”线性资本“(ID:LinearVenture),作者王淮Harry;36氪经授权发布。
我们去年写过 深度学习座下的四大神兽,如今这四大神兽已渐次长成,而孕育他们的中美两大创新强国,正在技术与人才的竞争合作中你追我赶,好不热闹。
线性资本专注于早期数据智能的投资,我们在中美量过之间人工智能的技术和产业发展做了一些思考。以下内容整理自线性资本合伙人王淮今天上午在F50中美创新大会上的分享,enjoy:
十年前,我们很难想象我们认识和不认识的人会被一张网无时无刻牢牢的连接在一起。今天,我们也很难想象天天操心的很多事将会在十年后基本上没我们什么事。今天要吃啥,去哪吃,怎么去,买什么衣服好,怎么搭配,赚了多少钱,钱应该怎么花,财应该怎么理,该给谁的朋友圈点赞,机器出方案,你来做决定。甚至你根本就没资格做这个决定,机器帮你做了,而且做得更好。机器的询问无非是让你感觉稍微好一点而已。
我刚才描述的人工智能指导我们生活的几个场景,并非天方夜谭,也不是科幻,这一切正在逐步发生,不以个体的喜好而转移。
我是王淮Harry, 线性资本的合伙人,原来是一个工程师,曾经读过机器学习的PhD,但拿了硕士之后就耐不住寂寞去了硅谷,在美国待了9年时间。我在Facebook还是一家100来个人的时候加入,5年后离开。看着Facebook 从一家小数据公司变成一家处处强调数据驱动的大公司,在我看来,Facebook 应该是最懂得大数据实践到今天的人工智能实践的标杆公司之一,可谓理念,理论和实践并重。同一行列的科技大公司还有谷歌,亚马逊,百度,阿里,腾讯正在发奋追赶中,算半个;其他要么缺理论,要么缺实践。
2012年回国之后,我做了2年天使投资,投了近40家公司。在2014年9月份和另外一位小伙伴张川创办了线性资本,在过去3年内,线性资本一步步聚焦到一件事,只有一件事上 - 数据智能的早期投资。我们基金规模是1亿美元,到目前为止投了数据智能领域大概30多家初创公司,包括很多人可能都听说过的地平线机器人,Rokid,神策数据,桃树科技,中科视拓等的天使轮。还包括今天会给大家分享的做智能医疗的连心医疗和做智能投顾的阿法金融。
今天我的核心观点是 - 人工智能一定会实用化,而中国在这方面的进展要快于美国。我希望在接下来的20分钟内,结合我过去在美国的经验,和在中国的实践,从技术型投资人的角度对中美两国人工智能产业发展做一个分析和比较。
首先,人工智能是一个实用性技术。它并非Rocket Science.
从学术上而言,它并非一个新生物。如果把人工智能之父Minsky在1956年召开第一个人工智能主题的会议当做研究开端的话,已经有70年历史。但一直到5年前我还在 Facebook 的时候,在公司里我们从来不提人工智能这个词,要么说自己是数据挖掘,最多说机器学习。但不会讲人工智能,因为让人工智能变得火爆的神经网络技术在当时并不成熟。在当时的工业界,系统性的大数据基础架构的工作都还在进行中,针对的场景问题大多是强特征的,对于神经网络特别擅长的表征提取能力并没有需求。如果没有最近几年的图像声音处理方面的需求爆发,深度学习实用化的进展不会如此之快。而图像声音处理的需求更要感谢智能手机的普及。今天一天产生的图片数大概是1000亿这个量级,是5年前移动时代所谓元年的100倍,这还不包括我们国家特别多的监控摄像头产生的数据量。
所以人工智能的火爆要感谢相机应用的火爆,相机应用的火爆要感谢智能手机的普及。所有事情都是连接到一些,水到渠成自然发展起来的。但人工智能的未来不能只依赖于图像处理。人工智能如果要想持续性的发展,其实用性一定会拓展,从现在流行的图像声音处理拓展到其他复杂特征的问题中。其次,人工智能实用性的拓展,是需要这5个方面的配合。大数据,算法,算力,人才,和应用场景。我从这5个方面分析下中美的差异。
1.大数据,没有大数据就没有人工智能。
上面我提到了我真正认同的有大数据和人工智能理论和实践兼具的公司只有谷歌,Facebook,亚马逊,百度和阿里巴巴。他们的数据够大。这些公司只属于两个国家,美国和中国。美国有3.5亿人口,人口世界第三,其中75%居住在城市或城市郊区,综合消费能力世界第一。中国15亿人口,处在一二线城市的人口数量大概是3亿,消费能力不弱,而且消费习惯正在升级中。加上还有巨大的农村市场。这两个国家最大的共同特点都是人口很多,所以产生的数据量很大。
但不同的是,美国的公司普遍是世界性公司,硅谷一向的理念是出生第一天就强调全球化(born to be a global company). 但美国的移动应用的普及数不如中国,因为人口数量和移动应用的活跃度这两项指标都不如中国。但他们的数据可以通过全球其他市场来弥补。美国文化的全球性也让很多美国科技公司的产品容易被别人接受。
中国的数据基本上就是国内产生,但架不住人口绝对数量巨大和高活跃度,中国大型互联网公司产生的数据规模并不比美国同行小多少。换而言之,我们局域网的体量可以和其他所有国家加到一起来媲美。开玩笑说,没有手机陪伴,中国用户都不敢一个人上洗手间。早上起床之前和晚上睡觉之前一定要先批阅奏章才能安心入睡。
共同特点是两个国家的数据呈现几个封闭大岛周边围绕很多数据孤岛的现象。像谷歌垄断了搜索相关的数据,知道用户在 Web 上面从哪里来到哪里去。Facebook和腾讯接近垄断了社交网络,知道你关注了谁,和谁沟通了。阿里巴巴接近垄断了线上交易数据。
这些都是属于封闭的数据大岛,美国公司的特点是愿意用 API 的方式开放部分数据出去,中国大公司的特点是要么投资要么深度合作才有可能实现部分数据的开放。在这点上,微信的开放度是远远不够的,有巨大的改进空间。
但生活之中除了这些普世性的大应用,还有金融,内容,娱乐,交通,饮食等等一类的垂直大应用,也会形成很多数据孤岛。这些孤岛的数目在中国要多于美国,愿意和科技公司合作把数据交出去的概率更高 —— 一是中国的移动化更加彻底,形成的移动数据量更多;二是中国的各个垂直领域更加传统,对于移动化,智能化的需求更加迫切。
这点可以参照支付宝的成功案例,支付宝很大的成功要归结于中国信用卡支付系统的不成熟和移动支付需求的旺盛。这些数据孤岛如果能够被打通的话,是有机会出现1+1大于二的效果。比如反欺诈领域的领头羊公司同盾在综合各公司的交易相关数据形成的用户画像质量和分级能力要强于任何单个客户,而这些二次处理产生的数据,就是属于你自己的独特数据了。
2.算法。
在算法层面,最大的贡献还是泛学术界,包括各大高校和科技公司的实验室。比如 谷歌 微软 IBM 百度 等的 AI Labs。在算法的原创性上,美国的学界要走的更加激进一些,基本上CNN, DNN等等基础方法都是在美国的实验室里最早被提出来。
但有这么几个趋势 : 一是这些原创者当中越来越多的出现华人的面孔,有人做过统计,近四成的机器学习领域的优秀论文是华人所写。二是越来越多的学术界的人往工业界跳,新加坡国立的颜水城教授加入了360负责研究院,山世光老师整合计算所的力量做了中科视拓,谷歌找来斯坦福教授李飞飞来负责新的机器学习部门。三是越来越多的优秀海外华人学者往国内走。我相信的是我们会看到越来越多的原创性的优秀算法会在国内的公司或者高校里出现。
从工业界的进展来看,算法经济作为一个创业角度美国要远比中国做得好。美国的两家代表公司,一是波士顿的datarobot,二是西雅图的algorithmia,强调的是把算法作为一种服务提供出去,但并不触及具体的领域落地。
国内不管是创业者还是投资人,基于对于风险的恐惧,主动的把这个机会让渡于大公司,过于强调闭环和垂直整合。人为的增加了这块创业和融资的难度。殊不知,大公司在提供算法(以及下面会提到的算力)来满足整个业内的需求这点上,不见得有相应的动力和团队激励机制让他们获得持续可靠的竞争力。
在这点上中国的创业者缺乏对愿力的信仰, the power of vision. 而美国的创业者,尤其是西岸硅谷的创业者,创业的第一天就想着改变世界,go big or go home, 这一点是值得我们的创业者也很值得我们的投资人来学习。
3.算力。
神经网络的层数越来越多,所解决的问题也越来越复杂,对于算力的要求越来越高。
拿围棋来说,落子博弈树的空间复杂度是10^300,比起宇宙中的原子数量10^80次还多。各种算法都对于算力提出了巨大的要求。这也是为什么 nVidia 在过去两年内股价上涨了6倍的原因。
这块的创业有两种类型,强调软件和服务,AI computing as service,结合算法+算力,强调技术产品输出的运营能力;另一类是强调软件和硬件的深度结合,更强调创新。如 nVidia,Google,中国像地平线,寒武纪等等,都在尝试不同的角度软硬结合。
有趣的是,专门为算法来优化的硬件在美国是大公司做,中国是创业公司主导。我的理解是,对于很前沿的兵家必争之地,美国的大公司更有忧患意识;中国的大公司比较不着急,先等一个方向相对明显的再去追赶。算法和算力这块的创业对于人才的要求特别高,对于融资金额的要求也很高,创始人基本上都是在大型公司负责过类似问题的超一流的技术人才。当然,对于投资人的要求也很高。毕竟要看懂技术方向,选对人,还要给得起钱。
4.人才。
不管是中国还是美国,对于大数据和人工智能的创业人才提出了比移动时代大得多的要求。
移动时代有很多 low hanging fruits, 所需要的更多是产品能力和狭路相逢勇者胜的精神。在智能创业时代,这些要素仍然需要,但还不够。对于创业者的基本技术素养,对于技术到产品,产品到商品整条路径的时机把握,也要到位。
我们最近做了一个创始人背景统计,投过的近30家此类公司的创始人当中,90%是名校毕业,44%拥有 PhD,近50%有过 Facebook, Google, BAT 的经历。
从历史上来看,美国在人工智能人才的积累有优势,但差距正在被急剧缩小。一方面是通过过去5年多中国的公司在大数据和其应用的大规模实践打造了一大批人才,另一方面是很多国外顶尖的华人在过去几年内纷纷回国,而且这个趋势是越演越烈。在个别公司上,甚至人才质量要高于美国同类公司。
上个月在波士顿的AI考察当中,我最大的感受是美国曝光很多的几个 AI 公司他们的 人才构成,deliverables都不见得比国内类似地位的 AI 公司要好。而这些公司,对于中国的市场都非常有兴趣。有一家做自动驾驶创业公司的老外CEO 直接表示,他们认为自动驾驶的未来在中国,所以他们很早就找了中国投资人作为跟投方,同时在年底来中国进行规模性的合作和融资访问。
5.应用场景。
应用场景,也就是要解决的问题。
美国是世界上一流的发达国家,很多传统领域的发展都非常不错,金融领域有完善的支付系统和信用制度,ERP/SAS 在美国早已盛行多年普遍铺建;但到了移动和智能时代的时候,很多变成了历史性的负担 - legacy。对于移动和智能有需求,但现有的东西还能凑活着用,加上竞争并没有中国市场的激烈和残酷,所以让他们全面移动化和智能化并不容易推进。
在美国生活的一个明显感受是大部分公司还是很强调 Web,而在中国有移动 APP 或者微信公众号比起有网站要重要的多。唯一一个在硅谷最像中国公司的 Uber,也因为各种文化问题惹上麻烦,造成 CEO 的黯然离场。
但在中国,Uber 类型的公司风格是常态,不是变态。本身基础的薄弱,加上竞争环境的恶劣,再加上之前诸如阿里巴巴腾讯等公司提早拥抱高科技实现屌丝逆袭最后换道超车的成功故事的激励,最后浇一把关于AlphaGo大战世界棋手的油,让很多传统领域的中大型公司对于大数据和人工智能有一种本能的渴望和恐惧。
恐惧造就需求 —— 对于行业第一名,希望不要被人工智能加持的行业后来者超车;对于追赶者,希望能获得竞争上的优势,降低成本或者提高决策效率,实现业绩的突破。这就像原始人类对待火的态度,恐惧并渴望。但不管是哪种,对于强调大数据处理能力为主要手段的人工智能创业公司是一个巨大的的利好。这种相对落后的现状加上巨大的市场造成了中国在应用场景上的巨大优势。
同盾在3年内实现了不到一只手的客户数到今天的7000+;桃树在于中大型银行的客户获取的进展上,神策在于互联网和金融客户的获取上,都大大超过了我们的预期。
很多人会在问,哪些方面的AI创业机会比较好。我的回答是你最熟悉和最感兴趣的领域,前者对应着 skill,后者对应着 passion。这比起什么风口猪理论更为重要。不然即使投资人很看好一个领域,也不会选你的团队。
我再来正面回答我们非常看中的三个大的AI+的创业领域 -——一是用数据科技来改造金融;二是 AI+医疗;三是数据对于企业流程的升级再造,可以认为是 SAS 2.0。
我们的很多精力都放在这3块领域上。而这三块的未来,中国的机会都比美国更大。金融行业更传统也更集中;医疗在中国是一个更大的社会问题;企业之前电子化信息化的基础不够,但反而给了一次性跳跃升级的机会。
科技的落地从来不是线性的,而是跳跃性的。我们不是在马车上加马达,而是造了汽车,而汽车的发展让马车基础设施被整体替代掉。我相信智能的落地也会有很多类似的案例出现。
今天仍然有很多人质疑人工智能的未来。我坚信,人工智能的时代一定会来临。会在不断的质疑之中你突然回首,发现未来已来,发现生活的方方面面已经智能化和自动化。只是某些领域的到来可能会早于另外一些领域,在某些国家的到来要早于另外一些国家。
这一点上,我们作为中国人很幸运,因为人工智能在中国落地的速度可能会快于世界上任何一个角落,这给了这个领域的创业者和投资人巨大的机会。祝各位好运