线性资本王淮:人工智能,中国比美国进展更快

标签: 投资人说 | 发表时间:2017-07-06 18:06 | 作者:线性资本
出处:http://36kr.com

编者按:本文来自微信公众号 ”线性资本“(ID:LinearVenture),作者王淮Harry;36氪经授权发布。

我们去年写过 深度学习座下的四大神兽,如今这四大神兽已渐次长成,而孕育他们的中美两大创新强国,正在技术与人才的竞争合作中你追我赶,好不热闹。

线性资本专注于早期数据智能的投资,我们在中美量过之间人工智能的技术和产业发展做了一些思考。以下内容整理自线性资本合伙人王淮今天上午在F50中美创新大会上的分享,enjoy:

十年前,我们很难想象我们认识和不认识的人会被一张网无时无刻牢牢的连接在一起。今天,我们也很难想象天天操心的很多事将会在十年后基本上没我们什么事。今天要吃啥,去哪吃,怎么去,买什么衣服好,怎么搭配,赚了多少钱,钱应该怎么花,财应该怎么理,该给谁的朋友圈点赞,机器出方案,你来做决定。甚至你根本就没资格做这个决定,机器帮你做了,而且做得更好。机器的询问无非是让你感觉稍微好一点而已。

我刚才描述的人工智能指导我们生活的几个场景,并非天方夜谭,也不是科幻,这一切正在逐步发生,不以个体的喜好而转移。

我是王淮Harry, 线性资本的合伙人,原来是一个工程师,曾经读过机器学习的PhD,但拿了硕士之后就耐不住寂寞去了硅谷,在美国待了9年时间。我在Facebook还是一家100来个人的时候加入,5年后离开。看着Facebook 从一家小数据公司变成一家处处强调数据驱动的大公司,在我看来,Facebook 应该是最懂得大数据实践到今天的人工智能实践的标杆公司之一,可谓理念,理论和实践并重。同一行列的科技大公司还有谷歌,亚马逊,百度,阿里,腾讯正在发奋追赶中,算半个;其他要么缺理论,要么缺实践。

2012年回国之后,我做了2年天使投资,投了近40家公司。在2014年9月份和另外一位小伙伴张川创办了线性资本,在过去3年内,线性资本一步步聚焦到一件事,只有一件事上 - 数据智能的早期投资。我们基金规模是1亿美元,到目前为止投了数据智能领域大概30多家初创公司,包括很多人可能都听说过的地平线机器人,Rokid,神策数据,桃树科技,中科视拓等的天使轮。还包括今天会给大家分享的做智能医疗的连心医疗和做智能投顾的阿法金融。


今天我的核心观点是 - 人工智能一定会实用化,而中国在这方面的进展要快于美国。我希望在接下来的20分钟内,结合我过去在美国的经验,和在中国的实践,从技术型投资人的角度对中美两国人工智能产业发展做一个分析和比较。

首先,人工智能是一个实用性技术。它并非Rocket Science.

从学术上而言,它并非一个新生物。如果把人工智能之父Minsky在1956年召开第一个人工智能主题的会议当做研究开端的话,已经有70年历史。但一直到5年前我还在 Facebook 的时候,在公司里我们从来不提人工智能这个词,要么说自己是数据挖掘,最多说机器学习。但不会讲人工智能,因为让人工智能变得火爆的神经网络技术在当时并不成熟。在当时的工业界,系统性的大数据基础架构的工作都还在进行中,针对的场景问题大多是强特征的,对于神经网络特别擅长的表征提取能力并没有需求。如果没有最近几年的图像声音处理方面的需求爆发,深度学习实用化的进展不会如此之快。而图像声音处理的需求更要感谢智能手机的普及。今天一天产生的图片数大概是1000亿这个量级,是5年前移动时代所谓元年的100倍,这还不包括我们国家特别多的监控摄像头产生的数据量。

所以人工智能的火爆要感谢相机应用的火爆,相机应用的火爆要感谢智能手机的普及。所有事情都是连接到一些,水到渠成自然发展起来的。但人工智能的未来不能只依赖于图像处理。人工智能如果要想持续性的发展,其实用性一定会拓展,从现在流行的图像声音处理拓展到其他复杂特征的问题中。

其次,人工智能实用性的拓展,是需要这5个方面的配合。大数据,算法,算力,人才,和应用场景。我从这5个方面分析下中美的差异。

1.大数据,没有大数据就没有人工智能。

上面我提到了我真正认同的有大数据和人工智能理论和实践兼具的公司只有谷歌,Facebook,亚马逊,百度和阿里巴巴。他们的数据够大。这些公司只属于两个国家,美国和中国。美国有3.5亿人口,人口世界第三,其中75%居住在城市或城市郊区,综合消费能力世界第一。中国15亿人口,处在一二线城市的人口数量大概是3亿,消费能力不弱,而且消费习惯正在升级中。加上还有巨大的农村市场。这两个国家最大的共同特点都是人口很多,所以产生的数据量很大。

但不同的是,美国的公司普遍是世界性公司,硅谷一向的理念是出生第一天就强调全球化(born to be a global company). 但美国的移动应用的普及数不如中国,因为人口数量和移动应用的活跃度这两项指标都不如中国。但他们的数据可以通过全球其他市场来弥补。美国文化的全球性也让很多美国科技公司的产品容易被别人接受。

中国的数据基本上就是国内产生,但架不住人口绝对数量巨大和高活跃度,中国大型互联网公司产生的数据规模并不比美国同行小多少。换而言之,我们局域网的体量可以和其他所有国家加到一起来媲美。开玩笑说,没有手机陪伴,中国用户都不敢一个人上洗手间。早上起床之前和晚上睡觉之前一定要先批阅奏章才能安心入睡。

共同特点是两个国家的数据呈现几个封闭大岛周边围绕很多数据孤岛的现象。像谷歌垄断了搜索相关的数据,知道用户在 Web 上面从哪里来到哪里去。Facebook和腾讯接近垄断了社交网络,知道你关注了谁,和谁沟通了。阿里巴巴接近垄断了线上交易数据。

这些都是属于封闭的数据大岛,美国公司的特点是愿意用 API 的方式开放部分数据出去,中国大公司的特点是要么投资要么深度合作才有可能实现部分数据的开放。在这点上,微信的开放度是远远不够的,有巨大的改进空间。

但生活之中除了这些普世性的大应用,还有金融,内容,娱乐,交通,饮食等等一类的垂直大应用,也会形成很多数据孤岛。这些孤岛的数目在中国要多于美国,愿意和科技公司合作把数据交出去的概率更高 —— 一是中国的移动化更加彻底,形成的移动数据量更多;二是中国的各个垂直领域更加传统,对于移动化,智能化的需求更加迫切。

这点可以参照支付宝的成功案例,支付宝很大的成功要归结于中国信用卡支付系统的不成熟和移动支付需求的旺盛。这些数据孤岛如果能够被打通的话,是有机会出现1+1大于二的效果。比如反欺诈领域的领头羊公司同盾在综合各公司的交易相关数据形成的用户画像质量和分级能力要强于任何单个客户,而这些二次处理产生的数据,就是属于你自己的独特数据了。

2.算法。

在算法层面,最大的贡献还是泛学术界,包括各大高校和科技公司的实验室。比如 谷歌 微软 IBM 百度 等的 AI Labs。在算法的原创性上,美国的学界要走的更加激进一些,基本上CNN, DNN等等基础方法都是在美国的实验室里最早被提出来。

但有这么几个趋势 : 一是这些原创者当中越来越多的出现华人的面孔,有人做过统计,近四成的机器学习领域的优秀论文是华人所写。二是越来越多的学术界的人往工业界跳,新加坡国立的颜水城教授加入了360负责研究院,山世光老师整合计算所的力量做了中科视拓,谷歌找来斯坦福教授李飞飞来负责新的机器学习部门。三是越来越多的优秀海外华人学者往国内走。我相信的是我们会看到越来越多的原创性的优秀算法会在国内的公司或者高校里出现。

从工业界的进展来看,算法经济作为一个创业角度美国要远比中国做得好。美国的两家代表公司,一是波士顿的datarobot,二是西雅图的algorithmia,强调的是把算法作为一种服务提供出去,但并不触及具体的领域落地。

国内不管是创业者还是投资人,基于对于风险的恐惧,主动的把这个机会让渡于大公司,过于强调闭环和垂直整合。人为的增加了这块创业和融资的难度。殊不知,大公司在提供算法(以及下面会提到的算力)来满足整个业内的需求这点上,不见得有相应的动力和团队激励机制让他们获得持续可靠的竞争力。

在这点上中国的创业者缺乏对愿力的信仰, the power of vision. 而美国的创业者,尤其是西岸硅谷的创业者,创业的第一天就想着改变世界,go big or go home, 这一点是值得我们的创业者也很值得我们的投资人来学习。

3.算力。

神经网络的层数越来越多,所解决的问题也越来越复杂,对于算力的要求越来越高。

拿围棋来说,落子博弈树的空间复杂度是10^300,比起宇宙中的原子数量10^80次还多。各种算法都对于算力提出了巨大的要求。这也是为什么 nVidia 在过去两年内股价上涨了6倍的原因。

这块的创业有两种类型,强调软件和服务,AI computing as service,结合算法+算力,强调技术产品输出的运营能力;另一类是强调软件和硬件的深度结合,更强调创新。如 nVidia,Google,中国像地平线,寒武纪等等,都在尝试不同的角度软硬结合。

有趣的是,专门为算法来优化的硬件在美国是大公司做,中国是创业公司主导。我的理解是,对于很前沿的兵家必争之地,美国的大公司更有忧患意识;中国的大公司比较不着急,先等一个方向相对明显的再去追赶。算法和算力这块的创业对于人才的要求特别高,对于融资金额的要求也很高,创始人基本上都是在大型公司负责过类似问题的超一流的技术人才。当然,对于投资人的要求也很高。毕竟要看懂技术方向,选对人,还要给得起钱。

4.人才。

不管是中国还是美国,对于大数据和人工智能的创业人才提出了比移动时代大得多的要求。

移动时代有很多 low hanging fruits, 所需要的更多是产品能力和狭路相逢勇者胜的精神。在智能创业时代,这些要素仍然需要,但还不够。对于创业者的基本技术素养,对于技术到产品,产品到商品整条路径的时机把握,也要到位。

我们最近做了一个创始人背景统计,投过的近30家此类公司的创始人当中,90%是名校毕业,44%拥有 PhD,近50%有过 Facebook, Google, BAT 的经历。

从历史上来看,美国在人工智能人才的积累有优势,但差距正在被急剧缩小。一方面是通过过去5年多中国的公司在大数据和其应用的大规模实践打造了一大批人才,另一方面是很多国外顶尖的华人在过去几年内纷纷回国,而且这个趋势是越演越烈。在个别公司上,甚至人才质量要高于美国同类公司。

上个月在波士顿的AI考察当中,我最大的感受是美国曝光很多的几个 AI 公司他们的 人才构成,deliverables都不见得比国内类似地位的 AI 公司要好。而这些公司,对于中国的市场都非常有兴趣。有一家做自动驾驶创业公司的老外CEO 直接表示,他们认为自动驾驶的未来在中国,所以他们很早就找了中国投资人作为跟投方,同时在年底来中国进行规模性的合作和融资访问。

5.应用场景。

应用场景,也就是要解决的问题。

美国是世界上一流的发达国家,很多传统领域的发展都非常不错,金融领域有完善的支付系统和信用制度,ERP/SAS 在美国早已盛行多年普遍铺建;但到了移动和智能时代的时候,很多变成了历史性的负担 - legacy。对于移动和智能有需求,但现有的东西还能凑活着用,加上竞争并没有中国市场的激烈和残酷,所以让他们全面移动化和智能化并不容易推进。

在美国生活的一个明显感受是大部分公司还是很强调 Web,而在中国有移动 APP 或者微信公众号比起有网站要重要的多。唯一一个在硅谷最像中国公司的 Uber,也因为各种文化问题惹上麻烦,造成 CEO 的黯然离场。

但在中国,Uber 类型的公司风格是常态,不是变态。本身基础的薄弱,加上竞争环境的恶劣,再加上之前诸如阿里巴巴腾讯等公司提早拥抱高科技实现屌丝逆袭最后换道超车的成功故事的激励,最后浇一把关于AlphaGo大战世界棋手的油,让很多传统领域的中大型公司对于大数据和人工智能有一种本能的渴望和恐惧。

恐惧造就需求 —— 对于行业第一名,希望不要被人工智能加持的行业后来者超车;对于追赶者,希望能获得竞争上的优势,降低成本或者提高决策效率,实现业绩的突破。这就像原始人类对待火的态度,恐惧并渴望。但不管是哪种,对于强调大数据处理能力为主要手段的人工智能创业公司是一个巨大的的利好。这种相对落后的现状加上巨大的市场造成了中国在应用场景上的巨大优势。

同盾在3年内实现了不到一只手的客户数到今天的7000+;桃树在于中大型银行的客户获取的进展上,神策在于互联网和金融客户的获取上,都大大超过了我们的预期。

很多人会在问,哪些方面的AI创业机会比较好。我的回答是你最熟悉和最感兴趣的领域,前者对应着 skill,后者对应着 passion。这比起什么风口猪理论更为重要。不然即使投资人很看好一个领域,也不会选你的团队。

我再来正面回答我们非常看中的三个大的AI+的创业领域 -——一是用数据科技来改造金融;二是 AI+医疗;三是数据对于企业流程的升级再造,可以认为是 SAS 2.0。

我们的很多精力都放在这3块领域上。而这三块的未来,中国的机会都比美国更大。金融行业更传统也更集中;医疗在中国是一个更大的社会问题;企业之前电子化信息化的基础不够,但反而给了一次性跳跃升级的机会。

科技的落地从来不是线性的,而是跳跃性的。我们不是在马车上加马达,而是造了汽车,而汽车的发展让马车基础设施被整体替代掉。我相信智能的落地也会有很多类似的案例出现。

今天仍然有很多人质疑人工智能的未来。我坚信,人工智能的时代一定会来临。会在不断的质疑之中你突然回首,发现未来已来,发现生活的方方面面已经智能化和自动化。只是某些领域的到来可能会早于另外一些领域,在某些国家的到来要早于另外一些国家。

这一点上,我们作为中国人很幸运,因为人工智能在中国落地的速度可能会快于世界上任何一个角落,这给了这个领域的创业者和投资人巨大的机会。祝各位好运

相关 [线性 资本 王淮] 推荐:

线性资本王淮:人工智能,中国比美国进展更快

- - 36氪
编者按:本文来自微信公众号 ”线性资本“(ID:LinearVenture),作者王淮Harry;36氪经授权发布. 我们去年写过 深度学习座下的四大神兽,如今这四大神兽已渐次长成,而孕育他们的中美两大创新强国,正在技术与人才的竞争合作中你追我赶,好不热闹. 线性资本专注于早期数据智能的投资,我们在中美量过之间人工智能的技术和产业发展做了一些思考.

王淮介绍Facebook的新兵训练营和导师系统

- - InfoQ cn
之前InfoQ曾经发布新闻——《 Facebook元老王淮谈科技公司应有的工具文化》,日前,王淮又在博客上 发布文章,说明Facebook新兵训练营的运作方式,介绍Facebook如何让新来的员工迅速融入到公司文化中进行高效协作. 王淮首先引用了扎克伯格IPO时的公开信:. Facebook要求所有新入职的工程师——包括那些将来并非主要从事编程工作的经理——参加新兵训练营(Bootcamp),学习我们的代码库、工具和方法.

资本动向

- xcv58 - 《商业价值》杂志
2011年6月23日 今日资本经纬创投联合投资ihush. 2011年6月27日 亲亲网获第一轮风险投资  . 2011年6月28日 凯鹏华盈和JP摩根投资满座网5000万美元. 2011年6月29日 挚信资本投资果丽美  . 2011年6月30日 海通开元、航天新能源基金及红杉联合投资九九维康. 2011年7月4日 西街网获A轮融资  .

AI 对资本家最有用

- - 奇客Solidot–传递最新科技情报
AI 终于展现出了商业潜力,但我们可能低估了它的影响. 除非 AI 是开源的,且由终端用户控制,否则除了 AI 的软件供应商,其他人的未来可能是暗淡的. 像 GPT-3 之类的大语言模型能用于扩展人类的工作或帮助完成枯燥的工作,就像程序员用 GitHub 的 AI 编程助手 Copilot 加快工作效率,律师、医生、会计师、营销人员、销售、政治演讲撰稿人等都将会有自己的 AI 助手.

趣题:不动点与线性代数

- sdyy1990 - Matrix67: My Blog
    假设 X 、 Y 是两个有限集合,f:X→Y 和 g:Y→X 是两个函数. 求证:复合函数 g∘f 和 f∘g 拥有相同数量的不动点(也就是说 g(f(x)) = x 和 f(g(y)) = y 的解的个数相同).     下面先提供一个“正常”的解法. 观察函数 g∘f 的不动点,可以看出它有以下两个性质:首先,如果某个 x 是 g∘f 的不动点,即 x = g(f(x)) ,那么 f(x) = f(g(f(x))),这就说明 f(x) 是 f∘g 的一个不动点;另外,如果 x1 和 x2 是 X 中两个不同的不动点,则函数 f 不可能把它们映射到 Y 中的同一个元素,否则 g 没办法把它分别还原成 x1 和 x2.

SVM理论之线性分类

- - 博客园_首页
  离上次发博文差不多有一年的时间了,因为一直在准备考研直到4月份才有时间,无奈考研后进入空白期,对专业、技术甚至生活失去了兴趣,部分原因也是没有什么好写. 的,现在刚做完毕设,有点积累,就从这里开始吧.   我将从svm理论到应用,分享一下学习经历,文章有很多内容来自文献和网络牛人,后面给出链接.

php类方法在线性能测试

- - CSDN博客编程语言推荐文章
在两个月前一个群里的朋友问了一个问题,他说:“现在他们公司的项目有一个模块的性能在线表现非常差,很长时间没有查出问题所在,老板一怒之下让他把所有类方法的执行时间给记录进行分析,并且不能影响现在的项目性能. ”老板让他记录这些信息是为了分析具体影响性能的地方在哪些地方,待项目运行一段时间就去除. 这个需求导致两个个问题,第一是怎么监听这个模块所有类方法的执行时间,第二是怎么能在不影响现在项目性能的情况下完成(本身性能就很差了),下面我们就这两个问题来分析:.

红杉资本:敬请期待Color的转型

- 幻幽 or A書 - 36氪
照片分享应用Color在今年年初带着4100万美元融资正式上线,上线后引发争议不断,此后团队两位核心成员离职,产品下线. 红杉资本Doug Leone领投了这次投资(红杉投了2500万美元)并加入Color董事会,在上周的TC Disrupt大会上,他谈论说他不后悔投资Color,并且Color是最令他兴奋的一个产品.

数字货币正在上演疯狂的资本游戏

- -
▲比特币、以太币等数字货币短时间内数十倍的收益率,吸引了无数炒家. 全文共5892字,阅读大约需要13分钟. 第二大数字货币以太币,近三个月涨了20倍,半年内涨了50倍,三年内涨了上千倍. 网络虚拟空间里的数字货币ICO众筹,相比股市中的IPO更自由,也更疯狂. 有人认为这是泡沫,有人认为这是未来.

资本寒冬,这样的AI芯片公司2019年危矣

- - 机器之心
2018年,中兴事件引发中国“缺芯“的大讨论,恰逢第三次AI热潮,国内外科技巨头也纷纷入局AI芯片市场,再加上传统芯片巨头以及初创公司的积极布局,2018年的AI芯片市场十分热闹. 不过,2019年全球迎来资本寒冬,国际贸易环境和半导体市场也不容乐观,需要大量资本且较长的芯片周期让AI芯片玩家面临巨大挑战.