人工智能遇冷,腾讯云升级之后的大数据AI版图
2019年,人工智能遇冷。一年半以前,腾讯云副总裁王龙在与腾讯系创业公司内部分享时提出,AI期望值已经到了一个比较高的阶段,潜在风险浮现。2019年这样的趋势变得更加明显,最典型的事实是从2017年的顶点到2019年,AI投资融资事件频次降落了70%。
投资冬天已至,AI何去何从?
本质上各大人工智能平台都是厂商自身能力外化的结果,和厂商原有业务属性高度相似。腾讯云上的AI能力首先来自于腾讯内部,如社交、游戏场景等,在各个场景里经过反复的积累和打磨,放到腾讯云上用户直接可以用,这也是目前大多数人工智能平台厂商还在做的事情:第一,与行业客户、开发者不断交流、调研和访谈,了解大家需要什么样的能力;第二,不断和内部团队交流,看看不同团队有什么样的能力可以放到腾讯云上,服务客户和合作伙伴、开发者。
腾讯云副总裁王龙
人工智能不是互联网式的野蛮圈地,随着行业向纵深化发展,做人工智能就是做产品。王龙对此有清晰的认知,也因此他并没有讲宏观而空洞的构想,小处着眼,产品才是他最关心的方向。
“我不是做市场而是做产品的,我们一直秉持满足行业趋势、满足客户需求,来决定现在应该做什么,将来应该做什么。”
AI技术本身依赖于几个要素:好的数据、好的算法、高性价比的计算框架,王龙提到,能找到好的数据的地方,能够使用好的低成本框架计算进行训练,以及能够找到好的算法模型,这三点的发展现在都到了瓶颈了。“大部分情况下,大家都知道这里数据很好,但哪里有更好的数据,不知道。大家都知道这个算法模型很不错,但如何找到更好的算法、模型呢,不知道。同样的,大家算力、框架上比拼也变得越来越透明化。”
人工智能发展至今,或许是一场白刃战。
也因此,腾讯云的AI策略遵循两个大的基本方向,一方面,在技术成熟的领域持续不断地提升自己的性价比,在一些细分的方向上力求不断做得更好,例如AntiFakes(AI换脸甄别技术)。
王龙提到,不管是人脸识别,还是数据分析,其实技术都趋于成熟,但同时竞争也趋于同质化。几个小时的培训课程再加上几个小时的训练,用户就可以满足自己人脸识别的需求,竞争激烈进入到比拼性价比的时代。
另一方面,在产业互联网持续加大投入,去帮助场景更加复杂同时价值可能也更高的这一部分市场客户,提供AI及大数据价值。反映到产品层,也是遵循了这个思路。
产业互联网就是人工智能更广阔的空间,更丰富的想象力,金融、制造、工业、交通、零售等等这些领域,在更好的数据获取,更好的算法模型以及更好的资源调度上,都有非常多的不确定性,包括腾讯云在内的厂商都在摸索期,一个数据获取在零售领域的方法论,到底在交通领域能不能泛化?一个算法模型在另外一个领域能不能使用?挑战与试错是主旋律。
腾讯云人工智能产品版图,七大新品发布
在视觉AI领域,腾讯云集合了腾讯优图、腾讯安平AI安全实验室、腾讯AI Lab、微信开放平台等团队的能力,此次共发布AntiFakes假脸甄别、微码、信息流智能图像以及智能相册四大新品。
其中,AntiFakes是对当下热门deepfake的回应,基于图像算法和视觉AI技术,AntiFakes假脸甄别技术实现了对图片或视频中的人脸真伪进行高效快速的检测和分析,鉴别图片中的人脸是否为AI换脸算法、APP 所生成的假脸,最终对图像或视频的风险等级进行评估。
“腾讯云在这个事情上面既做了矛,又做了盾,一方面通过矛来去让大家在视频的新玩法上面能够有更新的玩法去用,但是另外一方面,我们要防止这些玩法被坏人利用,去做一些坏事。”腾讯云人工智能产品总经理刘黎春表示。
微码是和微信同款的扫码能力放到了腾讯云上,与开源扫码功能比较,腾讯云的微码经过微信十几亿用户的场景锤炼,比如一个图里有多个码,或者图非常大但码非常小,还有可能出现二维码模糊,一般算法很难识别等问题,细致到十几亿用户每天的各种场景,微码可以做到“一码扫天下”。
信息流智能图像应用于信息流的推荐,平台需要判断哪个信息有更好的点击率,会更受用户的欢迎,信息流智能图像源于腾讯内部信息流能力整合,帮助平台能够更好地从海量图片库里挑选出一些更受用户欢迎的,有更高的点击率的图片,节省大量的人工筛选图片的成本。
智能相册主要是图片智能打标签、智能分类,腾讯的微云、QQ空间、QQ手机管家,都涉及到图片存储、自动打标签,自动分类功能。
腾讯云还发布了语言模型自学习工具和NLP自定义训练平台。
通用语音识别能力已拥有很高的识别率,但特定企业场景下存在大量生僻名词,目前行业内通用识别的效果较差。通过添加企业典型业务对话场景下的字词句,自助提升特定场景下特定名词识别的准确率,从而让语音机器人、电话录音质检等行业的语音识别效果得到大幅提升。
在NLP领域,为了达到更好的效果,预训练语言模型的使用已经成为一个很普遍的做法,但效果提升的同时也带来了模型训练成本的不断攀升,以目前行业较大规模的模型训练为例,用200G语料训练一个3亿参数的bert模型,需要1400多张V100的GPU,训练500多分钟才能得到一个可用的模型。腾讯云新发布的AutoNLP依托腾讯云语料积累和公有云算力,一次训练多次使用,提供数十个腾讯自研的预训练模型,极大地降低训练成本,提升模型创新及应用效率,缩短定制化项目交付的周期。
同时,针对图计算在行业领域的应用难题,腾讯云推出的图计算引擎腾讯星图封装了微信Plato图计算框架,可大幅提升图计算性能,在内存消耗降低7-10倍的情况下,性能提升了近50倍。
腾讯云大数据产品版图,四大新品发布
腾讯云也在持续构建平台来简化各种工具使用和集成的难度。例如大数据平台TBDS,灵活搭载全场景大数据存储、分析和管理工具,一站式的协助企业构建符合其自身需要的数据中台。该平台源自于腾讯内部多年的技术积累,支持了20万算力弹性资源池,每日分析任务数达1500万,每日接入35万亿条数据,每日实时计算次数达30万亿次。
另外,人工智能平台云智天枢TI Matrix持续降低构建与应用AI能力的门槛,无缝联动腾讯内部各大实验室、以及微信与企业微信的集成能力,为开发者提供全链路的人工智能应用开发、部署和管理能力。今年以来,平台新增接入算法模型1000+,联动AI领域合作伙伴超过100家,支撑50多个AI应用场景落地。
不只是企业,当下比较传统的公安、政府等行业也开始越来越多运用大数据,大数据驱动企业发展,成为一个越来越流行的趋势。
腾讯云研发总监雷小平以公安大数据平台的构建举例,平台成本主要分为两部分,第一是整个平台的构建,包括运维成本;第二,有了平台之后,数据如何应用给企业带来比较大的价值,腾讯云想从这两个问题出发,来解决客户遇到的问题。
腾讯在大数据的积累以十年计数,大概分为四层:
最下面是云的基础设施,体现云的极致弹性,企业、用户需要多少资源可以马上从云上获取;
依托于基础云的平台,上面会有一层大数据的基础设施,腾讯云把大数据的场景抽象成五、六个典型场景,企业可以比较快的从云上面构建一个场景,比如现成的数据仓库和搜索等。
平台之上是推荐产品,这块涉及到比较新的技术门槛,腾讯云会封装一些领域型的产品,把之前积累的能力封装到里面。雷小平主要介绍了企业画像、公共趋势分析、智能选址、智能推荐四个应用。
在这之上,每个行业对能力应用要求还不一样,数据需求也不一样,所以腾讯云根据每个行业的诉求点做成了一层专门的行业解决方案。从上到下的四层关系,形成解决企业大数据的领域的架构图。
新品发布环节,腾讯云发布了三款产品。弹性MapReduce,腾讯云表示它基本上能解决所有大数据在应用当中的问题,可以很方便地在云上购买服务;ES产品,解决客户在大量日志的检索以及搜索的场景,通过内核深度优化,ES集群支撑千级节点,内存占用减少80%,写入性能也提升很多;云端数据仓库,针对中小型企业不希望耗费人力去培养非常大的数据团队,而又希望做一些数据分析的需求。
此外,腾讯云还发布了企业画像平台,企业画像平台是腾讯云推出的面向智慧城市、金融监管、企业评估等场景的企业大数据综合服务平台,通过构建百亿级的知识图谱,洞察企业风险和价值。雷锋网雷锋网雷锋网