BAT金融大数据体系拆解与价值挖掘

标签: bat 金融 大数据 | 发表时间:2017-02-12 16:28 | 作者:
出处:http://www.huxiu.com

金融创新很大一部分原因在于大数据和金融之间的结合。纵观BAT、京东、小米、万达、平安这些把触角伸到互联网金融领域的巨头,无一不是在大数据层面上有所布局。大数据和金融相结合,几乎已经成为金融领域的通用做法。


金融数据的含金量


谈数据必须先谈数据的完整度和价值含量。就像煤矿一样,大数据中的价值含量、挖掘成本比数量更为重要。非结构化数据,就像是有杂质的煤矿,无法直接使用。大数据还需要进行脱敏、提纯、结构化,才能变成可以被直接运用于商业层面的有价值的信息。


金融数据作为专业度要求更高的数据尤为如此。对于BAT三家而言,布局其实都比较完整。2015年年底的时候,阿里集团透露,在阿里数据平台事业部的服务器上,攒下了超过100PB已处理过的数据。


BAT三家公司,数据体积相差不会太多, 三家几乎都有LBS、交易、社交等一系列不同维度数据,只是能力有所区别。


三家数据核心优势可以如此简单划分——


百度:基于搜索而诞生的公共数据、需求数据。百度的优势在于数据最全面,数据样本比较复杂,数据的广度和多样性上比较强,拥有核心技术和数据矿山,而且是一座富矿;


阿里:基于淘宝天猫业务而诞生的电商数据、信用数据。阿里的核心业务在电子商务上,数据比较聚集,更容易做分析。这种数据类型的优势在于,更容易变现,挖掘出商业价值;


腾讯:基于微信、QQ诞生的社交数据、关系数据,以及游戏数据,相对较杂。不过,容易分析人们的生活和行为,从里面挖掘出商业、健康等领域的信息;


大数据领域有这样一种说法——所有的数据都是风险数据。而拍拍贷风险副总裁顾鸣博士之前提出过一个金字塔结构图。

 


在这张图中,征信数据位于金字塔的顶端。往下走是消费数据、运营商数据、社交数据、行为数据以及其他数据。越是靠近金字塔的顶部,大数据在风控领域的应用就会越直接,获取数据的难度随之增加,覆盖率当然会降低;相反,越是靠近金字塔的底部,大数据在风控方面的应用难度就越大,但是数据的数量和覆盖率都会变大。


把BAT三家套入这个金字塔结构中就会发现。阿里的数据离变现几乎只有一步之遥。阿里以电商-支付-信用为三级跳板,针对性很强,数据价值纯度高,金融数据的整合上做的也比较完善,缺点是覆盖面还是不够。不过,这些年来不断收购、入股优酷、微博、高德等一系列企业,阿里数据维度其实也在越来越丰富,也在不断往金字塔的底层下探。


腾讯有社交、行为数据,这些数据不能直接运用,但获取的信息会更丰富。而腾讯目前的大数据策略是先将产品补全,产品后台数据打通,形成稳定生态圈。本阶段先利用大数据挖掘改进自己的产品。后期有成熟的模式合适的产品,则利用自家的社交及关系数据时,开展对大数据的进一步挖掘。


虽说有人认为百度和腾讯很多数据是非结构化数据,在风控上的运用难度较大,很难直接商业化。不过,这些数据恰恰是金字塔最底层的数据。在普惠金融的环境下,互联网全域大数据带来的价值不可忽略。


四个角度告诉你,金融大数据到底用在了哪些地方


之所以要花这么大的篇幅去谈三家的数据来源,主要还是因为今天无论是金融、电商、物流、生活服务等各个领域,其实都离不开维度全面的数据。


因为数据维度越丰富,对用户粗颗粒的画像就会越了解。某一个画像的用户到底喜欢什么,都可以一清二楚地了解到。企业也能够面对做很多有针对性的营销。


尤其是在金融领域,企业对大数据掌握越全面,所能涉及到的业务也会越丰富。BAT数据最丰富,在金融业务领域横亘支付、贷款、理财、保险、证券、银行、征信、基金、众筹等各个领域。而小米、京东、万达等企业因为体量、数据等相对而言优势不大,则会在这9个领域中缺失某些领域的布局。

BAT在9个领域的布局,其实都是以大数据为核心串联在一起的。无论是征信、风控、消费金融、财富管理都或多或少运用到了大数据。



1、大数据征信:在个人征信领域,目前是金融行业面临的最大问题。基于用户在互联网上的消费行为、社交行为、搜索行为等产生的海量数据,其价值并未被充分挖掘,个人征信在大数据的采集和信息挖掘上面仍有很大的想象空间。阿里的芝麻信用在其中算是最会玩的。芝麻信用几乎打通了用户的身份特质,行为偏好,人脉关系,信用历史,履约能力等各类信息。这恰恰是因为接入了电商、支付、社交等各类数据维度。


2、大数据风控:大数据风控目前应该是前沿技术在金融领域的最成熟应用,相对于智能投顾、区块链等还在初期的金融科技应用,大数据风控目前已经在业界逐步普及。目前,美国基本上都用三大征信局的信息,最传统的评分基本上都是用FICO来做的。各家平台会尝试着用机器学习、神经网络等大数据处理方法。


国内市场对于大数据风控的尝试还是比较积极。特别是大公司,可以将移动互联网的行为和贷款申请人联系到一起展开大数据风控。百度在风控层面上的进展还是比较突出,百度安全每天要处理数十亿网民搜索请求,保护数亿用户的终端安全,保护十万网站的安全,因此积累了大量的数据。


一个很具体的案例就是,通过海量互联网行为数据,比如监测相关设备ID在哪些借贷网站上进行注册、同一设备是否下载多个借贷App,可以实时发现多头贷款的征兆,把风险控制到最低。


3、大数据消费金融:消费金融对大数据的依赖是天然形成的。比如说消费贷、工薪贷、学生贷,这些消费型的金融贷款很依赖对用户的了解。所以必须对用户画像进行分析提炼,通过相关模型展开风险评估,并根据模型及数据从多维度为用户描绘一个立体化的画像。


在大数据消费金融的领域中,腾讯和阿里的优势很大程度上是在渠道层面上的。正如前文所说的,阿里以电商-支付-信用为三级跳板,针对性很强支付宝接入消费金融产品之后会有较强的渠道作用。而在去年12月,腾讯的“微粒贷”已经接入到了微信支付当中。在消费金融的发展速度上,腾讯速度也不差。


4、大数据财富管理:财富管理是近些年来在我国金融服务业中出现的一个新业务。主要为客户提供长期的投顾服务,实现客户资产的优化配置。这方面业务在传统金融机构中存在的比较多。不过因为技术能力不足,大数据财富管理在传统金融机构中相对弱势。


财富管理在互联网公司的业务中也非常流行。蚂蚁金服一开始最为简单的财富管理方式就是余额宝,后来逐渐演化成经过大数据计算智能推荐给用户的各种标准化的“宝宝”理财产品。百度金融是依托“百度大脑”通过互联网人工智能、大数据分析等手段,精准识别和刻画用户,提供专业的“千人千面”的定制化财富管理服务。


金融大数据的孪生兄弟金融云是地基,未来更具看点


大数据和云计算永远都是相伴相随的一对孪生兄弟。金融大数据核心工作包括三方面,即获取数据、建立模型、模型在实践中优化、迭代。而对于金融大数据而言,金融云才是它的地基。


打个不恰当的比方,前文中说大数据是煤矿,而金融云其实就是矿井。矿井的安全行、可靠性决定了挖煤的效率和结果。


金融云把底层技术很多问题都解决了。大量金融模型都是金融云所引入的,如客户模型、产品模型、账务模型等。同时金融云关注金融本身的严谨性和周密性、安全性的考虑。


2016年7月,“腾讯云+未来”峰会上,腾讯云和腾讯金融云都已成为最重点部署的业务。同年9月,百度世界大会金融科技分论坛上,百度金融云正式向业界开放。10月,阿里云栖大会上,阿里金融云负责人则是提出将会和生态合作伙伴、服务联盟为金融行业量身定制推出云增强服务。


大数据必须要跑在云端,而金融大数据更需要和业内其他企业展开数据、支付、业务等一系列的合作。金融云对可用性、安全性的要求严格,比如说对一个高度可控可信的云安全体系而言,基础环境安全、风控与审计、数据安全三者缺一不可。而金融云在未来的竞争中将发挥越来越重要的作用。

下载虎嗅APP,第一时间获取深度独到的商业科技资讯,连接更多创新人群与线下活动

相关 [bat 金融 大数据] 推荐:

BAT金融大数据体系拆解与价值挖掘

- - 虎嗅网
金融创新很大一部分原因在于大数据和金融之间的结合. 纵观BAT、京东、小米、万达、平安这些把触角伸到互联网金融领域的巨头,无一不是在大数据层面上有所布局. 大数据和金融相结合,几乎已经成为金融领域的通用做法. 谈数据必须先谈数据的完整度和价值含量. 就像煤矿一样,大数据中的价值含量、挖掘成本比数量更为重要.

BAT的电商江湖

- 果 - It Talks-魏武挥的blog
大部分数字产业中人都认同,BAT代表的是中国商业江湖中超一流数字公司. B(Baidu,百度)做的是资讯的渠道,A(Alibaba,阿里)做的是商务的渠道,T(Tecent,腾讯)做的是交流的渠道. 而在BAT中,我以为,B和A的模式是类似的. 与腾讯一门心思兜售各种虚拟产品给用户不同(腾讯的用户即它的客户),百度和阿里都是靠帮助别人发财从而自己发财的公司.

互联网金融:大数据和技术为王的时代

- - 动点科技
(编者:本文作者李张鲁Dennis Roudenko,是青年投资家俱乐部发起人、华创资本资深分析师. 华创资本投资了10多家互联网金融公司,同时与IDG合有互联网金融投资基金,投资范围在20-2000万美金. 互联网金融本身只是一个概念,是泛指那些通过互联网和大数据手段来完成并优化的金融业务. 历来现有的机构都在尝试运用这些手段去优化自己的业务,但2012年这一领域才开始火起来是因为时机成熟了,大可归功于两大点:大数据的出现与技术的普及与应用.

唯品金融大数据团队的图数据库实践

- -
在大数据时代,社交关系趋于复杂化,越来越多的互联网项目都和社交关系联系起来. 而对社交关系的良好契合,使得图数据库(Graph Database)在互联网领域迅速崛起. 通过图数据库可以高效地进行社交关系查询、分析和数据挖掘,以发现有价值的信息. 近几年互联网金融发展火热,用户对消费分期、现金贷等需求也越来越高.

BAT如何抢食“to B”新蛋糕

- - 机器之心
在兴奋与焦虑杂糅交错下,“下半场”正在成为传统互联网圈的核心话题. 传统互联网的上半场只是一场关于“消费互联网”的竞争,C(即Costumer,消费者)端的个人用户是巨头们争夺的核心目标,他们希望把每个人的生活线上化、数据化. 于是,人们开始用手机买机票、打车、订酒店、聊天、购物、看新闻……而BATJTMD等公司一跃成为巨头公司.

互联网金融产品如何利用大数据做风控?

- - 知乎每日精选
由于互联网金融涉及货币发行(比特币)、第三方支付、投资理财(网络银行、保险、基金、证券、财富管理)、信贷(P2P、众筹、网络微贷)、征信等等,各个领域的风控策略并不尽相同,不能一概而论,下面讨论只能涵盖了常见的风控策略. 个人认为“大数据”除了强调数据的海量外,更重要的在于用于风控的历史数据的广度和深度,其中:.

如何利用大数据做金融风控?| 硬创公开课

- - 雷锋网
随着金融科技、科技金融等概念的热起,以及互联网金融、无金融服务群体的刚性需求下,大数据风控技术也获得越来越广泛地重视和应用. 但是,如何利用大数据、机器学习等前沿技术做金融风控. 如何通过海量数据与欺诈风险进行博弈. 本次硬创公开课我们邀请了同盾科技首次风险官董骝焕博士为我们解答. 董骝焕是南开大学概率统计博士,他博士毕业后加入中科院,2007年加入IBM/ ILOG从事决策模型在各种业务问题中的应用.

剖析大数据在金融行业的典型应用方向

- - IT瘾-bigdata
随着互联网新金融模式的兴起,传统的银行金融业面临着诸多挑战. 而大数据技术的发展和广泛应用,无疑是提供了一座极具价值的“金矿”,借助大数据技术,将分散在金融企业服务网络与IT系统中的海量信息与基于业务驱动的外部数据源融合,并结合金融行业的特点,以金融业务为核心,提升客户体验和客户价值、优化运营流程、预测营销效果、提升经营管理水平.

大数据金融风控大浪淘沙强弱渐分,长路漫漫投机者勿入#深度评论#

- - IT瘾-bigdata
2016年,大数据就在一片喧嚣的气氛中过去. 之所以说“喧嚣”,是从2015年开始的大数据热在不断地继续升温,加剧. 凡事必须跟大数据扯上点关系才算时髦,才算符合时代潮流. 做个最普通不过的统计分析报告,也要冠以“大数据XX报告”. “大数据征信”,“大数据金融风控”,“大数据XX”更是比比皆是. 在我看来 ,真正属于纯粹大数据的项目并不多,多数都在混淆概念.

记毕业时求职BAT产品经理的经验

- - 人人都是产品经理
   遥想当年还是对于产品经理一无所知的XX青年,在回忆起当年的面试经历,确实有很多值得反思的地方,最终的失利也是很正常的,这里分享出来,供马上要求职产品经理的孩子们参考吧. 腾讯的招聘的职位没有分的很细,基本上就是技术与非技术两种,需要他们自己做的网申系统投递简历,网申也十分简单(做的十分粗糙,不敢想是中国最牛互联网公司做出来的系统),基本上10分钟就搞定了.