大数据时代来临,首次披露阿里巴巴的“数据闭环”

标签: 大数据 时代 阿里巴巴 | 发表时间:2013-06-08 22:15 | 作者:guest@36kr.com (guest)
出处:http://www.36kr.com/

编者按:本文作者Sean,支付行业人,微博ID@ 打扰先生。Sean未来也会就互联网金融话题给我们写专栏。

今日关于“大数据”的讨论达到了一个高峰,数据就是未来已经不置可否地成为了互联网企业的未来新战略发展的中心。什么是大数据,大数据是如何产生价值的,大数据是无所不能的吗,应用边界在哪里?这些问题,似乎人人都有一个模糊的概念,但始终没有一个统一的答案。

说到大数据,首当其冲的应该是已经围绕数据海洋中耕耘已久并衍生出金融借贷业务的阿里系。马云将集团下的阿里金融与支付宝两项核心业务合并成立阿里小微金融,并将之前呼声最高的接班人彭蕾安排到阿里小微金融掌舵,马云对未来数据战场的重视可见一斑。作为筹备中的阿里小微金融服务集团数据平台,负责人冯春培也对数据有着独到的见解,他向作者表示目前国内对于大数据的讨论更偏重技术方向,即“如何沉淀数据”,对于数据的应用则思考较少。数据如何产生价值?这需要要从大数据的本质说起。
 
线上数据才是大数据
要搞清楚什么是大数据,首先你要知道什么样的数据才是有用的。按照冯春培的理解,任何行为本身都会产生数据,但只有线上数据有可能被沉淀和利用。“比如不通过淘宝,原本人们的交易行为在线下也是产生数据的,只不过这种交易行为是私密的,除了买卖双方,其他人是不知道我的交易行为的,同时交易双方也是匿名的,从数据的性质上来说无法沉淀,从来源上来说也没有一个方法能有效地收集。”
大数据是什么?冯春培的理解似乎更贴近本质:“拥有数据的本质,是你对这个世界,你对这些人,你对这些企业,你对这个时代,有了一个更全面而清楚的认知,你能理解这些人的需求,你能理解这个世界的任何的变化。”
你可以这么理解,如果你是阿里系的深度用户(比如淘宝卖家),他们掌握了你足够多的数据,对你的信用评估也会更加全面,这个数据不仅可以在金融领域中起作用,比如帮助你在阿里小贷更方便的贷款,在生活中也可以反映你的信用状况,“比如相亲 ,你怎么证明你的收入?你拿出支付宝的账单,女孩子一看一年花了100万,你说你的信用良好,每个月信用卡还的都很及时,比你说破嘴皮有用多了吧?”
 
数据就是生产资料
如果数据仅仅是作为辅助参考信息,也必要投入如此多的精力。从生产要素来说,数据到底是什么角色?冯春培的定义是“生产资料”。“我们部门的名字是‘商业智能部’,数据更多的像是一种业务的辅助决策,作为一个“参谋”的角色,现在我们要逐步的让这个数据融入到我们的业务和产品这个流程里面去,数据和业务就像两个齿轮,能扣在一起转。当我们对数据的挖掘和理解越来越强,最终数据不仅可以产生价值,还可以直接催生产品,比如阿里金融的一些数据,我们把它定义为生产资料。”
这就是阿里系未来要做的事情,把数据变成生产资料。与传统的生产资料不同的是,数据是可以无限次使用的,并且是越使用越丰富的。
近期阿里巴巴在移动互联网市场频频出手,未来也许有可能将数据进行融合,用户的各种信息得以呈现在一个全景图里面,即使在完全陌生的城市,借助这种服务,你也能知道附近哪家店支持支付宝付款,微博上哪个网友刚刚在附近的咖啡店歇脚。
 
 
数据分析是“大海捞针” 
与大多数互联网产品存在的问题相同,互联网产生的数据是有可能被伪造的,同时也是无序的、碎片化的。
对于这一点,冯春培也毫不讳言,“短期的伪造数据当然是有可能的,用特定的维度去伪造数据也是完全可能的,但是因为我们的业务是基于长期数据进行跟踪分析的,采纳的维度也更广,伪造数据的成本和难度会越来越大。按照我们现在的信用模型,伪造数据的收益是不太可能覆盖成本的,那么我们可以基本判断,数据的真实性是有保障的。”
是否存在冗余数据?冯春培的答案是“NO”,“即使现在的场景需求,或者我现在的眼光来看这个数据我觉得没有用,但不意味着将来这个数据也是没用的。”这同时也造成了一个问题——存储的数据量会越来越大,但是在特定的应用场景中只需要用到一小部分数据,“确实,我们现在每一次的数据分析都是在‘大海捞针’”。
  
数据加工流水线
数据是怎么从每一次交易行为,最终变成一个个数据模型和最终产品的?


冯春培向作者简单描述了一个示意图:

用户通过PC或移动设备发生的交易行为会产生相当数量的原始数据
原始数据通过设备采集后进入分发中心
按照一定分发规则,数据被分发至各个集群服务器。零散的、无序的、没有关联的原始数据在集群服务器被加工成人或者机器可以理解的形式
数据进一步被挖掘 形成业务模型

据介绍,这一流程几乎适用于任何来源和性质的数据。此外,为了便于在内部解决数据的交换、安全和匹配等问题,阿里集团还搭建了一个数据交换平台。冯春培表示,在这个平台上,各个事业群可以实现数据的内部流转,实现价值最大化。

 
数据——信用——财富 阿里的新“闭环”
海量的碎片数据该怎么用?阿里小贷给出了一个很好的示范。在过去,因为无法采集足够的数据,在企业贷款时银行要求提供房产、购车证明,用资产做抵押。但现在,基于采集到的海量企业数据,阿里小贷可以借助技术手段,把碎片化的信息还原成对企业的信用认识。

“比如某个小企业有一个小工厂,用电量一直在持续的攀升,我可以认为他业务很好,信誉就可以调高”冯春培举了个最显而易见的例子:“这个维度银行是不可能采纳的,因为他们依然用的是上门调研的方式,人力、时间成本太高,并且也不可能长期跟踪。有时候碎片数据可以反映全局,这种数据在模型中的权重就会比较高。”

事实上,阿里内部对数据的运用不仅仅体现在商业产品上,数据也在大大缩短、简化内部的业务流程。冯春培强调,不要将数据的价值局限于“变现”,“数据最终的指向是积累的信用,包括个人信用也包括企业信用。我们所做的一切都是在为这个目标服务,首先将数据变成信用,良好的信用又可以取得贷款、获得更好的服务,增加你的财富,这是一个良性循环,也就是数据价值的‘闭环’。”

欢迎拍砖,投稿请寄:tips【at】36kr.com

除非注明,本站文章均为原创或编译,转载请注明: 文章来自 36氪

36氪官方iOS应用正式上线,支持『一键下载36氪报道的移动App』和『离线阅读』 立即下载!

相关 [大数据 时代 阿里巴巴] 推荐:

大数据时代来临,首次披露阿里巴巴的“数据闭环”

- - 36氪 | 关注互联网创业
编者按:本文作者Sean,支付行业人,微博ID@ 打扰先生. Sean未来也会就互联网金融话题给我们写专栏. 今日关于“大数据”的讨论达到了一个高峰,数据就是未来已经不置可否地成为了互联网企业的未来新战略发展的中心. 什么是大数据,大数据是如何产生价值的,大数据是无所不能的吗,应用边界在哪里. 这些问题,似乎人人都有一个模糊的概念,但始终没有一个统一的答案.

阿里巴巴的零知识证明

- 见涛 - 科学松鼠会
战争中你被俘了,敌人拷问你情报. 你是这么想的:如果我把情报都告诉他们,他们就会认为我没有价值了,就会杀了我省粮食,但如果我死活不说,他们也会认为我没有价值而杀了我. 怎样才能做到既让他们确信我知道情报,但又一丁点情报也不泄露呢. 这的确是一个令人纠结的问题,但阿里巴巴想了一个好办法,当强盗向他拷问打开山洞石门的咒语时,他对强盗说:“你们离我一箭之地,用弓箭指着我,你们举起右手我就念咒语打开石门,举起左手我就念咒语关上石门,如果我做不到或逃跑,你们就用弓箭射死我.

[原]阿里巴巴B2B搜索学习

- - 文武天下
主搜索:商品搜索、商家搜索、采购搜索、app搜索. 行业搜索:淘货源、淘工厂、聚好货、主题市场、品牌馆等. 由于用户多,需求强烈,收益大,所以功能、场景、架构做到极致高效. 代码复用性强:基础通用功能进行组件抽象化. 组件通用性好:一些组件或者组件进行组合的服务,适用更多场景,支持更多功能. 转化效果好:算法做的比较深入、细致.

来阿里巴巴一年有感(中)

- - Shining Ray
阿里巴巴现有有3万名员工,工号已经排到了12万. 如此庞大的组织,如此多的部门、单元,能朝着同样的愿景去一致行动,仿佛一个有机的整体,可见其管理体系的完备. 当我加入这样一个庞然大物,心情颇像《海上钢琴师》中的主角 1900 要踏足陆地进入城市,担心自己能不能适应好这个组织,发挥出自己的能力. 而经过一年的学习,跟随着其他同事做事,耳濡目染也学到了不少技巧.

专访阿里巴巴研究员赵海平:从Facebook到阿里巴巴

- - 博客园_新闻
赵海平,2007 年加入只有不到 50 个软件工程师的 Facebook,致力于软件性能和架构分析,在此期间创建了 HipHop 项目,重新编写和实现 PHP 语言,使其速度提高 5 到 6 倍,为公司节约数十亿美元. HipHop 项目之后,致力于“用异步处理来优化分布式系统”的设计理念中,并为此做了多项分布式数据库的优化研究,在 PHP 语言中加入了 yield 和 generator 的新功能,来帮助日趋复杂的 Facebook 网页设计.

阿里巴巴开源项目: 阿里巴巴去Oracle数据迁移同步工具

- - agapple
   08年左右,阿里巴巴开始尝试MySQL的相关研究,并开发了基于MySQL分库分表技术的相关产品,Cobar/TDDL(目前为阿里云DRDS产品),解决了单机Oracle无法满足的扩展性问题,当时也掀起一股去IOE项目的浪潮,愚公这项目因此而诞生,其要解决的目标就是帮助用户完成从Oracle数据迁移到MySQL上,完成去IOE的第一步. .

阿里巴巴高层震动的扯淡

- chenqj - It Talks--上海魏武挥的博客
这是真扯淡了,完全就是写博客,没有什么中心思想,想扯哪里扯哪里. 国内外有两家公司,遥相呼应地都非常强调所谓“价值观”,外有谷歌,内有阿里. 谷歌上市时,可以挑战华尔街的规矩,阿里上市时,则创下当时一批IPO的新高. 故而,这两家公司都是一时的翘楚,属于“从优秀到卓越”的公司. 公司是非常象一个宗教组织的——或者这么说,“好”公司都得象宗教组织.

阿里巴巴集团股权结构图

- telefan - Finacial Planet China 中国投资专家博客集
雅虎SEC文件原文是:“为了尽快获得一个重要牌照,阿里巴巴集团旗下在线支付公司支付宝已经被重组,其100%流通股现由阿里巴巴集团CEO马云控股的一家中国公司持有. 阿里巴巴集团管理层、主要股东雅虎和软银参与了有关支付宝重组条款的详细讨论. 收起 | 查看大图 | 向左转 向右转.

TradeSparq:阿里巴巴+Linkedin的采购网站

- anger - 互联网的那点事...
为什么人们会在Linkedin注册. 其中一个原因在于,他们想和他们的同伴(卖家或者买家)保持联络. 那么阿里巴巴这些年又是为什么这么流行呢,是因为它让国外用户很容易的找到数以千计的中国商品. 但是,你在Linkedin上,通常并不知道你联系的公司实际销售的是什么产品;而在阿里巴巴,如果你是一个制造商,想要推广自己的产品通常需要支付高昂的会员费(供应商会费一年3012美元).