大数据淘金,你所要知道的五个为什么

标签: 互联网 观点 大数据 | 发表时间:2013-05-09 18:20 | 作者:尹生
出处:http://www.tmtpost.com

在开始你的 大数据淘金之旅之前,最好先问自己五个问题:大数据是不是又一个大泡沫?第三方电商平台会成为未来商业的最主要形式,或者企业应该回归自己的门户?第三方的大数据运营平台是个好主意吗?大数据会让行业之间的界限模糊吗?每家企业都视大数据为私产,这会导致大数据孤岛吗?

福布斯热门专栏作家Eric Jackson几天前发表了一篇评论,标题是《业绩下滑,“云服务”真的在扼杀IBM吗》,他根据IBM的财报认为,该公司不仅整体业绩表现平平,而且在中国、俄罗斯这些以往的增长型市场也表现同样疲软,据此他认为应该认真评估这样一个问题:IBM是否错过了企业从巨型的信息技术开支向云服务开支转型这条大船。

在这篇评论中,我不打算直接讨论这个待评估的问题,但希望能提供一个考察这个问题的视角,IBM这两年花了大把精力在鼓吹大数据——前些年IBM说得最多的是云计算,这两年才将重点转向大数据上,该公司似乎认为云计算是基础,大数据则是信息技术下一步应用的核心。

3月份时,我和IBM全球副总裁兼大中华区软件集团总经理胡世忠,IBM软件集团大中华区战略及市场总监吴立东有过一次交流,谈论的焦点可以概括为围绕大数据的5个为什么,不仅包括大数据作为一个热门行业本身催生的机会,IBM的大数据战略,也包括大数据所带来的一些深刻影响,比如企业是否应该将现在在第三方平台上实施的交易转移到自家门户,是否会受制于数据孤岛等,这些或许能透露出面向云服务时代的IBM到底在想什么和做什么。

之一:大数据是不是泡沫?

目前很多所谓的大数据创业者,似乎就是对微博等社交网络的信息做一些分析,然后帮助促进销售,但显然这不是全部,IBM这样的软硬件公司似乎才是最大受益者,我甚至开始怀疑这个概念一开始就是软硬件巨头们为了卖更多产品而发明的。

胡世忠同意“IBM会是最大受益者之一”的说法。不过他也认为,小公司在一些细分领域也会有很多机会,比如如何在不同种类的数据之间建立可分析性,对其进行分析等,其中的一些会获得独立的生存空间,但很多可能会被收购。

“过去18个月中有比我想象中更多的国外的小公司进中国来,它们有一些是专门做数据的日志、数据的来源等等。在这里,每一个障碍都是机会。”

但这个行业处理的对象处于快速变化中,比如移动数据的涌现,可能客户更愿意和IBM这样的整体解决方案公司打交道,这也是小公司的最大风险——它们可能稍有不慎就会被潮流抛弃。IBM将在很多领域扮演收购者角色,过去已经收购了超过30家与大数据相关的公司。

IBM在这方面最早收购的是Cognos,是做一般分析型的。现在则转向收购专业的,解决大数据领域特定问题的公司,要不然就是解决行业问题的,要不然是数据的分类问题,或者是一些数据存储上的技术问题,或者是数据挖掘,越来越窄、越来越精。

“这让我们提供给客户、帮助客户解决问题的类型越来越多,而不是用同一个东西来解决所有问题。”

之二:企业最终会逃离第三方电商平台,回到自己的门户?

淘宝去年的交易额已经超过1万亿元,这个行业的高增长还在持续,当大数据成为一个大问题时,企业是否需要对其电商模式进行重新定位?据两位采访对象介绍,他们掌握的信息是,国外一些企业已经开始将交易环节从亚马逊撤出,而转向自己的门户,因为它们不愿意失去客户的第一手信息和客户关系。

而IBM显然正努力让中国的企业也意识到这点,因为这样一来它们将更需要IBM这样的解决方案商的支持,这是一个大生意。

“我们现在跟每个企业谈智慧商务的时候,开始向他们介绍把这个东西放第三方平台上,放在淘宝天猫的代价是什么,你不知道谁买了东西,不知道他的爱好是什么,没有办法让人知道你的产品是什么。另外,你设计的产品不见得是客户想要的,这将造成库存。”

之三:第三方数据运营是个大生意?

SAP正在做一项尝试,即鼓励一些企业将自己的数据放在一个公共平台上,这样就能发挥数据的优势——因为当每家公司将自己的数据共享出来时,就更有机会建立起大数据的优势,当这些信息仅仅是每家企业的私有财产时,是一座座数据孤岛。

IBM也会这样做吗?胡世忠的回答是:第一,在国内还没有听过有这种需求,没有碰到过;第二,如果客户有这个需求,IBM可以做到这一点。不过在国外,IBM已经开始为企业提供大数据运营服务,帮助其应用数据。

“但在国内还没有,因为很多企业都有很多自己的低成本IT人员,还需要将这些人员的能量尽可能地发挥出来。”

之四:大数据会让行业的界限变得更模糊吗?

一个行业和另一个行业的界限,在很大程度上是因为知识和技术的界限造成的,大数据正使界限变得模糊,比如一些物流公司正介入电商领域,阿里巴巴同样是金融领域强大的竞争者。

这种趋势同样在IBM身上发生着,比如奥美是IBM传统的公关公司,每年给它一笔费用,但现在变成了IBM在EMM(企业营销管理)领域的合作伙伴,而其传统的客户苏宁则有可能变到IBM下一代的产品合作伙伴,或其渠道合作伙伴。

之五:大数据孤岛会出现吗?

那些拥有大量关键数据的社交网络和电商交易平台,都将数据列为其私有财产,希望借此使其成为大数据的赢家,而这将导致新的信息孤岛出现。

两人的看法是,一方面,Facebook和Twitter已经带头开放部分数据给第三方公司,因为它们自身也能从这种开放中受益,它们不可能自己进行所有的分析和运用,而更多的企业也最终会走向这条道路,但他们的开放不会是无偿的,他们会希望从开放中受益。

另一方面,虽然微博、微信等外部数据是重要的数据来源,但大多数客户已经有足够多的内部数据,完全可以从内部数据应用开始,他们需要做的,是制定一个统一的管理者,以协调各个部门的行动。

相关 [大数据 淘金 知道] 推荐:

大数据淘金,你所要知道的五个为什么

- - 钛媒体网
在开始你的 大数据淘金之旅之前,最好先问自己五个问题:大数据是不是又一个大泡沫. 第三方电商平台会成为未来商业的最主要形式,或者企业应该回归自己的门户. 第三方的大数据运营平台是个好主意吗. 大数据会让行业之间的界限模糊吗. 每家企业都视大数据为私产,这会导致大数据孤岛吗. 福布斯热门专栏作家Eric Jackson几天前发表了一篇评论,标题是《业绩下滑,“云服务”真的在扼杀IBM吗》,他根据IBM的财报认为,该公司不仅整体业绩表现平平,而且在中国、俄罗斯这些以往的增长型市场也表现同样疲软,据此他认为应该认真评估这样一个问题:IBM是否错过了企业从巨型的信息技术开支向云服务开支转型这条大船.

大数据架构和模式(二)——如何知道一个大数据解决方案是否适合您的组织

- - 博客园_知识库
  在确定投资大数据解决方案之前,评估可用于分析的数据;通过分析这些数据而获得的洞察;以及可用于定义、设计、创建和部署大数据平台的资源. 询问正确的问题是一个不错的起点. 使用本文中的问题将指导您完成调查. 答案将揭示该数据和您尝试解决的问题的更多特征.   尽管组织一般情况对需要分析的数据类型有一些模糊的理解,但具体的细节很可能并不清晰.

你不知道的数据工程师:80% 时间都在做「大数据苦工」

- - TECH2IPO创见
以为数据工程师每天做的就是像 http://hackertyper.net/ 这样,然后创造了一个又一个伟大的产品吗. 纽约时报记者 采访了多位大数据工程师,他们表示自己 80% 的时间都在当「大数据苦工」,干的都是非人类可以想象的枯燥繁琐的工作——从海量的原始数据中提取有用数据,整理,转换格式,调整为算法可以理解的同样格式的规整数据…….

谈大数据(2)

- - 人月神话的BLOG
对于大数据,后面会作为一个系列来谈,大数据涉及的方面特别多,包括主数据,数据中心和ODS,SOA,云计算,业务BI等很多方面的内容. 前面看到一个提法,即大数据会让我们更加关注业务方面的内容,而云平台则更多是技术层面的内容. 对于大数据会先把各个理解的关键点谈完了,再系统来看大数据的完整解决方案和体系化.

大数据之惑

- - 互联网分析
算起来,接触大数据、和互联网之外的客户谈大数据也有快2年了. 也该是时候整理下一些感受,和大家分享下我看到的国内大数据应用的一些困惑了. 云和大数据,应该是近几年IT炒的最热的两个话题了. 在我看来,这两者之间的不同就是: 云是做新的瓶,装旧的酒; 大数据是找合适的瓶,酿新的酒. 云说到底是一种基础架构的革命.

白话大数据

- - 互联网分析
这个时代,你在外面混,无论是技术还是产品还是运营还是商务,如果嘴里说不出“大数据”“云存储”“云计算”,真不好意思在同行面前抬头. 是千万级别的用户信息还是动辄XXXTB的数据量. 其实,大数据在我的眼里,不是一门技术,而是一种技能,从数据中去发现价值挖掘价值的技能. ”当我掷地有声用这句话开场时,正好一个妹子推门而入,听到这句话,微微一怔,低头坐下.

交通大数据

- - 人月神话的BLOG
本文简单谈下智慧交通场景下可能出现的大数据需求和具体应用价值. 对于公交线路规划和设计是一个大数据潜在的应用场景,传统的公交线路规划往往需要在前期投入大量的人力进行OD调查和数据收集. 特别是在公交卡普及后可以看到,对于OD流量数据完全可以从公交一卡通中采集到相关的交通流量和流向数据,包括同一张卡每天的行走路线和换乘次数等详细信息.

全球10大数据库

- - 译言-电脑/网络/数码科技
原文: Fiorenttini   译者: julie20098. [非商业性转载必须注明译者julie20098和相关链接. ,否则视为侵权,追究转载责任. 世界气候数据中心:气候全球数据中心, 220TB 的网络数据, 6PB 的其它数据. 国家能源研究科学计算中心,有 2.8PB 容量.

谈大数据分析

- - 人月神话的BLOG
对于数据分析层,我们可以看到,其核心重点是针对海量数据形成一个分布式可弹性伸缩的,高查询性能的,支持标准sql语法的一个ODS库. 我们看到对于Hive,impala,InfoBright更多的都是解决这个层面的问题,即解决数据采集问题,解决采集后数据行列混合存储和压缩的问题,然后形成一个支撑标准sql预防的数据分析库.

大数据的一致性

- - 阳振坤的博客
看到了一篇关于数据一致性的文章:下一代NoSQL:最终一致性的末日. (  http://www.csdn.net/article/2013-11-07/2817420 ),其中说到: 相比关系型数据库,NoSQL解决方案提供了shared-nothing、容错和可扩展的分布式架构等特性,同时也放弃了关系型数据库的强数据一致性和隔离性,美其名曰:“最终一致性”.