大数据——理想与现实的差距

标签: 大数据 理想 现实 | 发表时间:2012-12-03 17:21 | 作者:
出处:http://pipes.yahoo.com/pipes/pipe.info?_id=10560380f804c7341f042a2b8a03e117

IBM最近进行了一项调查,希望借此搞清楚大数据技术的市场炒作和实际应用的差距。结果表明:28%的公司已经应用或实施了大数据,47%的公司计划使用,24%准备了解此项技术。

在2012年中期,由IBM主导进行的“Big Data @ Work”调查,调查对象包括来自95个国家横跨26个行业的1144位专业人士。IBM商业价值研究院和牛津大学赛德商学院基于此项调查结果,共同撰写名为 2012分析研究——大数据技术的实际应用(需要注册)的报告。

这份报告从4个维度定义了大数据:

  • 海量——大数据最显著的特点。略超50%的受访者认为,1TB-1PB的才是大数据,少数受访者认为一般提到都是几个PB或是ZB。
  • 多样性——大数据包括了多种数据,从结构化、半结构化到非结构化的数据,从企业内部数据到外部数据。这些数据包括多种类型,如文本、二进制、传感器数据、微博、Web数据、点击数据、日志、音频、视频,等等。
  • 快速——当前,数据产生的比以前更快,对这些数据进行实时处理更加困难。
  • 真实——报告中将它作为描述数据的可靠性的第四个维度。外部或内部的因素可能会影响到数据的质量,所以分析结果也会受到影响,因此需要考虑这一点。

下面是对“Big Data @ Work”调查结果的总结:

  • 28%的组织已经开始应用大数据技术,或是实施了大数据的项目,47%在计划中,24%仅仅是想了解大数据究竟是什么。
  • 大数据项目中,以客户为中心的占49%,运营优化占18%,风险和财务管理占15%,为建立新商业模型的占14%,员工协作占4%
  • 大数据技术项目一般开始于内部的结构化数据,然后发展到半结构化数据,最后到非结构化数据。

下面这幅图描述了实施大数据的公司使用的主要平台组件:

有意思的是,大数据的主要来源不是来社交媒体、RFID或是硬件设备的传感器,而是来自于交易(88%)、日志数据(73%)、事件(59%)、电子邮件(57%),之后才是社交媒体(43%)、传感器(42%)、外部Feeds(42%)、RFID或POS设备(41%)、文本(41%)、地理位置(40%)、音频(38%)、图像或视频(34%)。

经调查,各公司应用大数据技术的动机主要分为以下方面:查询和报表(91%)、数据挖掘(77%)、数据可视化(71%)、预测建模(67%)、优化(65%)、模拟(56%)、自然语言文本(52%)、地理位置分析(43%)、数据流分析(35%)、视频分析(26)%以及语音分析(25%)。

这份在线的自愿调查的参与者来自各大洲,参与者中的多数是商业专家(54%),包含行政管理(16%)、市场(15%)、研发(10%)、综合管理/运营(8%)、金融(5%),其余的46%则代表IT人士。

查看英文原文Big Data – Distinguishing Between Hype and Reality


感谢 马国耀对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至 [email protected]。也欢迎大家通过新浪微博( @InfoQ)或者腾讯微博( @InfoQ)关注我们,并与我们的编辑和其他读者朋友交流。

您可能也会喜欢

相关 [大数据 理想 现实] 推荐:

大数据——理想与现实的差距

- - InfoQ cn
IBM最近进行了一项调查,希望借此搞清楚大数据技术的市场炒作和实际应用的差距. 结果表明:28%的公司已经应用或实施了大数据,47%的公司计划使用,24%准备了解此项技术. 在2012年中期,由IBM主导进行的“Big Data @ Work”调查,调查对象包括来自95个国家横跨26个行业的1144位专业人士.

理想和现实

- pu - 人月神话的BLOG
周末在网上看了电影《老男孩》,最先想到的就是理想和现实. 读书的时候估计每个人都写过《我的理想》,那时候写的最多的估计就是老师,工程师,科学家,医生之类. 要么是灵魂的工程师,要么是无私奉献的白衣战士,或者是保卫边疆,再者是发明创造. 很美好,也很符合主旋律,可是真正搞清楚为什么的又有几个呢. 写都能够写,真正的感兴趣又作为自己毕生追求的又有几个呢.

使用Storm实现实时大数据分析

- - 开源软件 - ITeye博客
摘要:随着数据体积的越来越大,实时处理成为了许多机构需要面对的首要挑战. Shruthi Kumar和Siddharth Patankar在Dr.Dobb’s上结合了汽车超速监视,为我们演示了使用Storm进行实时大数据分析. 简单和明了,Storm让大数据分析变得轻松加愉快. 当今世界,公司的日常运营经常会生成TB级别的数据.

拖延症:理想与现实

- sxsh1980 - 科学松鼠会

搞科研:美好的理想,残酷的现实

- jjfd - 译言-每日精品译文推荐
来源A comic about the real scientific process. 译者tjwangxiaowei@gmail.. 搞科研:美好的理想,残酷的现实. 作者:Maggie Koerth-Baker . 这些有趣的漫画是Paul Vallett发表在他名为Electron Café(电子咖啡屋)博客上的,它很生动的表现了电影上想象的科研活动和现实中科研活动的差别.

微服务架构从理想到现实

- - DockOne.io
【编者的话】本文为我最近阅读《微服务架构设计模式》的一点感悟,我不准备详细去写对该书的读书笔记记录,而是结合我们自己所做的一些微服务架构实践情况做一些总结和复盘. 任何一个新的架构模式或方法的出现,一定是传统架构模式遇到了问题. 而对于单体应用来说常说的问题主要包括了如下几个点:. 单体应用规模太大,导致复杂度剧增,难以开发和管理.

小米是互联网公司吗?雷军的理想与小米的现实

- - 博客园_新闻
尽管早在创业之初雷军就宣讲过自己的答案,但此后 8 年,小米这家公司却从未逃离由上述论题所引发的自我折磨. “小米是一定以手机、智能硬件和 IoT 平台为核心的互联网公司. ” 小米的 IPO 招股书中,“互联网公司”的身份界定之前被附加了多达 3 个定语. 其中后两个,正是在经历了 2015 年“U型”低谷后,小米为自己拓展出的新商业机会.

谈大数据(2)

- - 人月神话的BLOG
对于大数据,后面会作为一个系列来谈,大数据涉及的方面特别多,包括主数据,数据中心和ODS,SOA,云计算,业务BI等很多方面的内容. 前面看到一个提法,即大数据会让我们更加关注业务方面的内容,而云平台则更多是技术层面的内容. 对于大数据会先把各个理解的关键点谈完了,再系统来看大数据的完整解决方案和体系化.

大数据之惑

- - 互联网分析
算起来,接触大数据、和互联网之外的客户谈大数据也有快2年了. 也该是时候整理下一些感受,和大家分享下我看到的国内大数据应用的一些困惑了. 云和大数据,应该是近几年IT炒的最热的两个话题了. 在我看来,这两者之间的不同就是: 云是做新的瓶,装旧的酒; 大数据是找合适的瓶,酿新的酒. 云说到底是一种基础架构的革命.

白话大数据

- - 互联网分析
这个时代,你在外面混,无论是技术还是产品还是运营还是商务,如果嘴里说不出“大数据”“云存储”“云计算”,真不好意思在同行面前抬头. 是千万级别的用户信息还是动辄XXXTB的数据量. 其实,大数据在我的眼里,不是一门技术,而是一种技能,从数据中去发现价值挖掘价值的技能. ”当我掷地有声用这句话开场时,正好一个妹子推门而入,听到这句话,微微一怔,低头坐下.