大数据(Bigdata)未来发展趋势预测

标签: 大数据 bigdata 未来 | 发表时间:2012-03-27 22:06 | 作者:
出处:http://news.cnblogs.com/

随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注。大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像 MapReduce 一样的框架来向数十、数百或甚至数千的电脑分配工作。

在本文中,作者预测了 2012 年及今后大数据的发展方向

1.   数据分析服务

我们将看到 SaaS(Software-as-a-service,软件即服务)供应商开始提供数据分析服务(如 1010data),这些供应商将会通过你的非结构化数据,为你提供标准的报告和数据服务。除了可以访问更多的数据以提供模型外,这与 Web 分析(如 Omniture)非常相似。行业之间 70%~80% 的数据分析模型将会类似,都将提供现成的报告功能。另外 20%,将通过 web 接口允许用户创建模型去分析数据。

2.   数据可视化服务

分析只是数据的一部分,另外比较重要的是,能够以可视化的形式(类似于信息图表)来展示数据的规模和数据点。

3.   众包模式(Crowdsourcing Model)

企业将开始使用众包模式,以帮助分析和发现数据中的模型。

众包是互联网带来的新的生产组织形式,即企业利用互联网将工作分配出去,以发现创意或解决技术问题。通过互联网控制,这些组织可以利用志愿员工大军的创意和能力——这些志愿员工具备完成任务的技能,愿意利用业余时间工作,满足于对其服务收取小额报酬,或者暂时并无报酬,仅仅满足于未来获得更多报酬的前景。尤其对于软件业和服务业,这提供了一种组织劳动力的全新方式。

众包和普通意义上的外包不同点在于,前者的任务和问题是外派给不确定的群体,而后者是外派给确定的个体。

4.   RDBMS(关系型数据库管理系统)供应商将东山再起

NoSQL 供应商声称大数据存储、快速处理和分析功能是他们产品的优势。但我相信,一些大厂商(如 Oracle、IBM、微软等)将会推出能够存储和处理大量数据(包含 SQL MapReduce 层)的关系型数据库版本,并整合 NoSQL 在处理大数据上的特性。

5.   NoSQL 市场将会重组

目前 NoSQL 解决方案已经被大量用于具体的用户实例上,并能够很好地运行,但这需要企业根据需求做大量的工作。在这种情况下,一些产品将被合并,一些将失去社区支持,一些将被其他供应商收购。

6.   数据分析库

为了帮助开发人员分析数据,常用的模型和设计将会被做成现成的库。这意味着,常用模型的数据分析将会更加容易。

综上所述,未来大数据将会遵循消费化模式,核心基础设施将作为服务或应用程序来提供。数据分析和数据可视化将会在原始数据基础上作为一套标准的服务,并允许用户创建自己的数据模型。

Via Javacodegeeks

本文链接



相关 [大数据 bigdata 未来] 推荐:

大数据(Bigdata)未来发展趋势预测

- - 博客园_新闻
随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注. 大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱. 大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像 MapReduce 一样的框架来向数十、数百或甚至数千的电脑分配工作.

BigData预处理(步骤)

- - CSDN博客综合推荐文章
(1)现实世界的数据是肮脏的(不完整,含噪声,不一致). (2)没有高质量的数据,就没有高质量的挖掘结果(高质量的决策必须依赖于高质量的数据;数据仓库需要对高质量的数据进行一致地集成). (3)原始数据中存在的问题:. 不一致 —— 数据内含出现不一致情况. 不完整 —— 感兴趣的属性没有. 含噪声 —— 数据中存在着错误、或异常(偏离期望值)的数据.

C2B的未来:大数据定制

- - CSDN博客综合推荐文章
昨天看到微信SuperSofter写了一篇文章,有感而发,以便备记. 阿里不只是在与腾讯拼移动,它的电商本土业务也在稳步推进. 最近一个里程碑事件是,阿里包下了美的、九阳、苏泊尔等十个品牌的12条生产线,专为天猫特供小家电. 阿里通过所掌握的数据以及分析成果,去指导这些生产线的研发、设计、生产、定价.

大数据的未来是App 而非基础架构

- - 互联网的那点事
本文作者Justin LaFayette,为我们解读他眼中大数据的未来. 在大数据被各种媒体热炒的同时,真相被蒙蔽了:App才是大数据的未来. 过去基础架构和平台一直是被捧吹的对象,但它们只提供了承载大数据的环境,无法利用大数据创造长期价值,所以它们并不是大数据的未来核心. 在市场上它需要公司提供大数据App,能够洞察特定市场版块或业务流程、及时反馈数据、到达尽可能多的调差对象.

HBase最佳实践-写性能优化策略 – 有态度的HBase/Spark/BigData

- -
上一篇文章主要介绍了HBase读性能优化的基本套路,本篇文章来说道说道如何诊断HBase写数据的异常问题以及优化写性能. 和读相比,HBase写数据流程倒是显得很简单:数据先顺序写入HLog,再写入对应的缓存Memstore,当Memstore中数据大小达到一定阈值(128M)之后,系统会异步将Memstore中数据flush到HDFS形成小文件.

HBase最佳实践-读性能优化策略 – 有态度的HBase/Spark/BigData

- -
任何系统都会有各种各样的问题,有些是系统本身设计问题,有些却是使用姿势问题. HBase也一样,在真实生产线上大家或多或少都会遇到很多问题,有些是HBase还需要完善的,有些是我们确实对它了解太少. 总结起来,大家遇到的主要问题无非是Full GC异常导致宕机问题、RIT问题、写吞吐量太低以及读延迟较大.

HBase最佳实践-列族设计优化 – 有态度的HBase/Spark/BigData

- -
随着大数据的越来越普及,HBase也变得越来越流行. 会用HBase现在已经变的并不困难,然而,怎么把它用的更好却并不简单. 很简单,在保证系统稳定性、可用性的基础上能够用最少的系统资源(CPU,IO等)获得最好的性能(吞吐量,读写延迟)就是’用的好’. HBase是一个庞大的体系,涉及到很多方面,很多因素都会影响到系统性能和系统资源使用率,根据场景对这些配置进行优化会很大程度上提升系统的性能.

Oracle副总裁Thomas Kyte谈大数据处理和未来的DBA

- - InfoQ cn
Thomas Kyte现任甲骨文公司副总裁,是服务器技术部门的高级架构师. 他是 Oracle Magazine Ask Tom专栏的那个Tom,热心回答关于甲骨文数据库以及相关方面的各种问题. Thomas 是Oracle ACE,也是一位穿梭于世界各地Oracle 会议的独具特色的演讲者. 他著有多本关于Oracle 数据库技术以及Oracle应用的书籍.

关于遗忘、发明与教育:“大数据”未来的若干可能

- - PingWest
我们生活在一个被几何级爆炸的数据包围的时代,现在,这些数据被叫作“大数据”. 大数据将深刻影响人们的生活、工作和生活方式——而反过来说,你留在数字世界里的任何踪迹都变成了数据的一部分. 它包括你在社交网络上的每条口水吐槽和照片,你的地理位置签到,你点击的每一个“like”,你与任何人的“好友”链接,你在亚马逊上每一次“点击”的购买记录甚至你的每一次搜索内容……也就是说,每个人创造的数据就是“大数据”的一部分,每个人都是大数据的生产者和消费者.

马云,为什么将云计算和大数据作为未来战略

- - 人人都是产品经理
前几天马云的一封未来战略信引起了笔者的注意,马云在信中提到云端将是移动互联网的关键,阿里未来10年的目标是建立DT数据时代中国商业发展的基础设施. 前些天还一直在推动阿里社交APP的马云,为什么会在这个节点突然提出云计算和大数据战略. 这显然是有预谋的,也许就是为了和阿里未来的战略目标相呼应,前两天阿里挤走了IBM,拿下了国内最大的IT服务商东软并签署了战略协议,而东软将逐渐把传统IT服务迁移到阿里云的云计算平台.