大数据(Bigdata)未来发展趋势预测
随着云时代的来临,大数据(Bigdata)也吸引了越来越多的关注。大数据(Big data)通常用来形容一个公司创造的大量非结构化和半结构化数据,这些数据在下载到关系型数据库用于分析时会花费过多时间和金钱。大数据分析常和云计算联系到一起,因为实时的大型数据集分析需要像 MapReduce 一样的框架来向数十、数百或甚至数千的电脑分配工作。
在本文中,作者预测了 2012 年及今后大数据的发展方向
1. 数据分析服务
我们将看到 SaaS(Software-as-a-service,软件即服务)供应商开始提供数据分析服务(如 1010data),这些供应商将会通过你的非结构化数据,为你提供标准的报告和数据服务。除了可以访问更多的数据以提供模型外,这与 Web 分析(如 Omniture)非常相似。行业之间 70%~80% 的数据分析模型将会类似,都将提供现成的报告功能。另外 20%,将通过 web 接口允许用户创建模型去分析数据。
2. 数据可视化服务
分析只是数据的一部分,另外比较重要的是,能够以可视化的形式(类似于信息图表)来展示数据的规模和数据点。
3. 众包模式(Crowdsourcing Model)
企业将开始使用众包模式,以帮助分析和发现数据中的模型。
众包是互联网带来的新的生产组织形式,即企业利用互联网将工作分配出去,以发现创意或解决技术问题。通过互联网控制,这些组织可以利用志愿员工大军的创意和能力——这些志愿员工具备完成任务的技能,愿意利用业余时间工作,满足于对其服务收取小额报酬,或者暂时并无报酬,仅仅满足于未来获得更多报酬的前景。尤其对于软件业和服务业,这提供了一种组织劳动力的全新方式。
众包和普通意义上的外包不同点在于,前者的任务和问题是外派给不确定的群体,而后者是外派给确定的个体。
4. RDBMS(关系型数据库管理系统)供应商将东山再起
NoSQL 供应商声称大数据存储、快速处理和分析功能是他们产品的优势。但我相信,一些大厂商(如 Oracle、IBM、微软等)将会推出能够存储和处理大量数据(包含 SQL MapReduce 层)的关系型数据库版本,并整合 NoSQL 在处理大数据上的特性。
5. NoSQL 市场将会重组
目前 NoSQL 解决方案已经被大量用于具体的用户实例上,并能够很好地运行,但这需要企业根据需求做大量的工作。在这种情况下,一些产品将被合并,一些将失去社区支持,一些将被其他供应商收购。
6. 数据分析库
为了帮助开发人员分析数据,常用的模型和设计将会被做成现成的库。这意味着,常用模型的数据分析将会更加容易。
综上所述,未来大数据将会遵循消费化模式,核心基础设施将作为服务或应用程序来提供。数据分析和数据可视化将会在原始数据基础上作为一套标准的服务,并允许用户创建自己的数据模型。
Via Javacodegeeks