VMware已发布Spring Hadoop

标签: vmware spring hadoop | 发表时间:2012-03-03 07:40 | 作者:
出处:http://pipes.yahoo.com/pipes/pipe.info?_id=10560380f804c7341f042a2b8a03e117

VMware最近宣布,他们已经开始提供Spring Hadoop,这个项目整合了Spring框架和Apache Hadoop平台。该项目提供了一种方便的机制,让我们可以通过Spring容器来配置、创建和执行各种各样的服务和工具,像 MapReduceHivePigCascading作业等。此外,该项目还通过JVM脚本语言——像Groovy、JRuby、Jython和Rhino——提供了对 HDFS数据访问的支持,为 HBase提供了声明式配置的支持,以及对Hadop工具(包括 FS ShellDistCp)提供了声明和编程的支持。

可能更有意义的是,工具还为基于Spring的应用程序提供了一种便利方式,可以使用Hadoop作为数据分析工具,而这些数据可能来自多个源,像Spring Integration和Spring Batch,以及传统的关系型数据库等等。“例如,你可以让Hadoop作业成为Spring Batch环境中的tasklet,从而我们可以开始对其进行调整,并在作业完成时拥有触发器,”SpringSource的CTO,Adrian Colyer告诉InfoQ。

或者我们可能让Spring Integration来监控目录中是否有文件进入,然后使用它作为触发器来初始化Hadoop作业。你可以开始真正把这集成到Spring中,并使用所有其它组件把Hadoop以及各种数据处理工具连接到标准的企业工具集中。

这个项目和Spring Data项目最初的适用范围更普遍,这反映出在企业应用程序中NoSQL和大数据越来越重要。Colyer解释说:

在很长一段时间之后,可能是十年之后,当来自于企业应用程序的数据想要知道,“我如何与关系型数据库对话?”,而解决方案很显而易见,企业数据现在看起来已经很不一样了。我们已经看到有不同的存储和方法,并且越来越明显,企业数据的一种非常重要并且不断成长的方式就是大数据和批量数据处理。

这样,和新发布的Hadoop项目一样,它更广泛的目标是为各种不同样式的SQL和NoSQL数据库——关系型数据库、图型数据库、文档数据库、键值数据库等等——提供一等支持,并显式地支持某些那种更流行的产品类型。当前这包括对JPA的支持,还有 MongoDBRedisNeo4J,并且 Cassandra方面也在进行中。Colyer认为这个列表反映出当前SpringSource的企业用户中处于领先地位的产品,但是需要强调的是,在大多数大型企业中,对NoSQL数据库的使用还处于初级阶段。

VMware会在加利福尼亚的Santa Clara举办的 O'Reilly Strata大会上做演讲,介绍Spring Hadoop项目。

查看英文原文: VMware Introduces Spring Hadoop

译者 侯伯薇 是InfoQ中文站架构社区编辑,有多年对日和国内项目开发经验,目前关注企业中技术与实际业务之间的融合和协作。

相关 [vmware spring hadoop] 推荐:

VMware已发布Spring Hadoop

- - InfoQ cn
VMware最近宣布,他们已经开始提供Spring Hadoop,这个项目整合了Spring框架和Apache Hadoop平台. 该项目提供了一种方便的机制,让我们可以通过Spring容器来配置、创建和执行各种各样的服务和工具,像 MapReduce、 Hive、 Pig和 Cascading作业等.

ElasticSearch位置搜索 - Spring , Hadoop, Spark , BI , ML - CSDN博客

- -
在ElasticSearch中,地理位置通过. geo_point这个数据类型来支持. 地理位置的数据需要提供经纬度信息,当经纬度不合法时,ES会拒绝新增文档. 这种类型的数据支持距离计算,范围查询等. mapping为city:. geo_point类型必须显示指定,ES无法从数据中推断. 在ES中,位置数据可以通过对象,字符串,数组三种形式表示,分别如下:.

转换 Vmware Image to Virtualbox Image 或者 导入 Vmware Imagee into Virtu

- - 操作系统 - ITeye博客
VirtualBox can run VMs created by VMware Workstation or Server for this you need to import vmdk files using the following procedure. 来源: http://www.ubuntugeek.com/howto-convert-vmware-image-to-virtualbox-image.html.

针对Lion优化 VMware Fusion 4发布

- Woooon - cnBeta.COM
今天VMware宣布推出Fusion 4软件,能够帮助用户轻松在OS X系统下运行Windows和起它操作系统. Fusion4 针对苹果Lion系统进行了大量优化和改进,增加了90种新特性.

VMware Workstation 8.0中文正式版下载(含VMware Workstation 8.0注册机及序列号)

- sky - 实用软件和技巧分享-北极寒流
VMware Workstation 8.0中文正式破解版下载(含VMware Workstation 8.0注册机及序列号). VMware Workstation是一款非常优秀的虚拟机,与开源虚拟机VirtualBox齐名. 个人经常用VMware Workstation来测试绿色软件,以及测试安装新系统(如windows 8).

Hadoop Streaming 编程

- - 学着站在巨人的肩膀上
Hadoop Streaming是Hadoop提供的一个编程工具,它允许用户使用任何可执行文件或者脚本文件作为Mapper和Reducer,例如:. 采用shell脚本语言中的一些命令作为mapper和reducer(cat作为mapper,wc作为reducer). 本文安排如下,第二节介绍Hadoop Streaming的原理,第三节介绍Hadoop Streaming的使用方法,第四节介绍Hadoop Streaming的程序编写方法,在这一节中,用C++、C、shell脚本 和python实现了WordCount作业,第五节总结了常见的问题.

Hadoop使用(一)

- Pei - 博客园-首页原创精华区
Hadoop使用主/从(Master/Slave)架构,主要角色有NameNode,DataNode,secondary NameNode,JobTracker,TaskTracker组成. 其中NameNode,secondary NameNode,JobTracker运行在Master节点上,DataNode和TaskTracker运行在Slave节点上.

Hadoop MapReduce技巧

- - 简单文本
我在使用Hadoop编写MapReduce程序时,遇到了一些问题,通过在Google上查询资料,并结合自己对Hadoop的理解,逐一解决了这些问题. Hadoop对MapReduce中Key与Value的类型是有要求的,简单说来,这些类型必须支持Hadoop的序列化. 为了提高序列化的性能,Hadoop还为Java中常见的基本类型提供了相应地支持序列化的类型,如IntWritable,LongWritable,并为String类型提供了Text类型.

Hadoop TaskScheduler浅析

- - kouu's home
TaskScheduler,顾名思义,就是MapReduce中的任务调度器. 在MapReduce中,JobTracker接收JobClient提交的Job,将它们按InputFormat的划分以及其他相关配置,生成若干个Map和Reduce任务. 然后,当一个TaskTracker通过心跳告知JobTracker自己还有空闲的任务Slot时,JobTracker就会向其分派任务.

HADOOP安装

- - OracleDBA Blog---三少个人自留地
最近有时间看看hadoop的一些东西,而且在测试的环境上做了一些搭建的工作. 首先,安装前需要做一些准备工作. 使用一台pcserver作为测试服务器,同时使用Oracle VM VirtualBox来作为虚拟机的服务器. 新建了三个虚拟机以后,安装linux,我安装的linux的版本是redhat linux 5.4 x64版本.