Oracle大数据机和连接器产品支持与Hadoop和Cloudera Manager集成

标签: oracle 大数据 和连 | 发表时间:2012-03-02 15:56 | 作者:
出处:http://pipes.yahoo.com/pipes/pipe.info?_id=10560380f804c7341f042a2b8a03e117

Oracle大数据机和大数据连接器软件支持与Hadoop、Cloudera Manager以及Oracle NoSQL数据库的集成。上月Oracle 宣布携手Cloudera进军大数据机和连接器软件领域。

大数据机融合了Cloudera公司的 Apache Hadoop(CDH)和 Cloudera Manager管理应用,以及一个开源统计性编程语言 R。它采用Oracle Enterprise Linux 5.6作为其操作系统,配备有HotSpot Java虚拟机。大数据机能够运行 Oracle NoSQL数据库社区版和企业版。它同时能与Oracle的其他产品,如Exadata、以及配备有Oracle大数据连接器软件的Oracle数据库进行集成,以此分析企业内部那些结构化数据和非结构化数据。

大数据连接器软件:

Oracle的 大数据连接器软件产品可利用Oracle数据库11g整合储存在Hadoop及Oracle NoSQL数据库中的数据。通过在Hadoop数据上直接使用Oracle的开源R语言可实现对数据的分析。大数据连接器软件包包含以下组件:

  • 针对Hadoop的Oracle加载器:这是一种MapReduce应用,用以优化从Hadoop下载到Oracle数据库中的数据。它可以用来在Hadoop中对数据进行筛选、分区以及转换成Oracle数据库的数据格式。它还可以以Hadoop集群中的一项Hadoop任务的形式来对数据进行预处理,然后再将转换过的数据加载入数据库中。该特性同样支持在线或离线选项,负载均衡及多种输入格式(如定界文本文件、 Hive表以及自定义格式)。
  • 针对Hadoop分布式文件系统(HDFS)的Oracle直连器: 支持从Oracle数据库中直连在HDFS上的数据,并且通过在Oracle数据库中创建某外部表,用户能够从HDFS访问和导入数据。在HDFS中存储的数据可通过SQL进行查询,这些数据会与Oracle数据库中存储的数据相关联,或被加载至Oracle数据库中。HDFS中的数据可以存在于界定文件中,或者是由Oracle加载器为Hadoop创建的Oracle数据pump文件中。
  • 针对Hadoop的Oracle数据集成(ODI)应用适配器:该适配器提供了与ODI的原始Hadoop集成。ODI模块可用于在ODI内部构建Hadoop元数据、加载数据到Hadoop、在Hadoop内部转换数据以及利用针对Hadoop的Oracle加载器直接将数据加载到Oracle数据库中。
  • 针对Hadoop的Oracle R连接器:该组件是一个R语言包,用来帮助访问Hadoop以及存储在HDFS中的数据。它可用于创建R模块来应对使用MapReduce处理的海量数据。

Cloudera Manager:

包含在大数据机捆绑包中的Cloudera Manager提供一个集群范围的、实时的运行节点及服务视图,它能够用来改变跨集群内的配置。它还包括了报告和诊断工具来观察集群的性能和利用率。

Oracle Advanced Analytics:

Oracle近期还 发布了一款新的针对大数据的产品 Oracle Advanced Analytics,它将统计式编程语言R集成至Oracle数据库11g产品中。 Oracle Data Mining,作为内嵌于Oracle Advanced Analytics的数据挖掘软件,能够帮助客户构建并部署预测分析应用从而获悉更多应用性能方面的信息。

查看英文原文: Oracle Big Data Appliance and Connectors Support Integration with Hadoop and Cloudera Manager

译者 吴宇 关注Java EE,感兴趣的技术领域包括软件架构、SOA、ESB和开源项目等。

相关 [oracle 大数据 和连] 推荐:

Oracle大数据机和连接器产品支持与Hadoop和Cloudera Manager集成

- - InfoQ cn
Oracle大数据机和大数据连接器软件支持与Hadoop、Cloudera Manager以及Oracle NoSQL数据库的集成. 上月Oracle 宣布携手Cloudera进军大数据机和连接器软件领域. 大数据机融合了Cloudera公司的 Apache Hadoop(CDH)和 Cloudera Manager管理应用,以及一个开源统计性编程语言 R.

Oracle副总裁Thomas Kyte谈大数据处理和未来的DBA

- - InfoQ cn
Thomas Kyte现任甲骨文公司副总裁,是服务器技术部门的高级架构师. 他是 Oracle Magazine Ask Tom专栏的那个Tom,热心回答关于甲骨文数据库以及相关方面的各种问题. Thomas 是Oracle ACE,也是一位穿梭于世界各地Oracle 会议的独具特色的演讲者. 他著有多本关于Oracle 数据库技术以及Oracle应用的书籍.

Oracle 收购 Ksplice

- feng823 - LinuxTOY
实现无需重启即可为 Linux 内核打安全补丁的 Ksplice 被 Oracle 收购. 在被收购前, Ksplice 为 Fedora, Ubuntu 免费提供该功能,对于 RHEL 和 CentOS 则需要订阅其产品. Oracle 表示将把 Ksplice 带来的零宕机安全更新功能添加到 Oracle 产品订阅服务中,同时停止对其他企业级 Linux 发行版的支持,将 Oracle Unbreakable Linux 打造成唯一具备零宕机安全更新功能的企业级 Linux 发行版.

Linux Ksplice,MySQL and Oracle

- Syn - DBA Notes
Oracle 在 7 月份收购了 Ksplice. 使用了 Ksplice 的 Linux 系统,为 Kernel 打补丁无需重启动,做系统维护的朋友应该明白这是一个杀手级特性. 现在该产品已经合并到 Oracle Linux 中. 目前已经有超过 700 家客户,超过 10 万套系统使用了 Ksplice (不知道国内是否已经有用户了.

oracle license计算

- Fenng - eagle's home
Oracle license的计算是基于CPU core的. 用core的数目乘以一个系数core factor就可以得到所需的oracle license的数目. 对于不同的CPU,core factor是不一样的,可以从oracle提供的这张列表中查到 Oracle Processor Core Factor Table.

Oracle Exadata初探

- - 技术改变世界 创新驱动中国 - 《程序员》官网
在我们看来,它是一个把硬件和软件根据合理的配置整合在一起的 Oracle数据库(在本文编写时是11gR2版本)平台. Exadata数据库机器包含了存储子系统,在存储层上运行着研发的新软件,这使得研发人员可以做一些在其他平台上无法完成的事情. 实际上,Exadata一开始是以一个存储系统形式诞生的,如果你跟参与研发此产品的人交谈,你经常会听到他们称存储组件为Exadata或者是SAGE (Storage Appliance for Grid Environments,网格环境存储设备),这是该产品研发项目的代码名称.

Oracle MySQL Or NoSQL续

- - Sky.Jian 朝阳的天空
接前面一篇,这里再将之前在“中国系统架构师大会”5周年的时候发布的纪念册“IT架构实录”上的一篇文章发出来,也算是前面博文中PPT的一个文字版解读吧. Oracle,MySQL 还是 NoSQL. 随着阿里系的“去IOE”运动在社区的宣传声越来越大,国内正在掀起一股“去xxx”的技术潮. 不仅仅是互联网企业,包括运营商以及金融机构都已经开始加入到这个潮流之中.

[转]Oracle 碎片

- - 小鸥的博客
  当生成一个数据库时,它会 分成称为表空间( Tablespace )的多个逻辑段( Segment ),如系统( System )表空间 , 临时( Temporary )表空间等. 一个表空间可以包含多个数据范围( Extent )和一个或多个自由范围块,即自由空间( Free Space ).

oracle 索引

- - 数据库 - ITeye博客
        自动:在使用primary和unique后系统会自动创建唯一索引.         手动:create   index   索引名  on 表名(字段1,....). 查询表上有哪些索引(网上找的,能用,表名和索引名要大写). 1、查找表的所有索引(包括索引名,类型,构成列):. select t.*,i.index_type from user_ind_columns t,user_indexes i where t.index_name = i.index_name and t.table_name = i.table_name and t.table_name = 要查询的表.

Oracle索引

- - Oracle - 数据库 - ITeye博客
在关系数据库中,索引是一种与表有关的数据库结构,它可以使对应于表的SQL语句执行得更快. 索引的作用相当于图书的目录,可以根据目录中的页码快速找到所需的内容. 对于数据库来说,索引是一个必选项,但对于现在的各种大型数据库来说,索引可以大大提高数据库的性能,以至于它变成了数据库不可缺少的一部分. singlecolumnorconcatenated  对一列或多列建所引.