HBase入门笔记（四）--完全分布式HBase集群安装配置

标签： Hadoop | 发表时间：2012-02-08 19:52 | 作者：jrckkyy

出处：http://hi.baidu.com/jrckkyy

http://www.cnblogs.com/ventlam/archive/2011/01/22/HBaseCluster.html

HBase 是一个开源的非关系(NoSQL)的可伸缩性分布式数据库。它是面向列的，并适合于存储超大型松散数据。HBase适合于实时，随机对Big数据进行读写操作的业务环境。关于HBase的更多介绍请参见 HBase项目官网。

本文环境与上一讲-- 完全分布式Hadoop集群配置一致。OS是Ubuntu Server 10.04，HBase版本是0.20.6。

HRegionServer&HQuorumPeer:dm1,IP:192.168.0.17;

HRegionServer&HQuorumPeer:dm2,IP:192.168.0.18;

HRegionServer&HQuorumPeer:dm3,IP:192.168.0.9;

HMaster&NameNode:dm4,IP:192.168.0.10;（SecondaryNameNode）

虽然secondarynamenode和namenode放在同一台机器上比较不合理。但是考虑到这只是个实验的小集群（硬件环境不允许），再者有xenserver的时序快照的保障，就不将SecondaryNameNode部署在其他机器上了。

主要的还是配置工作，依然将HBase放在/home下，编辑/home/hbase/conf下的hbase-site.xml，hbase-default.xml,hbase-env.sh 这几个文件。具体步骤如下：

一.编辑 所有机器上的hbase-site文件，命令如下：

1	vi /home/hbase/conf/hbase-site.xml

编辑文件如下列代码所示。注意项有2：

1.其中首先需要注意hdfs://dm4:9000/hbase这里， 必须与你的Hadoop集群的 core-site.xml文件配置保持完全一致才行，如果你Hadoop的hdfs使用了其它端口，请在这里也修改。再者就是Hbase该项并 不识别机器IP，只能使用机器hostname才可行，即若使用dm4的IP(192.168.0.10)是会抛出java错误，至于具体的错误由于时间久远，我就懒得去翻查那大量的log了。

2. hbase.zookeeper.quorum 的个数必须是奇数。

<name>hbase.rootdir</name>

<value>hdfs://dm4:9000/hbase</value>

</property>

<name>hbase.cluster.distributed</name>

</property>

<name>hbase.master</name>

</property>

<name>hbase.zookeeper.quorum</name>

</property>

</configuration>

二.编辑所有机器的 hbase-default.xml，命令如下：

1	vi /home/hbase/conf/hbase-default.xml

只需修改前面hbase.rootdir 与hbase.cluster.distributed 这两项。修改如下面代码所示：

HBase的数据重启就被擦掉，如果需要数据持久化的，就修改rootdir项，写定你的HDFS目录。

至于default内其它的项的含义与修改，再请参考官网。

<name>hbase.rootdir</name>

<value>hdfs://dm4:9000/hbase_rootdir</value>

<description>The directory shared by region servers.

Should be fully-qualified to include the filesystem to use.

E.g: hdfs://NAMENODE_SERVER:PORT/HBASE_ROOTDIR

</description>

</property>

<name>hbase.master.port</name>

<description>The port master should bind to.</description>

</property>

<name>hbase.cluster.distributed</name>

<description>The mode the cluster will be in. Possible values are

false: standalone and pseudo-distributed setups with managed Zookeeper

true: fully-distributed with unmanaged Zookeeper Quorum (see hbase-env.sh)

</description>

</property>

三. 编辑 所有机器的hbase-env.sh，命令如下：

1	vi /home/hbase/conf/hbase-env.sh

修改代码如下所示：

export HBASE_OPTS="$HBASE_OPTS -XX:+HeapDumpOnOutOfMemoryError -XX:+UseConcMarkS

weepGC -XX:+CMSIncrementalMode"

export JAVA_HOME=/usr/lib/jvm/java-6-sun-1.6.0.22

export HBASE_MANAGES_ZK=true

export HBASE_HOME=/home/hbase

export HADOOP_HOME=/home/hadoop

四.编辑所有机器的HBase的HMasters和HRegionServers。修改/home/hbase/conf 文件夹下的regionservers文

件。添加DataNode的IP即可。代码如下：

192.168.0.9

192.168.0.17

192.168.0.18

行文至此，HBase集群的配置已然完成。以下便是启动和测试。

五.启动.测试HBase数据库。

在HMaster即Namenode （dm4）启动HBase数据库（Hadoop集群必须已经启动）。启动命令：

1	/home/hbase/bin/start-hbase.sh

Hbase启动如下图所示：

最好输入JPS命令测试一下你当前Hbase集群进程。如下图：

然后输入如下命令进入hbase的命令行管理界面：

1	/home/hbase/bin/hbase shell

在hbase shell下输入list，如下所示，列举你当前数据库的名称，如下图所示。如果你的Hbase没配置成功会抛出java错误。

我们也可以通过WEB页面来管理查看HBase数据库。

HMaster： http://192.168.0.10:60010/master.jsp

我的HBase数据库截图：

至于HBase的命令参见： Hadoop Wiki

HBase数据库的开发应用，包括数据库读写和条件查询等，请参见我未来的文章……

六.参考文献

1.HBase: Bigtable-like structured storage for Hadoop HDFS

http://wiki.apache.org/hadoop/Hbase

2.HBase Testing Tutorial

http://wiki.apache.org/hadoop/Hbase/HowToTest

阅读全文
类别： Hadoop 查看评论

HBase入门笔记（四）--完全分布式HBase集群安装配置

相关 [hbase 笔记完全] 推荐：