ZooKeeper-- 管理分布式环境中的数据

标签: zookeeper 管理 分布 | 发表时间:2014-09-06 15:00 | 作者:501311837
出处:http://www.iteye.com

1.随着分布式应用的不断深入,需要对集群管理逐步透明化。监控集群和作业状态;可以充分的利用ZK的独有特性,熟悉程度决定应用高度


2.Service端具有fast fail特性,非常健壮,无单点,不超过半数Server挂掉不会影响提供服务


3.zookeeper名字空间由节点znode构成,其组织方式类似于文件系统, 其各个节点相当于目录和文件,通 过路径作为唯一标示。与文件系统不同的是,每个节点具有与之对用的数据内容,同时也可以具有子节点


4.ZK用于存储协调数据,如状态、配置、位置信息等。每个节点存储的数据量很小KB级别

 

5.节点维护一个状态stat结构(包括数据变化的版本号、ACL变化、时间戳),以允许缓存验证与协调更新。每当节点数据内容改变,多一个版本号类似Hbase。客户端获取数据的同时也会获取数据版本号,节点的数据内容以原子方式读写。节点具有一个访问控制列表来约束访问操作,即具有权限控制

 

6.Watches:
Zk对Node的CRUD都可以触发监听
watch事件是一次性触发器,当wacht监视的数据发生变化,通知设置了该watch的clietn,即wacther

watch事件是异步发送至观察者

wacth是一次性触发的并且在获取watch事件和设置新watch事件之间有延迟,所以有可能不能可靠的观察到节点的每一次变化

客户端监视一个节点,总是先获取watch事件再发现节点的数据变化

watch事件的顺序对应于ZK服务所见的数据更新的顺序

 

7.ZK在hadoop平台上的典型应用


storm集群:Zk作为nimbus(master)和supervisor(slave)的中间枢纽,保存strom集群和作业的所有信息。并负责nimbus和supervisor的全部通信
Hbase集群:Zk作为协调器,为hbase提供了稳定服务和failover机制,HRegionServer也会把自己以Ephemeral(临时节点)方式注入到ZK中,使得Hmaster可以随时感知到各个HRegionServer的健康状态(可用于监控RegionServer)此外Zk也避免了HMaster的单点问题

应用三大块:
strom应用开发,storm集群监控
MR应用开发
HBase应用开发

 

8.流行的场景应用:
分布式配置管理:
分布式订阅即所谓的配置管理,顾名思义就是将数据发布到ZK节点上,共订阅者动态的获取数据,实现配置信息的集中式管理和动态更新,例如全局的配置信息,地址列表等就非常适合使用

NameService
这个主要是作为分布式命名的服务,通过调用Zk的create node api,能够很容易的创建一个全局唯一的path,这个path就可以作为一个名称

分布式通知/协调
Zk中特有的watcher注册与异步通知机制,能够很好的实现分布式环境下不同系统之间的通知于协调,实现对数据变更的实时处理。
使用方法通常是不同系统都对ZK上同一个znode进行watch,监听znode的变化(包括znode本身内容及子节点)其中一个系统update了znode那么另一个系统能够收到通知,并作出相应处理

分布式锁
这个主要得益于ZK为我们保证了数据的强一致性,即用户只要相信每时每刻,ZK集群中任意节点上的相同znode的数据时一定相同的。锁服务可以分为两大类:1.保持独占 2.控制时序

Hbase Master选举是ZK经典使用场景


   Znode

Znode    Znode维护着数据、ACL(access control list,访问控制列表) 、时间戳等交换版本号等数据结构,它通过对这些数据的管理来让缓存生效并且令协调更新。每当Znode中的数据更新后它所维护的版本号将增加,这非常类似于数据库中计数器时间戳的操作方式。

另外Znode还具有原子性操作的特点:命名空间中,每一个Znode的数据将被原子地读写。读操作将读取与Znode相关的所有数据,写操作将替换掉所有的数据。除此之外,每一个节点都有一个访问控制列表,这个访问控制列表规定了用户操作的权限。

    ZooKeeper中同样存在临时节点。这些节点与session同时存在,当session生命周期结束,这些临时节点也将被删除。临时节点在某些场合也发挥着非常重要的作用

 

     Watch机制

 

    Watch机制就和单词本身的意思一样,看。看什么?具体来讲就是某一个或者一些Znode的变化。官方给出的定义:一个Watch事件是一个一次性的触发器,当被设置了Watch的数据发生了改变的时候,则服务器将这个改变发送给设置了Watch的客户端,以便通知它们。

Watch机制主要有以下三个特点:

  1 一次性的触发器(one-time trigger)

    当数据改变的时候,那么一个Watch事件会产生并且被发送到客户端中。但是客户端只会收到一次这样的通知,如果以后这个数据再次发生改变的时候,之前设置Watch的客户端将不会再次收到改变的通知,因为Watch机制规定了它是一个一次性的触发器。

  2 发送给客户端

    这个表明了Watch的通知事件是从服务器发送给客户端的,是异步的,这就表明不同的客户端收到的Watch的时间可能不同,但是ZooKeeper有保证:当一个客户端在看到Watch事件之前是不会看到结点数据的变化的。例如:A=3,此时在上面设置了一次Watch,如果A突然变成4了,那么客户端会先收到Watch事件的通知,然后才会看到A=4。

  3被设置Watch的数据

    这表明了一个结点可以变换的不同方式。一个Znode变化方式有两种,结点本身数据的变化以及结点孩子的变化。因此Watch也可以设置为这个Znode的结点数据,当然也可以设置为Znode结点孩子。

 

     使用API来访问ZooKeeper

    API访问ZooKeeper才是客户端主要的使用手段,通过在客户端编写丰富多彩的程序,来达到对ZooKeeper的利用。这里给出一个简单的例子:(深入的还没能力给出啊,例子是从网上找的很清晰明了)

 

1. import java.io.IOException;
2.
3. import org.apache.zookeeper.CreateMode;
4. import org.apache.zookeeper.KeeperException;
5. import org.apache.zookeeper.Watcher;
6. import org.apache.zookeeper.ZooDefs.Ids;
7. import org.apache.zookeeper.ZooKeeper;
8.
9. public class demo {
10.     // 会话超时时间,设置为与系统默认时间一致
11.     private static final int SESSION_TIMEOUT=30000;
12.    
13.     // 创建 ZooKeeper 实例
14.     ZooKeeper zk;
15.    
16.     // 创建 Watcher 实例
17.     Watcher wh=new Watcher(){
18.            public void process(org.apache.zookeeper.WatchedEvent event)
19.            {
20.                    System.out.println(event.toString());
21.            }
22.     };
23.    
24.     // 初始化 ZooKeeper 实例
25.     private void createZKInstance() throws IOException
26.     {             
27.            zk=new ZooKeeper("localhost:2181",demo.SESSION_TIMEOUT,this.wh);
28.           
29.     }
30.    
31.     private void ZKOperations() throws IOException,InterruptedException,KeeperException
32.     {
33.            System.out.println("\n1. 创建 ZooKeeper 节点 (znode : zoo2, 数据: myData2 ,权限: OPEN_ACL_UNSAFE ,节点类型: Persistent");
34.            zk.create("/zoo2","myData2".getBytes(), Ids.OPEN_ACL_UNSAFE, CreateMode.PERSISTENT);
35.           
36.            System.out.println("\n2. 查看是否创建成功: ");
37.            System.out.println(new String(zk.getData("/zoo2",false,null)));
38.                           
39.            System.out.println("\n3. 修改节点数据 ");
40.            zk.setData("/zoo2", "shenlan211314".getBytes(), -1);
41.           
42.            System.out.println("\n4. 查看是否修改成功: ");
43.            System.out.println(new String(zk.getData("/zoo2", false, null)));
44.                           
45.            System.out.println("\n5. 删除节点 ");
46.            zk.delete("/zoo2", -1);
47.           
48.            System.out.println("\n6. 查看节点是否被删除: ");
49.            System.out.println(" 节点状态: ["+zk.exists("/zoo2", false)+"]");
50.     }
51.    
52.     private void ZKClose() throws  InterruptedException
53.     {
54.            zk.close();
55.     }
56.    
57.     public static void main(String[] args) throws IOException,InterruptedException,KeeperException {
58.            demo dm=new demo();
59.            dm.createZKInstance( );
60.            dm.ZKOperations();
61.            dm.ZKClose();
62.     }
63.}

 

 

 

此类包含两个主要的 ZooKeeper 函数,分别为 createZKInstance ()和 ZKOperations ()。其中 createZKInstance ()函数负责对 ZooKeeper 实例 zk 进行初始化。 ZooKeeper 类有两个构造函数,我们这里使用  “ ZooKeeper ( String connectString, , int sessionTimeout, , Watcher watcher )”对其进行初始化。因此,我们需要提供初始化所需的,连接字符串信息,会话超时时间,以及一个 watcher 实例。 17 行到 23 行代码,是程序所构造的一个 watcher 实例,它能够输出所发生的事件。

 

    ZKOperations ()函数是我们所定义的对节点的一系列操作。它包括:创建 ZooKeeper 节点( 33 行到 34 行代码)、查看节点( 36 行到 37 行代码)、修改节点数据( 39 行到 40 行代码)、查看修改后节点数据( 42 行到 43 行代码)、删除节点( 45 行到 46 行代码)、查看节点是否存在( 48 行到 49 行代码)。另外,需要注意的是:在创建节点的时候,需要提供节点的名称、数据、权限以及节点类型。此外,使用 exists 函数时,如果节点不存在将返回一

 

个 null 值。

 



已有 0 人发表留言,猛击->> 这里<<-参与讨论


ITeye推荐



相关 [zookeeper 管理 分布] 推荐:

ZooKeeper-- 管理分布式环境中的数据

- - 互联网 - ITeye博客
1.随着分布式应用的不断深入,需要对集群管理逐步透明化. 监控集群和作业状态;可以充分的利用ZK的独有特性,熟悉程度决定应用高度. 2.Service端具有fast fail特性,非常健壮,无单点,不超过半数Server挂掉不会影响提供服务. 3.zookeeper名字空间由节点znode构成,其组织方式类似于文件系统, 其各个节点相当于目录和文件,通 过路径作为唯一标示.

ZooKeeper管理员指南——部署与管理ZooKeeper

- - 淘宝网综合业务平台团队博客
本文以ZooKeeper3.4.3版本的官方指南为基础: http://zookeeper.apache.org/doc/r3.4.3/zookeeperAdmin.html,补充一些作者运维实践中的要点,围绕ZK的部署和运维两个方面讲一些管理员需要知道的东西. 本文并非一个ZK搭建的快速入门,关于这方面,可以查看《 ZooKeeper快速搭建》.

使用zookeeper管理多个hbase集群

- d0ngd0ng - 蓝色时分
    zookeeper是hbase集群的"协调器". 由于zookeeper的轻量级特性,因此我们可以将多个hbase集群共用一个zookeeper集群,以节约大量的服务器. 多个hbase集群共用zookeeper集群的方法是使用同一组ip,修改不同hbase集群的"zookeeper.znode.parent"属性,让它们使用不同的根目录.

分布式服务框架:Zookeeper

- - 标点符
Zookeeper是一个高性能,分布式的,开源分布式应用协调服务. 它提供了简单原始的功能,分布式应用可以基于它实现更高级的服务,比如同步,配置管理,集群管理,名空间. 它被设计为易于编程,使用文件系统目录树作为数据模型. 服务端跑在java上,提供java和C的客户端API. Zookeeper是Google的Chubby一个开源的实现,是高有效和可靠的协同工作系统,Zookeeper能够用来leader选举,配置信息维护等,在一个分布式的环境中,需要一个Master实例或存储一些配置信息,确保文件写入的一致性等.

基于Zookeeper的分布式共享锁

- - ITeye博客
首先,说说我们的场景,订单服务是做成集群的,当两个以上结点同时收到一个相同订单的创建指令,这时并发就产生了,系统就会重复创建订单. 这时,分布式共享锁就闪亮登场了. 共享锁在同一个进程中是很容易实现的,但在跨进程或者在不同Server之间就不好实现了. Zookeeper就很容易实现. 具体的实现原理官网和其它网站也有翻译,这里就不在赘述了.

在 python 中使用 zookeeper 管理你的应用集群

- Ken - python.cn(jobs, news)
Zookeeper 分布式服务框架是 Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等. python中有一个zkpython的包,是基于zookeeper的c-client开发的,所以安装的时候需要先安装zookeeper的c客户端.

zookeeper( 转)

- - 企业架构 - ITeye博客
转自:http://qindongliang.iteye.com/category/299318. 分布式助手Zookeeper(一). Zookeeper最早是Hadoop的一个子项目,主要为Hadoop生态系统中一些列组件提供统一的分布式协作服务,在2010年10月升级成Apache Software .

分布式集群环境hadoop、hbase、zookeeper搭建(全)

- - CSDN博客云计算推荐文章
集群环境至少需要3个节点(也就是3台服务器设备):1个Master,2个Slave,节点之间局域网连接,可以相互ping通,下面举例说明,配置节点IP分配如下:. 三个节点均使用centos 6.3系统,为了便于维护,集群环境配置项最好使用相同用户名、用户密码、相同hadoop、hbase、zookeeper目录结构.

zookeeper应用场景练习(分布式锁)

- - CSDN博客推荐文章
 在平常的高并发的程序中,为了保证数据的一致性,因此都会用到锁,来对当前的线程进行锁定. 在单机操作中,很好做到,比如可以采用Synchronized、Lock或者其他的读写多来锁定当前的线程. 但是在分布式的系统中,就很难做到这一点. 因此可以采用zookeeper中节点的特性来满足这一点.  1.每个客户端都去zookeeper上创建临时的顺序节点.

分布式配置服务etcd VS 分布式协调服务zookeeper

- - 操作系统 - ITeye博客
etcd是一个高可用的键值存储系统,主要用于共享配置和服务发现. etcd是由CoreOS开发并维护的,灵感来自于 ZooKeeper 和 Doozer,它使用Go语言编写,并通过Raft一致性算法处理日志复制以保证强一致性. Raft是一个来自Stanford的新的一致性算法,适用于分布式系统的日志复制,Raft通过选举的方式来实现一致性,在Raft中,任何一个节点都可能成为Leader.