ZooKeeper运维经验

- - Juven Xu

ZooKeeper 是分布式环境下非常重要的一个中间件，可以完成动态配置推送、分布式 Leader 选举、分布式锁等功能. 在运维 AliExpress ZooKeeper 服务的一年多来，积累如下经验：. 3台起，如果是虚拟机，必须分散在不同的宿主机上，以实现容灾的目的. 如果长远来看（如2-3年）需求会持续增长，可以直接部署5台.

zookeeper( 转)

- - 企业架构 - ITeye博客

转自：http://qindongliang.iteye.com/category/299318. 分布式助手Zookeeper（一）. Zookeeper最早是Hadoop的一个子项目，主要为Hadoop生态系统中一些列组件提供统一的分布式协作服务，在2010年10月升级成Apache Software .

ZooKeeper监控

- - 淘宝网通用产品团队博客

在公司内部，有不少应用已经强依赖zookeeper，比如meta和精卫系统，zookeeper的工作状态直接影响它们的正常工作. 目前开源世界中暂没有一个比较成熟的zk-monitor,公司内部的各个zookeeper运行也都是无监控，无报表状态. 目前zookeeper-monitor能做哪些事情，讲到这个，首先来看看哪些因素对zookeeper正常工作比较大的影响：.

1.为了解决分布式事务性一致的问题. 2.文件系统也是一个树形的文件系统，但比linux系统简单，不区分文件和文件夹，所有的文件统一称为znode. 3.znode的作用：存放数据，但上限是1M ;存放ACL(access control list)访问控制列表，每个znode被创建的时候，都会带有一个ACL，身份验证方式有三种：digest(用户名密码验证)，host(主机名验证)，ip(ip验证) ，ACL到底有哪些权限呢.

Zookeeper Client简介

- - zzm

直接使用zk的api实现业务功能比较繁琐. 因为要处理session loss，session expire等异常，在发生这些异常后进行重连. 又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅. 另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举等，还要自己额外做很多事情.

zookeeper 理论

- - zzm

引用官方的说法：“Zookeeper是一个高性能，分布式的，开源分布式应用协调服务. 它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间. 它被设计为易于编程，使用文件系统目录树作为数据模型. 服务端跑在java上，提供java和C的客户端 API”.

ZooKeeper 入门

- - 企业架构 - ITeye博客

ZooKeeper是一个高可用的分布式数据管理与系统协调框架. 基于对Paxos算法的实现，使该框架保证了分布式环境中数据的强一致性，也正是基于这样的特性，使得ZooKeeper解决很多分布式问题. 网上对ZK的应用场景也有不少介绍，本文将结合作者身边的项目例子，系统地对ZK的应用场景进行一个分门归类的介绍.

zookeeper场景

- - 企业架构 - ITeye博客

发布与订阅模型，即所谓的配置中心，顾名思义就是发布者将数据发布到ZK节点上，供订阅者动态获取数据，实现配置信息的集中式管理和动态更新. 例如全局的配置信息，服务式服务框架的服务地址列表等就非常适合使用. 应用中用到的一些配置信息放到ZK上进行集中管理. 这类场景通常是这样：应用在启动的时候会主动来获取一次配置，同时，在节点上注册一个Watcher，这样一来，以后每次配置有更新的时候，都会实时通知到订阅的客户端，从来达到获取最新配置信息的目的.

Zookeeper的Session

- - 行业应用 - ITeye博客

介绍一下基于zookeeper的一些API的编程. 在此之前，我们先来熟悉一下相关知识：. Zookeeper的Session：. （1）客户端和server间采用长连接. （2）连接建立后，server产生session ID（64位）返还给客户端. （3）客户端定期发送ping包来检查和保持和server的连接.

Paxos与zookeeper

- - 互联网 - ITeye博客

1，什么是Paxos算法. Paxos算法是分布式计算领域中一个非常重要的算法，主要解决分布式系统如何就某个值（决议）达成一致的问题. 一个典型的场景是分布式数据库的一致问题：如果分布式数据库的各个节点初始状态一致，又能执行相同的操作序列，那么最后能达到一个一致的状态. 但是如何保证在每个节点上执行相同的命令序列呢.

ZooKeeper运维经验

1. 集群数量

2. 客户端配置域名而不是 IP

3. 开启 autopurge.snapRetainCount

4. 扩容

0. 有节点 A, B, C 处于服务状态

1. 加入节点 D，配置如下：

2. 同上一步一样，加入节点 E

3. 更新 A B C 的配置如 D 和 E，并依此重启

5. 机房迁移

6. 跨机房容灾

相关 [zookeeper 运维经验] 推荐：