概述
官方文档上这么解释Zookeeper,它是一个分布式服务框架,是Apache Hadoop 的一个子项目,它主要是用来解决分布式应用中经常遇到的一些数据管理问题,如:统一命名服务、状态同步服务、集群管理、分布式应用配置项的管理等。
简单来说Zookeeper=文件系统+监听通知机制
。
从设计模式角度理解:Zookeeper 是一个基于观察者模式设计的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接受观察者的注册,一旦这些数据的状态发生变化,Zookeeper就将负责通知已经在Zookeeper上注册的那些观察者做出相应的反应。
文件系统
ZooKeeper 数据模型的结构与 Unix 文件系统很类似,整体上可以看作是一棵树,每个节点称做一个 ZNode。每一个 ZNode 默认能够存储 lMB 的数据,每个 ZNode 都可以通过其路径唯一标识。和文件系统一样,我们能够自由的增加、删除ZNode ,在一个ZNode 下增加、删除子ZNode,唯一的不同在于ZNode 是可以存储数据的。
节点类型:
持久(Persistent,默认):客户端和服务器端断开连接后,创建的节点不删除。
-
持久化目录节点(PERSISTENT),客户端与 Zookeeper 断开连接后,该节点依旧存在。
-
持久化顺序编号目录节点(PERSISTENT_SEQUENTIAL),客户端与 Zookeeper 断开连接后,该节点依旧存在,只是 Zookeeper 给该节点名称进行顺序编号。
短暂(Ephemeral):客户端和服务器端断开连接后,创建的节点自己删除。
-
临时目录节点(EPHEMERAL),客户端与 Zookeeper 断开连接后,该节点被删除。
-
临时顺序编号目录节点(EPHEMERAL_SEQUENTIAL),客户端与 Zookeeper 断开连接后,该节点被删除,只是 Zookeper 给该节点名称进行顺序编号。
说明:创建 ZNode 时设置顺序标识,ZNode 名称后会附加一个值,顺序号是一个单调递增的计数器,由父节点维护注意:在分布式系统中,顺序号可以被用于为所有的事件进行全局排序,这样客户端可以通过顺序号推断事件的顺序。
监听机制
客户端注册监听它关心的目录节点,当目录节点发生变化(数据改变、被删除、子目录节点增加删除)时,Zookeeper 会通知客户端。
Zookeeper 功能非常强大,可以实现诸如分布式应用配置管理、统一命名服务、状态同步服务、集群管理等功能,我们这里拿比较简单的分布式应用配置管理为例来说明。
假设我们的程序是分布式部署在多台机器上,如果我们要改变程序的配置文件,需要逐台机器去修改,非常麻烦,现在把这些配置全部放到 Zookeeper上去,保存在 Zookeeper 的某个目录节点中,然后所有相关应用程序对这个目录节点进行监听,一旦配置信息发生变化,每个应用程序就会收到 Zookeeper 的通知,然后从 Zookeeper 获取新的配置信息应用到系统中。
评论区