哈希算法(二)一致性哈希

一致性哈希算法在1997年由麻省理工学院提出的一种分布式哈希(DHT)实现算法,设计目标是为了解决因特网中的热点(Hot spot)问题,经常用于分布式、负载均衡等。

原理

一致哈希是一种特殊的哈希算法。在使用一致哈希算法后,哈希表中平均只需要对 个关键字重新映射,其中 是关键字的数量,是映射节点数量。

然而在传统的哈希表中,添加或删除一个映射节点的几乎需要对所有关键字进行重新映射。

原来的映射大概是这样的,如下图,

图片1

没当加入或删除一个新的节点可能都会造成每个节点的映射发生变化,如果黄色的节点代表服务器,那么每一次更新服务器的数量都会造成每个服务器上蓝色的映射节点都会发生变化,当集群数量庞大时每次增删节点所需要的修改操作就会过于庞大。

而在一致性哈希中映射是这样的,如下图,一般一致性hash取值范围为-2^32~2^32,分布在一个圆上

图片2

下面画的比较丑,就凑合看吧~~

其中,黄色节点作为映射节点(实节点),蓝色节点为需要映射到映射节点的key节点,
首先,看左边的图,把8个蓝色的key通过hash取值散列在一个范围为0~2^32的圆上
其次,选择三个黄色节点作为映射节点,按照圆的顺时针方向,把蓝色节点与黄色节点建立映射关系
最后,由于1节点负载为4,最大,那么我们为了降低1节点的负载情况,增加黄色的映射节点4,依然按照顺时针的方向修改原映射,那么只需要改变蓝色的节点7、8以及黄色节点1

图片3

实现

  一般为了方便起见,我们把黄色的映射节点称为实节点,也就是固定不变的,而蓝色的节点称为虚节点,虚节点需要映射到实节点,每次实节点的增删只会影响距离它最近的节点。

在这里使用C++实现了ConsistentHash算法

图片4

在存储节点方面,本程序只是简单的使用链表,最好的方式当然是红黑树了,当然为了简单起见,就用了链表,主要是理解一致性hash的原理~~

源码下载

参考

http://blog.csdn.net/cywosp/article/details/23397179
http://zh.wikipedia.org/wiki/一致哈希
http://baike.baidu.com/view/1588037.htm?fr=aladdin