Redis集群Redis集群介绍Redis集群是一个提供在多个Redis间节点间共享数据的程序集.Redis集群并不支持处理多个keys的命令,因为这需要在不同的节点间移动数据,从而达不到像Redis那样的性能,在高负载的情况下可能会导致不可预料的错误.Redis集群通过分区来提供一定程度的可用性,在实际环境中当某个节点宕机或者不可达的情况下继续处理命令.Redis集群的优势:自动分割数据到不同的节点上.整个集群的部分节点失败或者不可达的情况下能够继续处理命令.Redis集群的数据分片Redis集群没有使用一致性hash,而是引入了哈希槽的概念.Redis集群有16384个哈希槽,每个key通过CRC16校验后对16384取模来决定放置哪个槽.集群的每个节点负责一部分hash槽,举个例子,比如当前集群有3个节点,那么:节点A包含0到5500号哈希槽.节点B包含5501到11000号哈希槽.节点C包含11001到16384号哈希槽.这种结构很容易添加或者删除节点.比如如果我想新添加个节点D,我需要从节点A,B,C中得部分槽到D上.如果我像移除节点A,需要将A中得槽移到B和C节点上,然后将没有任何槽的A节点从集群中移除即可.由于从一个节点将哈希槽移动到另一个节点并不会停止服务,所以无论添加删除或者改变某个节点的哈希槽的数量都不会造成集群不可用的状态.Redis集群的主从复制模型为了使在部分节点失败或者大部分节点无法通信的情况下集群仍然可用,所以集群使用了主从复制模型,每个节点都会有N-1个复制品.在我们例子中具有A,B,C三个节点的集群,在没有复制模型的情况下,如果节点B失败了,那么整个集群就会以为缺少5501-11000这个范围的槽而不可用.然而如果在集群创建的时候(或者过一段时间)我们为每个节点添加一个从节点A1,B1,C1,那么整个集群便有三个master节点和三个slave节点组成,这样在节点B失败后,集群便会选举B1为新的主节点继续服务,整个集群便不会因为槽找不到而不可用了不过当B和B1都失败后,集群人爱是不可用的.Redis一致性保证Redis并不能保证数据的强一致性.这意味这在实际中集群在特定的条件下可能会丢失写操作.第一个原因是因为集群是用了异步复制.写操作过程:客户端向主节点B写入一条命令.主节点B向客户端回复命令状态.主节点将写操作复制给他得从节点B1,B2和B3.主节点对命令的复制工作发生在返回命令回复之后,因为如果每次处理命令请求都需要等待复制操作完成的话,那么主节点处理命令请求的速度将极大地降低——我们必须在性能和一致性之间做出权衡。注意:Redis集群可能会在将来提供同步写的方法。Redis集群另外一种可能会丢失命令的情况是集群出现了网络分区,并且一个客户端与至少包括一个主节点在内的少数实例被孤立。.举个例子假设集群包含A、B、C、A1、B1、C1六个节点,其中A、B、C为主节点,A1、B1、C1为A,B,C的从节点,还有一个客户端Z1假设集群中发生网络分区,那么集群可能会分为两方,大部分的一方包含节点A、C、A1、B1和C1,小部分的一方则包含节点B和客户端Z1.Z1仍然能够向主节点B中写入,如果网络分区发生时间较短,那么集群将会继续正常运作,如果分区的时间足够让大部分的一方将B1选举为新的master,那么Z1写入B中得数据便丢失了.注意,在网络分裂出现期间,客户端Z1可以向主节点B发送写命令的最大时间是有限制的,这一时间限制称为节点超时时间(nodetimeout),是Redis集群的一个重要的配置选项:搭建并使用Redis集群搭建集群的第一件事情我们需要一些运行在集群模式的Redis实例.这意味这集群并不是由一些普通的Redis实例组成的,集群模式需要通过配置启用,开启集群模式后的Redis实例便可以使用集群特有的命令和特性了.下面是一个最少选项的集群的配置文件:port7000cluster-enabledyescluster-config-filenodes.confcluster-node-timeout5000appendonlyyes文件中的cluster-enabled选项用于开实例的集群模式,而cluster-conf-file选项则设定了保存节点配置文件的路径,默认值为nodes.conf.节点配置文件无须人为修改,它由Redis集群在启动时创建,并在有需要时自动进行更新。要让集群正常运作至少需要三个主节点,不过在刚开始试用集群功能时,强烈建议使用六个节点:其中三个为主节点,而其余三个则是各个主节点的从节点。首先,让我们进入一个新目录,并创建六个以端口号为名字的子目录,稍后我们在将每个目录中运行一个Redis实例:命令如下:mkdircluster-testcdcluster-testmkdir700070017002700370047005在文件夹7000至7005中,各创建一个redis.conf文件,文件的内容可以使用上面的示例配置文件,但记得将配置中的端口号从7000改为与文件夹名字相同的号码。从RedisGithub页面的unstable分支中取出最新的Redis源码,编译出可执行文件redis-server,并将文件复制到cluster-test文件夹,然后使用类似以下命令,在每个标签页中打开一个实例:cd7000../redis-server./redis.conf实例打印的日志显示,因为nodes.conf文件不存在,所以每个节点都为它自身指定了一个新的ID:[82462]26Nov11:56:55.329*Noclusterconfigurationfound,I'm97a3a64667477371c4479320d683e4c8db5858b1实例会一直使用同一个ID,从而在集群中保持一个独一无二(unique)的名字。搭建集群现在我们已经有了六个正在运行中的Redis实例,接下来我们需要使用这些实例来创建集群,并为每个节点编写配置文件。通过使用Redis集群命令行工具redis-trib,编写节点配置文件的工作可以非常容易地完成:redis-trib位于Redis源码的src文件夹中,它是一个Ruby程序,这个程序通过向实例发送特殊命令来完成创建新集群,检查集群,或者对集群进行重新分片(reshared)等工作。./redis-trib.rbcreate--replicas1127.0.0.1:7000127.0.0.1:7001\127.0.0.1:7002127.0.0.1:7003127.0.0.1:7004127.0.0.1:7005这个命令在这里用于创建一个新的集群,选项--replicas1表示我们希望为集群中的每个主节点创建一个从节点。之后跟着的其他参数则是这个集群实例的地址列表,3个master3个slaveredis-trib会打印出一份预想中的配置给你看,如果你觉得没问题的话,就可以输入yes,redis-trib就会将这份配置应用到集群当中,让各个节点开始互相通讯,最后可以得到如下信息:[OK]All16384slotscovered这表示集群中的16384个槽都有至少一个主节点在处理,集群运作正常。使用集群Redis集群现阶段的一个问题是客户端实现很少。以下是一些我知道的实现:redis-rb-cluster是我(@antirez)编写的Ruby实现,用于作为其他实现的参考。该实现是对redis-rb的一个简单包装,高效地实现了与集群进行通讯所需的最少语义(semantic).redis-py-clusterredis-py-cluster看上去是redis-rb-cluster的一个Python版本,这个项目有一段时间没有更新了(最后一次提交是在六个月之前),不过可以将这个项目用作学习集群的起点。流行的Predis曾经对早期的Redis集群有过一定的支持,但我不确定它对集群的支持是否完整,也不清楚它是否和最新版本的Redis集群兼容(因为新版的Redis集群将槽的数量从4k改为16k了).使用最多的时java客户端,Jedis最近添加了对集群的支持,详细请查看项目README中JedisCluster部分.Redisunstable分支中的redis-cli程序实现了非常基本的集群支持,可以使用命令redis-cli-c来启动。测试Redis集群比较简单的办法就是使用redis-rb-cluster或者redis-cli,接下来我们将使用redis-cli为例来进行演示:$redis-cli-c-p7000redis127.0.0.1:7000setfoobar-Redirectedtoslot[12182]locatedat127.0.0.1:7002OKredis127.0.0.1:7002sethelloworld-Redirectedtoslot[866]locatedat127.0.0.1:7000OKredis127.0.0.1:7000getfoo-Redirectedtoslot[12182]locatedat127.0.0.1:7002barredis127.0.0.1:7000gethello-Redirectedtoslot[866]locatedat127.0.0.1:7000worldredis-cli对集群的支持是非常基本的,所以它总是依靠Redis集群节点来将它转向(redirect)至正确的节点。一个真正的(serious)集群客户端应该做得比这更好:它应该用缓存记录起哈希槽与节点地址之间的映射(map),从而直接将命令发送到正确的节点上面。这种映射只会在集群的配置出现某些修改时变化,比如说,在一次故障转移(failover)之后,或者系统管理员通过添加节点或移除节点来修改了集群的布局(layout)之后,诸如此类。使用redis-rb-cluster写一个例子在展示如何使用集群进行故障转移、重新分片等操作之前,我们需要创建一个示例应用,了解一些与Redis集群客户端进行交互的基本方法。在运行示例应用的过程中,我们会尝试让节点进入失效状态,又或者开始一次重新分片,以此来观察Redis集群在真实世界运行时的表现,并且为了让这个示例尽可能地有用,我们会让这个应用向集群进行写操作。本节将通过两个示例应用来展示redis-rb-cluster的基本用法,以下是本节的第一个示例应用,它是一个名为example.rb的文件,包含在redis-rb-cluster项目里面1require'./cluster'23startup_nodes=[4{:host=127.0.0.1,:port=7000},5{:host=127.0.0.1,:port=7001}6]7rc=RedisCluster.new(startup_nodes,32,:timeout=0.1)89last=false1011whilenotlast12begin13last=rc.get(__last__)14last=0if!last15rescue=e16putserror#{e.to_s}17sleep118end19end2021((last.to_i+1)..1000000000).each{|x|22begin23rc.set(foo#{x},x)24putsrc.get(foo#{x})25rc.set(__last__,x)26rescue=e27putserror#{e.to_s}28end29sleep0.130}这个应用所做的工作非常简单:它不断地以foonumber为键,number为值,使用SET命令向数据库设置键值对:SETfoo00SETfoo11SETfoo22Andsoforth...代码中的每个集群操作都使用一个begin和rescue代码块(block)包裹着,因为我们希望在代码出错时,将错误打印到终端上面,而不希望应用因为