Redis集群部署详解，高可用性架构搭建与优化技巧分享

要搭建一个高可用的Redis集群，最简单的方式是使用Docker Compose快速启动一个包含三个主节点和三个从节点的集群，并通过配置确保数据分片和自动故障转移。

搭建基础集群环境

首先，准备一台Linux服务器，安装好Docker和Docker Compose。创建一个目录，比如叫redis-cluster，在里面创建一个docker-compose.yml文件。文件内容可以这样写：version: '3' services: redis-node1: image: redis:latest command: redis-server --cluster-enabled yes --cluster-config-file nodes.conf --cluster-node-timeout 5000 --appendonly yes ports: - "7001:6379" redis-node2: image: redis:latest command: redis-server --cluster-enabled yes --cluster-config-file nodes.conf --cluster-node-timeout 5000 --appendonly yes ports: - "7002:6379" redis-node3: image: redis:latest command: redis-server --cluster-enabled yes --cluster-config-file nodes.conf --cluster-node-timeout 5000 --appendonly yes ports: - "7003:6379" redis-node4: image: redis:latest command: redis-server --cluster-enabled yes --cluster-config-file nodes.conf --cluster-node-timeout 5000 --appendonly yes ports: - "7004:6379" redis-node5: image: redis:latest command: redis-server --cluster-enabled yes --cluster-config-file nodes.conf --cluster-node-timeout 5000 --appendonly yes ports: - "7005:6379" redis-node6: image: redis:latest command: redis-server --cluster-enabled yes --cluster-config-file nodes.conf --cluster-node-timeout 5000 --appendonly yes ports: - "7006:6379"。然后运行命令 docker-compose up -d 来启动这六个容器。

创建集群并分配槽位

等所有容器都运行起来后，需要进入其中一个容器来创建集群。执行 docker exec -it redis-cluster_redis-node1_1 bash 进入第一个容器。在容器内部，运行命令 redis-cli --cluster create 172.20.0.2:6379 172.20.0.3:6379 172.20.0.4:6379 172.20.0.5:6379 172.20.0.6:6379 172.20.0.7:6379 --cluster-replicas 1。这里的IP地址需要根据你实际Docker网络的设置来调整，可以使用 docker network inspect redis-cluster_default 查看。命令中的 --cluster-replicas 1 表示每个主节点带一个从节点。执行后，Redis会提示一个分配方案，输入yes确认。这样就完成了一个基本集群的搭建。

测试高可用性和数据分片

集群建好后，可以测试一下。用 redis-cli -c -p 7001 连接到集群（-c表示集群模式）。设置几个键值，比如 set key1 value1， set key2 value2。你会发现这些键被自动分配到了不同的主节点上。然后，可以模拟一个主节点故障。先查看集群状态，用 cluster nodes 命令，记下一个主节点的ID。然后，找到运行这个主节点的容器，用 docker stop 命令停掉它。稍等片刻（比如超过5秒的node-timeout），再用 cluster nodes 命令查看，你会发现原来那个主节点的从节点自动升级成了新的主节点，集群仍然可以正常工作，之前的数据（如果那个键在故障节点上）也可以通过从节点提升后的新主节点访问到。这就是高可用性的体现。

日常优化和维护技巧

为了让集群更稳定，有几个小技巧。第一，监控集群状态，可以定期用 cluster info 和 cluster nodes 命令查看节点健康和主从关系。第二，如果因为网络问题导致集群出现“fail”状态，可能需要进行修复，有时候手动执行 cluster failover 命令可以解决一些问题。第三，注意内存使用，因为Redis是内存数据库，要确保每个节点的内存不会用满，可以通过配置 maxmemory 来限制，并设置合适的淘汰策略，比如 allkeys-lru。第四，持久化方面，我们启动时用了 --appendonly yes，这样数据会持久化到磁盘，但也要注意磁盘空间。第五，如果业务增长需要扩容，可以添加新的节点，然后用 redis-cli --cluster add-node 命令加入集群，并重新分片一些数据过去，不过这个过程需要谨慎操作，最好在业务低峰期进行。

FAQ

问：Redis集群最少需要几个节点？
答：最少需要6个节点才能实现高可用，即3个主节点和3个从节点。这样任何一个主节点宕机，其对应的从节点可以顶替上来，保证服务不中断和数据不丢失。

问：客户端如何连接Redis集群？
答：客户端需要支持集群模式。以常见的Jedis客户端为例，在Java代码中，你需要提供一个集群节点的地址列表（比如"127.0.0.1:7001,127.0.0.1:7002"），客户端会自动发现整个集群的拓扑并正确地将请求路由到对应的节点。连接时使用集群模式的连接池配置即可。

问：集群中的数据是如何分布的？丢失了一个主节点和它的从节点数据会全部丢失吗？
答：数据被分成16384个槽位，平均分配给各个主节点。每个键根据CRC16算法计算后映射到一个槽位，从而决定存储在哪个主节点。如果某个主节点和它的所有从节点同时永久宕机，那么这个主节点负责的那部分槽位的数据将无法访问，即这部分数据会丢失。因此，从节点的部署最好分散在不同的物理机器上，以避免主机级别的故障导致主从同时宕机。

引用来源：本文实践经验基于Redis官方文档（https://redis.io/docs/management/scaling/）以及在实际项目中使用Docker部署Redis 7.x集群的总结。