Redis 分区

分区是分割数据到多个Redis实例的处理过程,因此每个实例只保存key的一个子集。

为什么Redis 要有分区?

我们可以这样理解,假设有一个库的key达到了 1000个,我们要找一个key 为 pangugle 的 value, 我们通过get 命令可以轻松获取,那么如果库达到 10亿、百亿、千亿,我们这个get还会快吗? 显然随着数据的增多,查询会越来越慢!因此我们必须对数据进行分区!

分区的方法下面有详细介绍,这里介绍,按业务分

假设系统有用户模块、商城模块, 那么我们就可以把不再的模块放在不同的库里!

1. 用户模块 放在 db0 上
2. 商城模块 放在 db1 上

当然如果数据真的很多,达到上几十亿的,那么就要考虑用分布式,分布式方案有以下两种方案

  • twemproxy , 由 Twitter 开源的
  • codis, 中国的

分区的优势

  • 通过利用多台计算机内存的和值,允许我们构造更大的数据库。

  • 通过多核和多台计算机,允许我们扩展计算能力;通过多台计算机和网络适配器,允许我们扩展网络带宽。

分区的不足

redis的一些特性在分区方面表现的不是很好:

  • 涉及多个key的操作通常是不被支持的。举例来说,当两个set映射到不同的redis实例上时,你就不能对这两个set执行交集操作。

  • 涉及多个key的redis事务不能使用。

  • 当使用分区时,数据处理较为复杂,比如你需要处理多个rdb/aof文件,并且从多个实例和主机备份持久化文件。

  • 增加或删除容量也比较复杂。

    redis集群大多数支持在运行时增加、删除节点的透明数据平衡的能力,
    但是类似于客户端分区、代理等其他系统则不支持这项特性。
    然而,一种叫做presharding的技术对此是有帮助的。
    

当然在实际开发中,我们还是将 redis 只当成缓存来用,不要有过多的其它操作,对它的只操作变为最简单化!

比如事务我们可以移植到 zookeeper(可以为分布式锁),

或着 Rocketmq 事务消息

分区类型

  • 范围分区

    最简单的分区方式是按范围分区,就是映射一定范围的对象到特定的Redis实例。

    比如,ID从0到100000的用户会保存到实例R0,ID从100001到 200000的用户会保存到R1,以此类推。

    这种方式是可行的,并且在实际中使用,不足就是要有一个区间范围到实例的映射表。这个表要被管理,同时还需要各 种对象的映射表,通常对Redis来说并非是好的方法。

  • 哈希分区

    另外一种分区方法是hash分区。这对任何key都适用,也无需是object_name:这种形式,像下面描述的一样简单:

    1. 用一个hash函数将key转换为一个数字,比如使用crc32 hash函数。对key foobar执行crc32(foobar)会输出类似93024922的整数。
    
    2. 对这个整数取模,将其转化为0-3之间的数字,就可以将这个整数映射到4个Redis实例中的一个了。93024922 % 4 = 2,就是说key foobar应该被存到R2实例中。注意:取模操作是取除的余数,通常在多种编程语言中用%操作符实现。