Redis
的同学应该都知道,它基于键值对(key-value)
的内存数据库,所有数据存放在内存中,内存在 Redis
中扮演一个核心角色,所有的操作都是围绕它进行。我们在实际维护过程中经常会被问到如下问题,比如数据怎么存储在Redis
里面能节约成本、提升性能?Redis
内存告警是什么原因导致?
used_memory
:Redis
内存占用中最主要的部分,Redis 分配器分配的内存总量(单位是KB),主要包含自身内存(字典、元数据)、对象内存、缓存,lua 内存
。
自身内存:自身维护的一些数据字典及元数据,一般占用内存很低。
对象内存:所有对象都是 Key-Value
型,Key 对象都是字符串,Value 对象则包括 5
种类(String,List,Hash,Set,Zset
),5.0 还支持 stream
类型。
缓存
:客户端缓冲区(普通 + 主从复制 + pubsub
)以及 aof 缓冲区
。
Lua 内存
:主要是存储加载的 Lua 脚本,内存使用量和加载的 Lua 脚本数量有关。
used_memory_rss
:Redis 主进程
占据操作系统的内存(单位是 KB),是从操作系统角度得到的值,如 top、ps 等命令。
内存碎片
:如果对数据的更改频繁,可能导致redis
释放的空间在物理内存中并没有释放,但 redis
又无法有效利用,这就形成了内存碎片。
运行内存
:运行时消耗的内存,一般占用内存较低,在 10M 内。
子进程内存
:主要是在持久化
的时候,aof rewrite
或者rdb
产生的子进程消耗的内存,一般也是比较小。
key长度
:如在设计键时,在完整描述业务情况下,键值越短越好。value长度
:值对象缩减比较复杂,常见需求是把业务对象序列化成二进制数组放入Redis。首先应该在业务上精简业务对象,去掉不必要的属性避免存储无效数据。其次在序列化工具选择上,应该选择更高效的序列化工具来降低字节数组大小。对象共享池指Redis
内部维护[0-9999]
的整数对象池。创建大量的整数类型redisObject
存在内存开销,每个redisObject
内部结构至少占16字节
,甚至超过了整数自身空间消耗。所以Redis
内存维护一个[0-9999
]的整数对象池
,用于节约内存。 除了整数值对象,其他类型如list,hash,set,zset
内部元素也可以使用整数对象池。因此开发中在满足需求的前提下,尽量使用整数对象以节省内存。
可以通过object refcount
命令查看对象引用数验证是否启用整数对象池技术。
redis> set foo 100
OK
redis> object refcount foo
(integer) 1
redis> set bar 100
OK
redis> object refcount bar
(integer) 2
字符串类型的 3
种编码:
int
编码除了自身 object
无需分配内存,object
的指针不需要指向其他内存空间,无论是从性能还是内存使用都是最优的。embstr
是会分配一块连续的内存空间
,但是假设这个value
有任何变化,那么value
对象会变成raw
编码,而且是不可逆的。Redis自身实现的字符串结构有如下特点:
注意点:
因为字符串(SDS)存在预分配机制,日常开发中要小心预分配带来的内存浪费;
key 尽量控制在 44 个字节数内,走 embstr 编码,embstr 比 raw 编码减少一次内存分配,同时因为是连续内存存储,性能会更好;
多个 string 类型可以合并成小段 hash 类型去维护,小的 hash 类型走 ziplist 是有很好的压缩效果,节约内存。
存储list
时每个元素会作为一个 entry
;存储 hash
时 key
和 value
会作为相邻的两个 entry
;存储 zset 时 member 和 score 会作为相邻的两个entry,当不满足上述条件时,ziplist 会升级为 linkedlist,hashtable 或 skiplist 编码。
③在任何情况下大内存的编码都不会降级为 ziplist。
④linkedlist 、hashtable 便于进行增删改操作但是内存占用较大。
⑤ziplist 内存占用较少,但是因为每次修改都可能触发 realloc 和 memcopy,可能导致连锁更新(数据可能需要挪动)。因此修改操作的效率较低,在 ziplist 的条目很多时这个问题更加突出。