2021-04-29 00:05 已编辑

关注

阿里面试题：了解redis的String数据结构底层实现嘛?

2021开工第一天，就有小伙伴私信我，还给我分享了一道他面阿里的redis题（这家伙绝比已经拿到年终奖了），我看了以后觉得挺有意思，题目很简单，是那种典型的似懂非懂，常常容易被大家忽略的问题。这里整理出来分享一下，顺便自己巩固一下基础，希望对正在面试和想要面试的兄弟有点帮助。

题目大致是这样的

面试官：了解redis的String数据结构底层实现嘛?

铁子：当然知道，是基于SDS实现的

面试官：redis是用C语言开发的，那为啥不直接用C的字符串，还单独设计SDS这样的结构呢?

铁子：·····

“
其实看得出面试官是想看看，铁子是只停留在redis的使用层面，还是对底层数据结构有过更深入的研究，面试嘛都爱这样问大家都懂得。

我们知道redis是用C写的，但它却没有完全直接使用C的字符串，而是自己又重新构建了一个叫简单动态字符串SDS（simple dynamic string）的抽象类型。

redis也支持使用C语言的传统字符串，只不过会用在一些不需要对字符串修改的地方，比如静态的字符输出。

而我们开发中使用redis，往往会经常性的修改字符串的值，这个时候就会用SDS来表示字符串的值了。有一点值得注意：在redis数据库中，key-value键值对含有字符串值的，都是由SDS来实现的。

比如：在redis执行一个最简单的set命令，这时redis会新建一个键值对。

127.0.0.1:6379> set xiaofu "程序员内点事"
复制代码

此时键值对的key和value都是一个字符串对象，而对象的底层实现分别是两个保存着字符串xiaofu和程序员内点事的SDS结构。

再比如：我向一个列表中压入数据，redis 又会新建一个键值对。

127.0.0.1:6379> lpush xiaofu "程序员内点事" "程序员小富"
复制代码

这时候键值对的键和上边一样，还是一个由SDS实现的字符串对象，键值对的值是一个包含两个字符串对象的列表对象了，而这两个对象的底层也是由SDS实现。

SDS结构

一个SDS值的数据结构，主要由len、free、buf[]这三个属性组成。

struct sdshdr{

  int free; // buf[]数组未使用字节的数量

  int len; // buf[]数组所保存的字符串的长度

  char buf[]; // 保存字符串的数组
}
复制代码

其中buf[]为实际保存字符串的char类型数组；free表示buf[]数组未使用字节的数量；len表示buf[]数组所保存的字符串的长度。

例如上图表示的是buf[]保存长度为6个字节的字符串，未使用的字节数free为0，但是眼尖的同学会发现这明明是7个字符，还有一个"\0"啊？

上边提到过SDS没有完全直接使用C的字符串，还是沿用了一些C特性的，比如遵循C的字符串以空格符结尾的规则，这样还可以使用一部分C字符串的函数。而对于SDS来说，空字符串占用的一字节是不计算在len属性里的，会为他分配额外的空间。

简单了解SDS结构后，下边我们来看看SDS相比于C字符串有哪些优点。

效率高

举个例子：工作中使用redis，经常会通过STRLEN命令得到一个字符串的长度，在SDS结构中len属性记录了字符串的长度，所以我们获取一个字符串长度直接取len的值，复杂度是O(1)。

而如果用C字符串，在获取一个字符串长度时，需对整个字符串进行遍历，直至遍历到空格符结束（C中遇到空格符代表一个完整字符串），此时的复杂度是O(N)。

在高并发场景下频繁遍历字符串，获取字符串的长度很有可能成为redis的性能瓶颈，所以SDS性能更好一些。

数据溢出

上边提到C字符串是不记录自身长度的，相邻的两个字符串存储的方式可能如下图，为字符串分配了合适的内存空间。

如果此时我想把“程序员内点事”改成“程序员内点事123”，可之前分配的内存只有6个字节，修改后的字符串需要9个字节才能放下啊，怎么搞？

没办法只能侵占相邻字符串的空间，自身数据溢出导致其他字符串的内容被修改。

而SDS很好的规避了这点，当我们需要修改数据时，首先会检查当前SDS空间len是否满足，不满足则自动扩容空间至修改所需的大小，然后再执行修改,如下图所示。

不过有个特殊的地方，在把“程序员内点事”的6个字节扩容到“程序员内点事123”9个字节后，发现free属性的值变成了扩容后字符串的总长度，这就涉及到下边要说的内存重分配策略了。

内存重分配策略

C字符串长度是一定的，所以每次在增长或者缩短字符串时，都要做内存的重分配，而内存重分配算法通常又是一个比较耗时的操作，如果程序不经常修改字符串还是可以接受的。

但很不幸，redis作为一个数据库，数据肯定会被频繁修改，如果每次修改都要执行一次内存重分配，那么就会严重影响性能。

SDS通过两种内存重分配策略，很好的解决了字符串在增长和缩短时的内存分配问题。

1.空间预分配

空间预分配策略用于优化SDS字符串增长操作，当修改字符串并需对SDS的空间进行扩展时，不仅会为SDS分配修改所必要的空间，还会为SDS分配额外的未使用空间free，下次再修改就先检查未使用空间free是否满足，满足则不用在扩展空间。

通过空间预分配策略，redis可以有效的减少字符串连续增长操作，所产生的内存重分配次数。

额外分配未使用空间free的规则：

如果对 SDS 字符串修改后，len 值小于 1M，那么此时额外分配未使用空间 free 的大小与len相等。
如果对 SDS 字符串修改后，len 值大于等于 1M，那么此时额外分配未使用空间 free 的大小为1M。

2.惰性空间释放

惰性空间释放策略则用于优化SDS字符串缩短操作，当缩短SDS字符串后，并不会立即执行内存重分配来回收多余的空间，而是用free属性将这些空间记录下来，如果后续有增长操作，则可直接使用。

数据格式多样性

C字符串中的字符必须符合某些特定的编码格式，而且上边我们也提到，C字符串以\0空字符结尾标识一个字符串结束，所以字符串里边是不能包含\0的，不然就会被误认是多个。

由于这种限制，使得C字符串只能保存文本数据，像音视频、图片等二进制格式的数据是无法存储的。

redis 会以处理二进制的方式操作Buf数组中的数据，所以对存入其中的数据做任何的限制、过滤，只要存进来什么样，取出来还是什么样。

总结

上边只是 redis 数据结构的一点基础知识，没什么难度，但以我的面试经验，如果被问这类问题,不要只含糊其辞的说出底层是SDS，有理有据的把为什么这样实现也说出来。

一来可以显得自己基本功扎实，如果表达的在条理清晰，是个很不错的加分项；在一个主动打消面试官问下去的念头，当然就怕不按套路出牌的人！

全部评论

推荐最新楼层

02-10 21:00

已编辑

蚌埠坦克学院嵌入式软件开发

我真的不理解为什么有人喜欢卷

从实习到现在，我一直最困惑的一件事就是：为什么有人喜欢“卷”。在很多场景里，总有人为了加班多、拿更多证书、刷更多竞赛而拼命，而我明明觉得按自己的节奏努力就已经够了。看到别人不断超额完成任务、比别人快一步、多学一点，我有时会感到压力，但又不理解这种自我加速的动力。我想，可能每个人对成就感和安全感的需求不同，有的人把“卷”当作证明自己的方式，也有人把它当作攀比和竞争。但对我来说，更重要的是找到自己的节奏和成长方式，不让无意义的竞争消耗掉真正的热情。卷不卷或许不是问题，理解自己为什么而努力，才是我从实习到现在最困惑却也最想弄明白的事情。

胖沐沐：因为内驱力吧内心真正的想去实现想去学更多的东西就像有人热爱游戏热爱短视频一样这个也是一样的把学技术作为日常没什么稀奇的我认为把克服困难作为多巴胺源泉只是卷这个形容词把这些给概括了还有一种人就是没有安全感的人比如马斯克技术狂因为小时候被欺负只有学技术才能让自己有安全感

实习到现在，你最困惑的一...

点赞评论收藏

02-12 10:59

北京体育大学测试工程师

langgraph基础概念

#聊聊Agent开发#1. 状态（State）代表应用程序当前快照的共享数据结构可以使用 TypedDict 或 Pydantic 模型定义包含作为所有节点和边输入模式的模式（schema）通过减速器函数（reducer functions）进行更新，指定如何应用更改1. TypedDict 和 Pydantic 是什么？它们都是定义状态结构的方式：、简单说：都是用来定义你的数据结构，就像数据库的字段定义。 #pydantic方式 from pydantic import BaseModel class State(BaseModel): messages: list llm_calls: i...

点赞评论收藏

2025-12-31 22:44

已编辑

门头沟学院 Java

27求实习

兄弟们是我的简历太不行了吗还是项目太简单投了很多没面试

点赞评论收藏

01-28 16:12

中南大学 Java

用了chatgpt后刷力扣上瘾

几年前还没有chatgpt的时候，刷题真的是很痛苦。刷不出来只能看题解，题解有几个问题：第一个是每次看的写题解的人都不一样，很难有一个统一的思路；第二个也是最重要的是，题解只提供了作者自己的思路，但是没有办法告诉你你的思路哪里错了。其实很少有错误的思路，我只是需要被引导到正确的思路上面去。所以传统题解学习起来非常困难，每次做不出来难受，找题解更难受。但是现在chatgpt能做很多！它可以这样帮助你 -1. 可以直接按照你喜欢的语言生成各种解法的题解和分析复杂度。2. 把题和你写的代码都发给它，它可以告诉你 你的思路到底哪里有问题。有时候我发现我和题解非常接近，只是有一点点🤏想错了。只要改这一点点就是最优解。信心倍增。3. 如果遇到不懂的题解可以一行一行询问为什么要这样写，chatgpt不会嫌你烦。有时候我觉得自己的range写错了，其实那样写也没错，只是chat老师的题解有一点优化，这个它都会讲清楚。4. 它可以帮你找可以用同类型解法来做的题。然后它可以保持解法思路不变，用一个思路爽刷一个类型的题。如果题目之间思路又有变化，它会告诉你只有哪里变了，其他的地方还是老思路。5. 它也可以直接帮你总结模板，易错点。经过chat老师的指导，我最大的改变是敢刷题了。之前刷题需要先找某一个人写的算法题repo，然后跟着某一个人他的思路刷他给的几个题。如果想写别的题，套用思路失败了，没有他的题解，也不知道到底哪里错了；看别人的题解，思路又乱了。这个问题在二分查找和dp类型的题里面特别常见。但是现在有chat老师，他会针对我的代码告诉我我哪里想错了，应该怎么做；还按照我写代码的习惯帮我总结了一套属于我的刷题模板。每天写题全是正反馈！

明天不下雨了：那我建议可以用 chatgpt atlas 或者 dia 去刷，也可以用 chrome 加个 ai 插件去刷

左边刷题右边 chat 效果很好

AI时代的工作 VS 传...

点赞评论收藏

02-12 12:22

海康威视_自动化开发工程师(准入职员工)

格力电器内推，格力电器内推码

格力是我毕业的第一份工作，其实蛮多不舍，而且说实话，格力也很适合我！ ⭐️入职：入职格力电器，首先是非常难得，光面试环节就有四五轮，我从西安投递简历，通过筛选，需要到总部进行复试，就这一点已经击退了很多人。（疫情原因很多改成了线上） ⭐️面试：格力的面试不像别的公司，格力会更看重一个人的品行，道德，稳定性。因此可以看到很多专业并不是特别出众的人，会拿到offer。因为任何人进来，公司都会对他进行一年的培训，很全面，而且导师也很仔细！所以我经常也讲，格力是职场的黄埔军校！ ⭐️工作：在格力工作，是一个非常好的平台，首先你会接触但各种不同岗位的同事，向他们请教也不会有怨言，不管做什么工作，什么部门...

格力公司福利 356人发布

点赞评论收藏

全站热榜

创作者周榜

正在热议

# 距离春招还有一个月，你现在是什么开局？ #

9183次浏览 132人参与

# 今年秋招你收到了多少封邮件？ #

38264次浏览 280人参与