深圳市顺风车网络科技有限公司官方

Redis八股文精讲:字符串

发布日期:2022-08-07 07:19    点击次数:187

写在前面

小牛之前出了八股文背诵版系列,不少朋友问我,能不能搞个八股文精讲,把面试问题讲讲透,于是系列就这样诞生了。咱们第一期先聊聊Redis。

字符串

Redis底层是C语言实现的。于是不少朋友想当然的以为,Redis的字符串和C语言字符串实现方式一致。

但事实上,Redis自己定义了一套字符串的实现,名曰SDS(simple dynamic string)。

不少同学在面试时,面试官轻描淡学来一句,来讲一讲Redis的SDS吧。大家一脸懵逼,半天答不上来。最后搞半天,其实面试官就是问的Redis字符串呀。

首先回答一个问题:为什么Redis不采用C语言的字符串直接做具体实现?

这当然是因为这种数据结构有固有缺陷啦。主要有如下几个

缺点1:O(n)复杂度获取长度

我们知道,C语言如何判断一个字符串已经结束,当然是通过标志位'\0'。

C语言Str

所以,对于我们想获得字符串长度,我们需要从头开始遍历,直至遍历到\0,时间复杂度变成了O(n)。

缺点2:没有较好的扩容机制

对于C语言,想要搞个字符串数组,肯定需要预先确定好字符串长度。如果这个字符串经常需要修改,修改前后长度一致还好说,如果不一致,那程序层面就需要重新申请一段新内存,并把字符一个个拷贝到新的地方。

缺点3:特殊字符无法处理

引用《Redis源码剖析与实战》的例子 如果我们想存储字符串"redis\0"

char *a = "redis\0"; 

到原始C语言,它编译器看到\0,以为还是字符结束的标志呢,如果把它打印下来,它只打出redis。所以特别是对于二进制数据,公司动态这种奇奇怪怪的case特别多,因此C语言的字符数组就处理不了这块存储二进制字符的需求了。

为了解决C语言字符数组的不足,redis提出了新的方法。我们先来看看3.0及之前版本的实现。

struct sdshdr {     unsigned int len;     unsigned int free;     char buf[]; } 

来解释一下这些字段吧。

len:数组字符串已使用长度

free: 数组未使用的字符串长度

buf:存储字符串

在之后的版本,Redis对SDS进行了改进,但大体思想不变

struct sdshdr {     unsigned int len;     unsigned int alloc;     unsigned char flags;     char buf[]; } 

来解释一下这些字段吧。

len:数组字符串已使用长度

alloc: 数组分配的长度

flags: 表示SDS类型

buf:存储字符串

对于SDS类型,我也稍微多啰嗦两句。在新版本redis中,有4种SDS类型(sdshrd5 never used)。其中 sdshrd8 sdshrd16 sdshrd32 sdshrd64 的区别仅仅就在len和alloc上有所区别。

对于sdshrd8 该定义为

struct sdshdr8 {     uint8_t len;     uint8_t alloc;     unsigned char flags;     char buf[]; } 

以此类推,sdshrd16就是

struct sdshdr16 {     uint16_t len;     uint16_t alloc;     unsigned char flags;     char buf[]; } 

那为啥新版Redis搞这么多结构体?一个结构体不是一法通万法就够了嘛。

当然,事实确实如此,按实现角度看。如果只采用sdshrd64,肯定也够了。

但按抠门角度看呢?如果我们机子很菜,内存很小,想抠抠索索能省一点,是一点,这样做就有好处辣。

好处在哪里?当然是uint8_t、uint16_t、uint32_t、uint64_t占的空间不一样,对于小字符串,用小头sdshdr8,这样len 和alloc占用字段也能省一点,就是这么回事。

所以可以看到,SDS本质上是C语言的字符数组,加上了一点别的标识属性的结构体而已。小伙伴们下次碰见面试官问SDS,就不用慌啦!

最后多啰嗦两句SDS扩容:

对于字符串增加了,如果原始的剩余空间足够,直接返回 如果空间不足够,重新申请两倍最小需要长度的空间,再进行挨个赋值。

最后总结一下:Redis提出动态字符串这一数据结构,改进了C语言字符数组的不足。该动态字符串有如下好处:

字符串长度获取时间复杂度从O(n)->O(1) 减少字符串扩容引起的数据搬运次数。 可以存储更加复杂的二进制数据

参考

《Redis源码剖析与实战》

https://blog.csdn.net/weixin_39744512/article/details/111170924

https://blog.csdn.net/wolf2s/article/details/107945242 

《Redis的设计与实现》