Young's blog Young's blog
首页
Spring
  • 前端文章1

    • JavaScript
  • 学习笔记

    • 《JavaScript教程》
    • 《JavaScript高级程序设计》
    • 《ES6 教程》
    • 《Vue》
    • 《React》
    • 《TypeScript 从零实现 axios》
    • 《Git》
    • TypeScript
    • JS设计模式总结
  • HTML
  • CSS
  • 技术文档
  • GitHub技巧
  • Nodejs
  • 博客搭建
  • 学习
  • 面试
  • 心情杂货
  • 实用技巧
  • 友情链接
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)

Young

首页
Spring
  • 前端文章1

    • JavaScript
  • 学习笔记

    • 《JavaScript教程》
    • 《JavaScript高级程序设计》
    • 《ES6 教程》
    • 《Vue》
    • 《React》
    • 《TypeScript 从零实现 axios》
    • 《Git》
    • TypeScript
    • JS设计模式总结
  • HTML
  • CSS
  • 技术文档
  • GitHub技巧
  • Nodejs
  • 博客搭建
  • 学习
  • 面试
  • 心情杂货
  • 实用技巧
  • 友情链接
关于
收藏
  • 分类
  • 标签
  • 归档
GitHub (opens new window)
  • MySQL高级原理及优化第一篇:MySQL执行过程及执行顺序
  • MySQL高级原理及优化第二篇: Mysql存储引擎InnoDB介绍
  • MySQL高级原理及优化第三篇: MySQL索引原理
  • MySQL高级原理及优化第四篇: MySQL事务和锁
  • MySQL高级原理及优化第五篇:MySQL集群架构
  • mysql order by 原理及优化详解
  • 聊聊数据库优化的4大手段
  • 高频面试:如何解决MySQL主从复制延时问题
  • 1万字+30张图 对mysql索引概念以及原理全方位讲解
  • 详解 Mysql LEFT JOIN和JOIN查询区别及原理
  • MySQL IN、Exist关联查询时,我们为什么建议小表驱动大表?
  • MySQL的Left、Right join(外连接)中的on条件与where条件区别
  • 面试官:MySQL连环炮,你扛得住嘛?
  • InnoDB为什么不用跳表,Redis为什么不用B+树?
  • 小林图解msql
  • mysql
andanyang
2023-06-19

InnoDB为什么不用跳表,Redis为什么不用B+树?

作为开发人员,我们每天都要开发大量的接口,其中包括了读接口和写接口,而对于写接口来说,除了要保证他的性能、可用性以外,还需要有一个重要的问题,那就是考虑如何保证接口的幂等性

Innodb 是 MySQL 的执行引擎,MySQL 是一种关系型数据库,而 Redis 是一种非关系型数据库。这两者之间比较大的区别是:关系型数据库以表的形式进行存储数据,而非关系型数据库以 Key-value 的形式存储数据。

在 InnoDB 中,索引是采用 B + 树实现的,在 Redis 中,ZSET 是采用跳表(不只是跳表)实现的,无论是 B + 树,还是跳表,都是性能很好的数据结构,那么,为什么 InnoDB 为什么不用跳表,Redis 为什么不用 B + 树?

我们都知道,MySQL 是基于磁盘存储的,Redis 是基于内存存储的。

而之所以 Innodb 用 B + 树,主要是因为 B + 树是一种磁盘 IO 友好型的数据结构,而 Redis 使用跳表,是因为跳表则是一种内存友好型的数据结构。

# B + 树次磁盘友好?

首先,B + 树的叶子节点形成有序链表,可以方便地进行范围查询操作。对于磁盘存储来说,顺序读取的效率要高于随机读取,因为它可以充分利用磁盘预读和缓存机制,减少磁盘 I/O 的次数。

其次,由于 B + 树的节点大小是固定的,因此可以很好地利用磁盘预读特性,一次性读取多个节点到内存中,这样可以减少 IO 操作次数,提高查询效率。

还有就是,B + 树的叶子节点都存储数据,而非数据和指针混合,所以叶子节点的大小是固定的,而且节点的大小一般都会设置为一页的大小,这就使得节点分裂和合并时,IO 操作很少,只需读取和写入一页。

所以,B + 树在设计上考虑了磁盘存储的特点和性能优化,我曾经分析过,当 Innodb 中存储 2000 万数据的时候,只需要 3 次磁盘就够了。

而跳表就不一样了,跳表的索引节点通过跳跃指针连接,形成多级索引结构。这导致了跳表的索引节点在磁盘上存储时会出现数据分散的情况,即索引节点之间的物理距离可能较远。对于磁盘存储来说,随机访问分散的数据会增加磁头的寻道时间,导致磁盘 I/O 的性能下降。

# 为啥 Redis 用跳表?

既然 B + 树这么多优点,为啥 Redis 要用跳表实现 ZSET 呢(不只是跳表,详见下面链接)?而不是 B + 树呢?

主要是因为 Redis 是一种基于内存的数据结构。他其实不需要考虑磁盘 IO 的性能问题,所以,他完全可以选择一个简单的数据结构,并且性能也能接受的 ,那么跳表就很合适。

因为跳表相对于 B + 树来说,更简单。相比之下,B + 树作为一种复杂的索引结构,需要考虑节点分裂和合并等复杂操作,增加了实现和维护的复杂度。

而且,Redis 的有序集合经常需要进行插入、删除和更新操作。跳表在动态性能方面具有良好的表现,特别是在插入和删除操作上。相比之下,B + 树的插入和删除需要考虑平衡性,所以还是成本挺高的。

# 总结

以上,就是关于《InnoDB 为什么不用跳表,Redis 为什么不用 B + 树?》这个问题的我的一些理解,其实这个问题想要回答好还挺难的。

首先要知道为啥 Innodb 使用红黑树,其次还要了解 Redis 中的 Zset 数据结构,还需要知道跳表的原理。

和这个问题类似的问题还有:

《Innodb 为什么不用红黑树?》

《Innodb 为什么不用 B 树?》

《Redis 的 ZSet 中 zipList 和 skipList 是什么?》

《为什么 Redis 7.0 中使用 ListPack 实现 ZSet?》

编辑 (opens new window)
上次更新: 2024/04/19, 08:52:45
面试官:MySQL连环炮,你扛得住嘛?
小林图解msql

← 面试官:MySQL连环炮,你扛得住嘛? 小林图解msql→

最近更新
01
idea 热部署插件 JRebel 安装及破解,不生效问题解决
04-10
02
spark中代码的执行位置(Driver or Executer)
12-12
03
大数据技术之 SparkStreaming
12-12
更多文章>
Theme by Vdoing | Copyright © 2019-2024 Young | MIT License
浙ICP备20002744号
  • 跟随系统
  • 浅色模式
  • 深色模式
  • 阅读模式