B树和B+树的区别

ps：如果这篇帖子对于还在找工作和找实习的你有所帮助，可以关注我，给本贴点赞、评论、收藏并订阅专栏；同时不要吝啬您的花花

B树与B+树均属于多路平衡查找树，是数据库索引、文件系统等核心场景中常用的数据结构，其核心设计目标为优化磁盘I/O效率，减少磁盘访问次数。二者在结构设计、数据存储、查询逻辑等核心层面存在显著差异，下文将从关键维度展开详细对比，明确其各自的适用场景与核心优势。

🌳 结构可视化

B树结构

        [10, 20, 30]         ← 内部节点存储数据和键
         /    |    \
        /     |     \
    [5,8]  [15,18]  [25,28,35]
    数据     数据      数据     ← 所有节点都存储实际数据

B+树结构

        [10, 20, 30]         ← 内部节点只存储键（索引）
         /    |    \
        /     |     \
    [10]    [20]    [30]     ← 内部节点继续
     |       |       |
[5,8,10]→[15,18,20]→[25,28,30]→[35,40]  ← 叶子节点存储数据并链表连接
 数据     数据      数据      数据

一、核心结构区别

1. B树结构

B树是一种平衡多路查找树，对于阶为m（即单个节点最多可存储的关键字数量）的B树，除叶子节点与根节点外，其余每个节点的子节点个数需满足「⌈m/2⌉ ≤ 子节点数 ≤ m」的约束条件。

每个节点同步存储关键字及对应的数据记录（或数据指针），所有关键字按升序规则排列，确保查询的有序性。
叶子节点与非叶子节点（分支节点）结构保持一致，均包含关键字与对应数据，且各叶子节点之间无直接关联关系，独立存在。
当树的高度不小于2时，根节点至少包含2个子节点；所有叶子节点处于同一层级，以此保障树的平衡性，确保查询效率的稳定性。

2. B+树结构

B+树是B树的优化迭代版本，同样遵循多路平衡查找树的核心规则，阶数定义与B树保持一致，其结构设计更侧重于提升查询效率与数据有序性，适配大数据量场景的访问需求。

分支节点仅存储关键字及对应的子节点指针，不存储具体数据记录，所有数据均集中存储于叶子节点，实现索引与数据的分离。
所有叶子节点按关键字升序排列，且通过指针形成有序链表结构，可快速定位范围查询的边界，大幅提升范围查询效率。
叶子节点包含树中全部关键字，分支节点中的关键字均为叶子节点关键字的索引映射，即每个分支节点的关键字对应其下一级子节点中的最大（或最小）关键字，用于引导查询方向。

二、核心功能与特性区别

数据存储位置	分支节点与叶子节点均存储数据及关键字	仅叶子节点存储数据，分支节点仅存储索引关键字及指针
查询效率	查询效率具有不确定性：若目标数据存在于分支节点，可直接返回结果，无需访问叶子节点；若目标数据仅存在于叶子节点，则需遍历至树的最底层，平均磁盘I/O次数相对较多。	查询效率稳定：无论目标数据所处位置，均需遍历至叶子节点，平均磁盘I/O次数固定（等于树的高度），适配高频查询场景，稳定性更优。
范围查询	效率较低：需逐一遍历多个分支节点与叶子节点，因叶子节点无有序链表关联，无法快速定位范围查询的边界，查询耗时较长。	效率较高：叶子节点有序且通过指针形成链表，定位到范围查询的起始节点后，可通过链表快速遍历所有符合条件的节点，大幅降低查询耗时。
关键字冗余	无冗余：每个关键字在树中仅出现一次，无重复存储，节省存储空间。	有冗余：分支节点的关键字均在叶子节点中重复出现，通过冗余设计提升索引定位效率，保障查询性能。
插入/删除操作	操作复杂度较高：插入、删除操作可能导致分支节点的数据发生变动，需频繁执行节点分裂、合并操作以维护树的平衡性，运维成本较高。	操作复杂度较低：插入、删除操作主要在叶子节点执行，分支节点仅需调整索引映射关系，节点分裂、合并的频率显著降低，维护成本更优。
磁盘I/O效率	效率较低：分支节点需存储数据，导致单个节点可承载的关键字数量减少，树的高度相对较高，磁盘访问次数较多，I/O效率受限。	效率较高：分支节点仅存储索引信息，单个节点可承载更多关键字，树的高度显著降低（通常比B树矮1-2层），大幅减少磁盘I/O次数，提升数据访问效率。

三、适用场景区别

1. B树适用场景

B树适用于以随机查询为主、范围查询需求较少的场景，且对数据访问的实时性要求较低，典型应用场景包括：

小型数据库索引场景：数据量较小，磁盘I/O压力较低，无需复杂的范围查询支持；
早期文件系统目录索引：如EXT3文件系统，适配小规模文件存储的目录查询需求；
低频次数据修改场景：需快速定位单个数据，且数据插入、删除操作频次较低，无需频繁维护树结构。

2. B+树适用场景

B+树适用于范围查询频繁、随机查询需求较多的场景，尤其适配大数据量存储场景，是目前主流数据库索引的首选数据结构，典型应用场景包括：

关系型数据库索引：MySQL、Oracle等主流关系型数据库的聚簇索引、非聚簇索引均基于B+树实现，适配高频查询与范围查询需求；
大数据量文件系统索引：如EXT4、XFS等现代文件系统，可高效支撑大规模文件的索引与查询；
高频范围查询场景：需频繁执行分页查询、区间统计等操作，B+树的有序链表结构可显著提升此类场景的查询效率。

四、核心总结

B树与B+树的核心差异源于数据存储位置的设计差异及叶子节点的结构设计：B树的设计侧重单次查询的极限效率，但其查询稳定性及范围查询效率相对不足；B+树通过“索引与数据分离”及“叶子节点有序链表”的设计，实现了更稳定的查询效率、更高的磁盘I/O利用率及更高效的范围查询能力，更适配现代数据库、大数据量存储的应用需求。

综上可知：随机查询需求为主、数据量较小的场景优先选用B树；范围查询频繁、大数据量的场景优先选用B+树，这也是B+树成为主流数据库索引结构的核心原因。

ps：如果这篇帖子对于还在找工作和找实习的你有所帮助，可以关注我，给本贴点赞、评论、收藏并订阅专栏；同时不要吝啬您的花花

MySQL存储引擎与索引文章被收录于专栏

还在纠结MySQL存储引擎怎么选？选错直接拉垮系统性能！MySQL插件式存储引擎架构适配多元业务：InnoDB（默认）支持事务、行级锁，扛高并发OLTP场景；MyISAM查询快无事务，适配读多写少场景；Memory读写极速但无持久化，适合临时缓存；Archive高压缩归档日志，CSV便捷跨系统交互，NDB支撑分布式集群。本期专栏拆解各引擎核心特性与选型逻辑，教你选对引擎，让数据库性能拉满！