03-14 20:59 门头沟学院 Java 发布于北京

关注

Undo log

ps：如果这篇帖子对于还在找工作和找实习的你有所帮助，可以关注我，给本贴点赞、评论、收藏并订阅专栏；同时不要吝啬您的花花

Undo log（回滚日志）是MySQL InnoDB存储引擎特有的核心日志之一，与Redo log（重做日志）、Binlog（二进制日志）并称InnoDB三大核心日志，但其核心定位更偏向“事务回滚”与“多版本并发控制”，是InnoDB实现事务ACID特性中「原子性（Atomicity）」和支撑「MVCC（多版本并发控制）」的关键基础——MyISAM引擎不支持事务和Undo log，因此也不具备回滚和无锁读能力。

与Redo log专注于“崩溃恢复、保障数据持久性”不同，Undo log记录的是数据修改前的“历史镜像”或“操作逆过程”，本质是一种逻辑日志（记录操作的反向逻辑，而非物理磁盘数据的修改），其核心价值在于：事务执行出错时可回滚至初始状态，高并发场景下可提供数据的历史版本，实现“读写互不阻塞”的无锁读效果。

一、Undo log的核心作用

Undo log的作用主要体现在两个核心场景，同时隐含一个辅助价值，三者共同支撑InnoDB的事务与并发能力：

1. 保障事务原子性（核心作用）

事务的原子性要求“事务要么全部执行，要么全部回滚”，Undo log正是实现回滚操作的核心载体。当事务执行过程中出现错误（如语法错误、主键冲突）、手动执行ROLLBACK语句，或数据库崩溃后恢复时，InnoDB会通过Undo log中记录的“操作逆过程”，反向执行修改操作，将数据恢复到事务开始前的状态，确保事务不会留下部分修改的“脏数据”。

示例：事务执行UPDATE t SET name='test2' WHERE id=1（原name为'test'），Undo log会记录“将id=1的name改回'test'”的逆操作；若事务回滚，InnoDB会执行该逆操作，恢复数据原始状态；若执行INSERT操作，Undo log会记录“删除该新增行”的逆操作；若执行DELETE操作，Undo log会记录“插入该被删除行（含原始字段值）”的逆操作。

2. 支撑MVCC多版本并发控制（核心作用）

MVCC是InnoDB实现“读已提交（RC）”“可重复读（RR）”隔离级别的核心机制，其核心逻辑是“为每行数据保存多个历史版本”，让读操作无需等待写操作释放锁，写操作也不会阻塞读操作——而这些历史版本，全部存储在Undo log中，通过行记录的隐藏列roll_ptr（回滚指针）串联成“版本链”。

具体逻辑：事务启动时会创建Read View（当前活跃事务ID列表），执行SELECT（快照读）时，InnoDB会通过roll_ptr回溯Undo log中的版本链，过滤掉Read View中不可见的事务版本，最终返回当前事务可访问的历史数据，实现“无锁读”，大幅提升高并发场景下的读写性能。

3. 辅助避免锁竞争（隐性作用）

由于Undo log保存了数据的历史版本，读操作无需等待写操作释放行锁（直接读取Undo log中的历史版本），间接减少了锁竞争，避免了“读阻塞写、写阻塞读”的情况，进一步优化了InnoDB的并发处理能力，这也是MVCC能实现“读写互不阻塞”的核心原因之一。

二、Undo log的分类（按操作类型）

根据事务执行的操作类型，Undo log分为两类，两者的生命周期、存储位置、用途差异极大，核心区别在于“是否被MVCC依赖”，具体对比及细节如下：

1. Insert Undo Log（插入回滚日志）

核心定位：仅用于记录INSERT操作的反向日志，对应的数据是事务新增的行（此前不存在于表中），仅服务于事务回滚，与MVCC无关。

关键特性：

反向操作：事务回滚时，只需执行“删除该新增行”的操作，即可恢复到插入前的状态；
存储位置：存储于临时Undo Tablespace（仅在事务执行期间有效）；
生命周期：极短，事务提交后会立即自动释放、清理，无需保留——因为新增行不存在历史版本，其他事务不会读取到未提交的新增行，提交后也无需回溯该版本；
隔离级别影响：在READ COMMITTED和REPEATABLE READ隔离级别下，均在事务提交后立即清理。

2. Update Undo Log（更新回滚日志）

核心定位：用于记录UPDATE和DELETE操作的反向日志，对应的数据是表中已存在的行（被修改或标记删除的行），是MVCC依赖的核心日志类型，同时服务于事务回滚。

关键特性：

反向操作：UPDATE操作的Undo log记录“将修改后的字段恢复为修改前的值”；DELETE操作的Undo log记录“将标记删除的行恢复为正常状态”（注：InnoDB的DELETE是“逻辑删除”，仅标记行状态，物理删除由后续Purge线程执行）；
存储位置：存储于持久化Undo Tablespace（由innodb_undo_tablespaces参数配置，默认生成undo_001.ibu、undo_002.ibu等文件）；
生命周期：较长，事务提交后不会立即清理，需保留至“没有任何事务再引用该日志中的历史版本”——因为MVCC的快照读可能需要读取这些历史版本（如其他事务仍在读取该数据的旧版本），最终由Purge线程异步清理；
隔离级别影响：READ COMMITTED隔离级别下，事务提交后立即清理；REPEATABLE READ隔离级别下，事务提交后需保留至该事务结束（确保“可重复读”，即同一事务多次读取同一数据，结果一致）。

两类Undo log核心对比

适用操作	仅INSERT	UPDATE、DELETE
是否依赖MVCC	不依赖，仅用于事务回滚	强依赖，用于MVCC版本链构建
存储位置	临时Undo Tablespace	持久化Undo Tablespace
事务提交后状态	立即清理	暂存，等待Purge线程清理
核心用途	INSERT操作回滚	UPDATE/DELETE回滚 + MVCC版本管理

三、Undo log的存储机制

Undo log并非独立存储在单个文件中，而是与InnoDB的“回滚段（Rollback Segment）”绑定，采用分层存储架构，具体存储结构如下，核心依赖回滚段、Undo Tablespace和Undo Log Slot三个组件：

1. 核心存储载体：回滚段（Rollback Segment）

回滚段是InnoDB管理Undo log的核心逻辑分组，每个回滚段包含多个Undo Log Slot（事务分配的固定存储单元），用于存储不同事务的Undo log日志。

关键细节：

默认数量：MySQL 5.7及以上版本，默认有128个回滚段（可通过innodb_rollback_segments参数调整）；
分配规则：每个事务会分配一个Undo Log Slot（每个Slot默认16KB），通过Round-Robin算法分配，一个事务的所有Undo log均存储在其分配的Slot中；
分类：分为系统回滚段（存储系统事务的Undo log）和用户回滚段（存储用户事务的Undo log）；
Slot数量：Undo Log Slot的数量由InnoDB页大小决定，例如16KB页大小对应每个回滚段1024个Slot（页大小/16），32KB页大小对应2048个Slot。

2. 存储文件：Undo Tablespace（回滚表空间）

Undo log最终存储在Undo Tablespace中，分为两类，对应不同类型的Undo log：

临时Undo Tablespace：仅存储Insert Undo Log，事务结束后自动释放，无需持久化；
持久化Undo Tablespace：存储Update Undo Log，默认由innodb_undo_tablespaces参数控制（默认值为2，即生成2个独立表空间文件），最大支持128个，可通过该参数扩容，避免Undo log文件过大导致的磁盘空间问题。

补充：MySQL 5.6及之前版本，Undo log默认存储在共享表空间（ibdata1）中，容易导致共享表空间膨胀；MySQL 5.7及以上版本支持独立Undo Tablespace，可通过配置将其与共享表空间分离，便于管理和扩容。

3. 存储单元：Undo Page（Undo页）

每个Undo Log Slot由多个Undo Page组成，Undo log日志按“页”为单位存储（默认页大小与InnoDB数据页一致，为16KB）。当一个Undo Page写满后，InnoDB会自动分配新的Undo Page，继续存储该事务的Undo log；当Undo Page中的所有Undo log被Purge线程清理后，该页会被标记为空闲，供后续事务复用，减少磁盘空间浪费。

四、Undo log的完整工作流程

Undo log的工作流程与事务执行、MVCC版本链构建、Purge线程清理深度绑定，整体分为“生成→回滚→清理”三个阶段，结合具体操作场景拆解如下（以InnoDB引擎、事务ID=20为例）：

1. 生成阶段（事务执行过程中）

事务启动后，每执行一次修改操作（INSERT/UPDATE/DELETE），InnoDB会在“执行修改操作之前”，自动生成对应的Undo log记录，写入内存中的Undo log缓冲区，再异步刷盘至Undo Tablespace（遵循“先写日志”原则，但无需等待刷盘完成即可执行后续操作，提升性能）。

具体场景示例：

INSERT操作：插入id=1、name='test'的行，生成Insert Undo Log，记录“删除id=1的行”；
UPDATE操作：将id=1的name改为'test2'（原name='test'），生成Update Undo Log，记录“将id=1的name改回'test'”，同时更新行的roll_ptr，指向该Undo log记录，构建版本链；
DELETE操作：删除id=1的行，生成Update Undo Log，记录“插入id=1、name='test2'的行”，同时标记该行为“删除状态”，更新roll_ptr指向该Undo log记录。

2. 回滚阶段（事务需要回滚时）

当事务执行ROLLBACK、执行出错或数据库崩溃后恢复时，InnoDB会遍历该事务生成的所有Undo log记录，反向执行其中的“逆操作”，将数据恢复到事务开始前的状态。

关键细节：回滚时仅处理当前事务的Undo log，不会影响其他事务的Undo log（每个事务的Undo log相互隔离）；回滚完成后，该事务的Undo log会被标记为“可清理”，等待Purge线程处理。

3. 清理阶段（事务提交后）

Undo log的清理由InnoDB的Purge线程异步执行，清理时机和逻辑因Undo log类型而异：

Insert Undo Log：事务提交后，立即被Purge线程清理（无需保留，无MVCC依赖）；
Update Undo Log：事务提交后，需保留至“没有任何事务再引用该日志中的历史版本”（即所有依赖该历史版本的Read View都已失效），Purge线程会定期扫描Undo log，清理已失效的记录，同时释放对应的Undo Page空间。

补充：可通过innodb_undo_log_truncate参数（默认开启）控制Undo log的自动清理，避免Undo Tablespace持续膨胀；若该参数关闭，需手动清理Undo log，否则可能出现“undo log too long”错误，导致事务阻塞。

五、Undo log与Redo log、Binlog的区别

很多人会混淆Undo log、Redo log和Binlog，三者的核心定位、日志类型、作用完全不同，具体对比如下，明确各自的职责边界：

日志类型	逻辑日志（记录操作逆过程）	物理日志（记录数据页修改）	逻辑日志（记录SQL操作本身）
核心作用	事务回滚、支撑MVCC	保障事务持久性、崩溃恢复	数据备份、主从复制
存储引擎依赖	仅InnoDB支持	仅InnoDB支持	所有引擎都支持
写入时机	事务执行修改操作前	事务执行修改操作后、提交前	事务提交后
生命周期	事务提交后，按需清理	循环写，覆盖已失效记录	追加写，不覆盖，可归档

六、Undo log的关键配置参数与监控

在实际生产环境中，合理配置Undo log相关参数，可避免空间膨胀、性能瓶颈等问题，同时通过监控指标及时排查异常，核心参数和监控方法如下：

1. 核心配置参数

innodb_undo_tablespaces	4（高并发场景）	设置独立Undo Tablespace的数量，增加分片数，降低锁竞争，避免单文件膨胀
innodb_undo_log_truncate	ON（默认开启）	开启Undo log自动清理，由Purge线程定期清理失效的Undo log，避免空间泄漏
innodb_rollback_segments	128（默认）	设置回滚段的数量，影响并发事务的Undo log分配能力，高并发场景可适当增加
innodb_undo_logs	128（默认）	控制每个回滚段的Undo log数量，与回滚段配合，提升并发处理能力

2. 核心监控指标与命令

通过以下命令和指标，可监控Undo log的运行状态，及时排查异常：

查看Undo log整体状态：SHOW ENGINE INNODB STATUS，在“TRANSACTIONS”部分可查看相关信息；
History list length：版本链长度，若该值持续大于1000，需警惕——说明Undo log清理不及时，可能导致性能下降或事务阻塞；
Truncate LSN：最近清理点，用于确认Undo log自动清理是否生效；
查看长事务（导致Undo log堆积）：SHOW PROCESSLIST，排查执行时间过长的事务，及时终止或优化。

七、常见问题与排查方案

生产环境中，Undo log常见问题主要集中在空间膨胀、清理不及时、回滚失败等，具体问题及排查方案如下：

1. 问题1：Undo Tablespace持续膨胀

原因：innodb_undo_log_truncate参数未开启；存在大量长事务，导致Update Undo log无法清理；Purge线程清理速度跟不上Undo log生成速度。

解决方案：开启innodb_undo_log_truncate参数；排查并终止长事务（通过SHOW PROCESSLIST）；优化业务逻辑，拆分大事务；增加Purge线程数量（innodb_purge_threads）；扩容Undo Tablespace。

2. 问题2：事务回滚失败

原因：Undo log文件损坏；事务执行过程中数据库崩溃，Undo log未完整写入；回滚时Undo log已被清理。

解决方案：通过InnoDB崩溃恢复机制自动修复；若修复失败，可通过备份恢复数据；检查Undo log存储路径的磁盘空间，避免磁盘满导致日志写入失败。

3. 问题3：MVCC查询异常（读取不到正确的历史版本）

原因：Update Undo log被过早清理；Read View创建时机异常；事务隔离级别配置错误。

解决方案：确认innodb_undo_log_truncate参数正常开启，且Purge线程运行正常；检查事务隔离级别是否符合业务需求（如需要可重复读，需配置为REPEATABLE READ）；避免频繁修改同一行数据，减少版本链过长导致的异常。

八、总结

Undo log是InnoDB存储引擎的“灵魂组件”之一，其核心价值在于：通过记录操作的逆过程，保障事务的原子性，实现事务回滚；通过存储数据的历史版本，支撑MVCC，实现高并发下的无锁读，减少锁竞争。

理解Undo log的关键的是区分其与Redo log、Binlog的定位，明确Insert Undo Log与Update Undo Log的差异，掌握其存储机制和工作流程。在实际生产中，合理配置相关参数、监控核心指标，可避免Undo log带来的空间和性能问题，充分发挥InnoDB的事务和并发优势。

ps：如果这篇帖子对于还在找工作和找实习的你有所帮助，可以关注我，给本贴点赞、评论、收藏并订阅专栏；同时不要吝啬您的花花

MySQL 日志文章被收录于专栏

MySQL 日志专栏：带你慢览数据库运行轨迹，解析错误日志、查询日志、二进制日志核心价值，排查死锁、定位执行瓶颈，掌握日志备份恢复实操，轻松保障数据安全稳定运行。