第二十章幻读是什么，幻读有什么问题？

lewis 1年前 (2024-04-18) 阅读数 24 #技术

第二十章幻读是什么，幻读有什么问题？

CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `c` int(11) DEFAULT NULL,
  `d` int(11) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `c` (`c`)
) ENGINE=InnoDB;

insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);

下面的语句序列，是怎么加锁的，加的锁又是什么时候释放的呢 ?

begin;
select * from t where d=5 for update;
commit;

select ... for update：对于非索引字段 进行update 或select .. for update 操作，代价极高。所有记录上锁，以及所有间隔的锁对于索引字段 进行上述操作，代价一般。只有索引字段本身和附近的间隔会被加锁select ... for update 是为了在查询时，对这条数据进行加锁，避免其他用户以该表进行插入、修改或删除等操作，造成表的不一致性

关于 “这个语句会命中 d=5 的这一行，对应的主键 id=5，因此在 select 语句执行完成后，id=5 这一行会加一个写锁，而且由于两阶段锁协议，这个写锁会在执行 commit 语句的时候释放” 这句话的理解

由于字段 d 上没有索引，因此这条查询语句会做全表扫描。那么，其他被扫描到的，但是不满足条件的 5 行记录上，会不会被加锁呢？

RR (可重复读) 级别：扫描到的数据都会加行锁和间隙锁RC (读提交) 级别：扫描到的数据都会加行锁，但是不满足条件的数据，没有到 commit 阶段，就会被释放，违反了两阶段加锁原则全表扫描一直指的是扫描主键索引什么是幻读 ?

InnoDB 的默认隔离级别是可重复读

share in mode：当前读，给数据加读锁

for update：当前读，给数据加写锁

什么是幻读 ?

在同一个事务中，两次读取到的数据不一致的情况，称为幻读 和不可重复读幻读是针对insert 导致的数据不一致不可重复读是针对delete、update 导致的数据不一致可重复读 隔离级别下，事务内查询用 “当前读”，读到本事务外新增的数据，称为幻读幻读是用户在使用可重复读隔离级别下，在进行 select 查询时加IX锁、IS锁才可能出现的，是用户主动打破业务层面上的查询时的一致性视图隔离性其不属于事务隔离的可见性规则问题（可见性规则是来解决各种事务问题的），而是用户在使用上出现的问题，属于业务问题

什么是快照读 ? 什么是当前读 ?

当前读指的是select for update 或者select in share mode ，指的是在更新之前必须先查询当前的值，因此叫当前读快照读指的是在语句执行之前或者在事务开始的时候会创建一个视图，后面的读都是基于这个视图的，不会再去查询最新的值

当前读具体包括哪些操作 ?

for update、lock in share mode、update、delete、insert 都是当前读的规则，就是读取最新的已经提交的数据update 先查询再修改，这里的查询就是使用的当前读delete 要先查询再删除，这里的查询也是要当前读insert 的时候，要判断主键是否已经存在、是否违反唯一约束，此时查看主键是否存在的查询也是当前读

幻读和脏读的区别 ?

幻读是读到了提交了的数据，而脏读是读到了没提交的脏数据在读提交 的隔离级别下，没有讨论幻读的实际意义而在可重复读 隔离级别下，当前读 打破了视图的隔离限制，实现了读到不应该读的数据的作用

在 可重复读 的隔离级别下，幻读只会在查询为哪种性质时才会出现 ?

由于一致性视图 的作用，因此幻读只会在 “当前读” 情况下发生

幻读跟事务的可见性规则冲突吗 ?

在可重复读 隔离级别下，幻读是用户选择使用当前读 而产生的，符合当前读的规则，也不跟事务的可见性规则 相矛盾幻读有什么问题 ?

select .. lock in share mode 和 select ... for update 的区别 ?

select .. lock in share mode 走的是IS锁（意向锁）即在符合条件的 rows 上都加了共享锁，这样的话，其他session 可以读取这些记录，也可以继续添加IS 锁，但是无法修改这些记录直到你这个加锁的session 执行完成 (否则直接锁等待超时)select ... for update 走的是IX锁 (意向排它锁)即在符合条件的 rows 上都加了排它锁，其他 session 也就无法在这些记录上添加任何的IS锁 或IX锁如果不存在一致性非锁定读的话，那么其他 session 是无法读取和修改这些记录的但是innoDB 存在非锁定读 (快照读并不需要加锁)，for update 之后并不会阻塞其他 session 的快照读取操作除了select ...lock in share mode 和select ... for update 这种显示加锁的查询操作通过对比，发现for update 的加锁方式无非是比lock in share mode 的方式多阻塞了select...lock in share mode 的查询方式，并不会阻塞快照读

幻读产生的原因 ?

注意：binlog 日志是在commit 提交时才进行记录的即使给所有行加上了锁，也避免不了幻读这是因为给行加锁的时候，这条记录还不存在，没法加锁例如下面这种情况：假设扫描到的行都被加上了行锁

由于 session A 把所有的行都加了写锁，所以 session B 在执行第一个 update 语句的时候就被锁住了，需要等到 T6 时刻 session A 提交以后，session B 才能继续执行在binlog 里面，执行序列是这样的：

insert into t values(1,1,5); /*(1,1,5)*/
update t set c=5 where id=1; /*(1,5,5)*/

update t set d=100 where d=5;/*所有d=5的行，d改成100*/

update t set d=5 where id=0; /*(0,0,5)*/
update t set c=5 where id=0; /*(0,5,5)*/

按照日志顺序执行，id=0 这一行的最终结果也是(0,5,5)。所以，id=0 这一行的问题解决了但是你可以看到，id=1 这一行，在数据库里面的结果是(1,5,5)，而根据binlog 的执行结果是(1,5,100)，也就是说幻读的问题还是没有得到解决原因是：在T3 时刻，我们给所有行加锁的时候，id=1 这一行还不存在，不存在也就加不上锁如何解决幻读 ?

如何解决 幻读 ?

InnoDB 在行锁 的基础上，引入了间隙锁 (Gap Lock)间隙锁，锁的就是两个值之间的空隙比如文章开头的表 t，初始化插入了 6 个记录，这就产生了 7 个间隙

insert into t values(0,0,0),(5,5,5),
(10,10,10),(15,15,15),(20,20,20),(25,25,25);

MySQL 会对扫描经过的索引对象，加上间隙锁

行锁和行锁之间会产生冲突，那间隙锁和间隙锁之间，也会产生冲突吗 ?

行锁分为：读锁、写锁

行锁：读锁之间不冲突，写锁与读锁冲突，写锁与写锁冲突但是，跟间隙锁存在冲突关系的，是 “往这个间隙中插入一个记录” 这个操作间隙锁与间隙锁之间，都不存在冲突关系

什么是 next-key lock ?

间隙锁 和行锁 合称next-key lock，每个next-key lock 是前开后闭区间如果用select * from t for update 要把整个表所有记录锁起来，就形成了 7 个next-key lock，分别是(-∞,0]、(0,5]、(5,10]、(10,15]、(15,20]、(20, 25]、(25, +supremum]间隙锁只是锁间隙，没有锁住记录行，而 next-key lock 就是间隙锁基础上锁住右边界行间隙锁：( )开区间next-key lock：( ]前开后闭区间如果是表的最后一行数据，则下一个区间是这行数据到表索引的不存在的最大值，也就是+supremum

引入间隙锁后，可能会导致什么问题 ?

首先需要了解间隙锁的特性：锁的是间隙，是禁止其他操作往间隙中插入数据的。因此间隙锁与间隙锁之间不冲突所以在 AB 两个事务当中A事务 随机查询某一条数据（+排它锁，也就是for update ）的方式产生间隙锁B事务 也执行同一条SQL，随后 A事务判定数据不存在时，对其插入，B事务也同样如此操作，则最终导致 A事务等待 B事务的间隙锁，B事务也在等待 A事务的间隙锁，这将导致死锁当然，由于 InnoDB 有开启死锁检测，最后 A事务报错返回但是，间隙锁会影响数据的并发度

除了引入 间隙锁，还有什么方式可以解决幻读 ?

将RR (可重复读) 改为RC (读提交)，则不存在幻读问题但此时需要将binlog 格式改为row，否则可能出现数据和日志不一致的问题

为什么 RC (读提交) 下，需要将 binlog 格式改为 row 呢 ?

RC 没有幻读问题，也没有间隙锁，但在显示控制事务更新时若在事务A 还未提交之前，有别的事务B 后执行并且添加的数据是事务A 的更新语句逻辑层面会命中的条件那等事务A 提交之后，statement 的 binlog 记录上，事务B的记录在前，而事务A的记录在后（这没毛病，谁先提交谁先记录，但恢复的时候会产生问题）当执行日志恢复时，后提交的事务A 的记录会把事务B 的记录也进行更新，这就导致了数据恢复错误此时，如果改成row 格式，binlog 会具体记录语句的各项条件，这样在恢复时便不会恢复错误了注意：除了恢复，还有主从库的同步也会有这个问题举个例子：例子一：删除statement 记录的是这个删除的语句

delete from t where age>10 and modified_time<='2020-03-04' limit 1;

而row 格式记录的是实际受影响的数据是真实删除行的主键id

delete from t where id=3 and age=12 and modified_time='2020-03-05';

例子二：

-- statemnt格式
begin；
update t set d=5 where id=0;
commit;

-- row格式
begin；
update t where id=0 and c=0 and d=0
set id=0,c=0,d=5
commit;

关于row格式的参考资料

为什么要把MySQL的binlog格式修改为row

大家都用读提交，可是逻辑备份的时候，mysqldump 为什么要把备份线程设置成可重复读呢 ?

官方自带的逻辑备份工具是mysqldump当mysqldump 使用参数–single-transaction 的时候，导数据之前就会启动一个事务，来确保拿到一致性视图因为RR (可重复读) 的一致性读视图可以保证数据备份时，不阻塞其他数据写入

在备份期间，备份线程用的是可重复读，而业务线程用的是读提交。同时存在两种事务隔离级别，会不会有问题 ?

没有问题，不管是读提交 还是可重复读，都是 MVCC 支持备份是从某个快照时间之后开始的，数据是固定一致准确的

一条加了 排它锁 的查询语句，如果查询是全表扫描，那么扫描过的语句会如何 ?

在可重复读 隔离级别下，MySQL 会对扫过的语句加next-key lock总结可重复读 更新时采用当前读，这是为了防止数据丢失但使用当前读，可能造成更新层面语义的破坏 和日志数据不一致的问题为解决更新层面的幻读 问题，可重复读时，引入了next-key lock若是直接采取读提交，则解决了语义层面的破坏，但需要通过将binlog 改为max 或row 的形式，防止日志数据不一致

版权声明

本文仅代表作者观点，不代表博信信息网立场。

上一篇：在Python中，字典是一种基于哈希表实现的数据结构。因此，哈希表和字典之间存在着密切的关系，但也有一些区别。实现方式下一篇：云服务器是干什么的

第二十章 幻读是什么，幻读有什么问题？

版权声明

作者文章

第二十章幻读是什么，幻读有什么问题？