MySQL中锁解决幻读问题的方法
这篇文章主要介绍MySQL中锁解决幻读问题的方法,文中介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们一定要看完!
什么是锁
锁是一种用于保证在并发场景下每个事务仍能以一致性的方式读取和修改数据的方式,当一个事务对某一条数据上锁之后,其他事务就不能修改或者只能阻塞等待锁的释放,所以锁的粒度大小一定程度上可以影响到访问数据库的性能。
从锁的粒度上来说,我们可以将锁分为表锁和行锁。
表锁
顾名思议,表锁就是直接锁表,在MyISAM引擎中就只有表锁。
表锁的加锁方式为:
LOCK TABLE 表名 READ;--锁定后表只读UNLOCK TABLE; --解锁复制代码
行锁
行锁,从名字上来看,就是锁住一行数据,然而,行锁的实际实现算法会相对复杂,有时候并不仅仅只是锁住某一条数据,这个后面再展开。
正常的思路是:锁住一行数据之后,其他事务就不能来访问这条数据了,那么我们想象,假如事务A访问了一条数据,只是拿出来读一下,并不想去修改,正好事务B也来访问这条数据,也仅仅只是想拿出来读一下,并不想去修改,这时候如果因此阻塞了,就有点浪费性能了。所以为了优化这种读数据的场景,我们又把行锁分为了两大类型:共享锁和排他锁。
共享锁
共享锁,Shared Lock,又称之为读锁,S锁,就是说一条数据被加了S锁之后,其他事务也能来读数据,可以共享一把锁。
我们可以通过如下语句加共享锁:
select * from test where id=1 LOCK IN SHARE MODE;复制代码
加锁之后,直到加锁的事务结束(提交或者回滚)就会释放锁。
排他锁
排他锁,Exclusive Lock,又称之为写锁,X锁。就是说一条数据被加了X锁之后,其他事务想来访问这条数据只能阻塞等待锁的释放,具有排他性。
当我们在修改数据,如:insert,update,delete的时候MySQL就会自动加上排他锁,同样的,我们可以通过如下sql语句手动加上排他锁:
select * from test where id=1 for update;复制代码
在InnoDB引擎中,是允许行锁和表锁共存的。
但是这样就会有一个问题,假如事务A给t表其中一行数据上锁了,这时候事务B想给t表上一个表锁,这时候怎么办呢?事务B怎么知道t表有没有行锁的存在,如果采用全表遍历的情况,当表中的数据很大的话,加锁都要加半天,所以MySQL中就又引入了意向锁。
意向锁
意向锁为表锁,分为两种类型,分为:意向共享锁(Intention Shared Lock)和意向排他锁(Intention Exclusive Lock),这两种锁又分别可以简称为IS锁和IX锁。
意向锁是MySQL自己维护的,用户无法手动加意向。
意向锁有两大加锁规则:
- 当需要给一行数据加上S锁的时候,MySQL会先给这张表加上IS锁。
- 当需要给一行数据加上X锁的时候,MySQL会先给这张表加上IX锁。
这样的话上面的问题就迎刃而解了,当需要给一张表上表锁的时候,只需要看这张表是否有对应的意向锁就可以了,无需遍历整张表。
各种锁的兼容关系
下面这张图是各种锁的兼容关系,参考自官网:
X | IX | S | IS | |
---|---|---|---|---|
X | 互斥 | 互斥 | 互斥 | 互斥 |
IX | 互斥 | 共享 | 冲突 | 共享 |
S | 互斥 | 互斥 | 共享 | 共享 |
IS | 互斥 | 共享 | 共享 | 共享 |
锁到底锁的是什么
建立以下两张表,并初始化5条数据,注意test表有2个索引而test2没有索引:
CREATE TABLE `test` ( `id` int(11) NOT NULL, `name` varchar(50) DEFAULT NULL, PRIMARY KEY (`id`), KEY `NAME_INDEX` (`name`)) ENGINE=InnoDB DEFAULT CHARSET=utf8;INSERT INTO test VALUE(1,'张1');INSERT INTO test VALUE(5,'张5');INSERT INTO test VALUE(8,'张8');INSERT INTO test VALUE(10,'张10');INSERT INTO test VALUE(20,'张20');CREATE TABLE `test2` ( `id` varchar(32) NOT NULL, `name` varchar(32) DEFAULT NULL) ENGINE=InnoDB DEFAULT CHARSET=utf8;INSERT INTO test2 VALUE(1,'张1');INSERT INTO test2 VALUE(5,'张5');INSERT INTO test2 VALUE(8,'张8');INSERT INTO test2 VALUE(10,'张10');INSERT INTO test2 VALUE(20,'张20');复制代码
举例猜测
在行锁中,假如我们对一行记录加锁,那么到底是把什么东西锁住了,我们来看下面两个例子:
举例1(操作test表):
事务A | 事务B |
---|---|
BEGIN; | |
SELECT * FROM test WHERE id=1 FOR UPDATE; | |
SELECT * FROM test WHERE id=1 FOR UPDATE; 阻塞 | |
SELECT * FROM test WHERE id=5 FOR UPDATE; 加锁成功 | |
COMMIT; (释放锁) | |
SELECT * FROM test WHERE id=1 FOR UPDATE; 加锁成功 |
举例2(操作test2表):
事务A | 事务B |
---|---|
BEGIN; | |
SELECT * FROM test2 WHERE id=1 FOR UPDATE; | |
SELECT * FROM test2 WHERE id=1 FOR UPDATE; 阻塞 | |
SELECT * FROM test2 WHERE id=5 FOR UPDATE; 阻塞 | |
COMMIT; (释放锁) | |
SELECT * FROM test2 WHERE id=1 FOR UPDATE; 加锁成功 |
从上面两个例子我们可以发现,test表好像确实是锁住了id=1这一行的记录,而test2表好像不仅仅是锁住了id=1这一行记录,实际上经过尝试我们就知道,test2表是被锁表了,所以其实MySQL中InnoDB锁住的是索引,当没有索引的时候就会锁表。
接下来再看一个场景:
事务A | 事务B |
---|---|
BEGIN; | |
SELECT * FROM test WHERE name='张1' FOR UPDATE; | |
SELECT name FROM test WHERE name='张1' FOR UPDATE; 阻塞 | |
SELECT id FROM test WHERE id=1 FOR UPDATE; 阻塞 | |
COMMIT; (释放锁) | |
SELECT id FROM test WHERE id=1 FOR UPDATE; 加锁成功 |
这个例子中我们是把name索引锁住了,然后我们在事务B中通过主键索引只查id,这样就用到name索引了,但是最后发现也被阻塞了。所以我们又可以得出下面的结论,MySQL索引不但锁住了辅助索引,还会把辅助索引对应的主键索引一起锁住。
到这里,可能有人会有怀疑,那就是我把辅助索引锁住了,但是假如加锁的时候,只用到了覆盖索引,然后我再去查主键会怎么样呢?
接下来让我们再验证一下:
事务A | 事务B |
---|---|
BEGIN; | |
SELECT name FROM test WHERE name='张1' FOR UPDATE; | |
SELECT name FROM test WHERE name='张1' FOR UPDATE; 阻塞 | |
SELECT * FROM test WHERE id=1 FOR UPDATE; 阻塞 | |
SELECT id FROM test WHERE id=1 FOR UPDATE; 阻塞 | |
COMMIT; (释放锁) | |
SELECT id FROM test WHERE id=1 FOR UPDATE; 加锁成功 |
我们可以看到,就算只是用到了辅助索引加锁,MySQL还是会把主键索引锁住,而主键索引的B+树叶子节点中,又存储了整条数据,所以查询任何字段都会被锁定。
到这里,我们可以明确的给锁到底锁住了什么下结论了:
结论
InnoDB引擎中,锁锁的是索引:
- 假如一张表没有索引,MySQL会进行锁表(其实锁住的是隐藏列ROWID的主键索引)
- 假如我们对辅助索引加锁,那么辅助索引所对应的主键索引也会被锁住
- 主键索引被锁住,实际上就等于是整条记录都被锁住了(主键索引叶子节点存储了整条数据)
行锁的算法
上一篇介绍事务的时候我们提到了,MySQL通过加锁来防止了幻读,但是如果行锁只是锁住一行记录,好像并不能防止幻读,所以行锁锁住一条记录的话只是其中一种情况,实际上行锁有三种算法:记录锁(Record Lock),间隙锁(Gap Lock)和临键锁(Next-Key Lock),而之所以能做到防止幻读,正是临键锁起的作用。
记录锁(Record Lock)
记录锁就是上面介绍的,当我们的查询能命中一条记录的时候,InnoDB就会使用记录锁,锁住所命中的这一行记录。
间隙锁(Gap Lock)
当我们的查询没有命中记录的时候,这时候InnoDB就会加上一个间隙锁。
事务A | 事务B |
---|---|
BEGIN; | |
SELECT * FROM test WHERE id=1 FOR UPDATE; | |
INSERT INTO test VALUE (2,'张2'); 阻塞 | |
INSERT INTO test VALUE (3,'张3'); 阻塞 | |
SELECT * FROM test WHERE id=2 FOR UPDATE; 加锁成功 | |
COMMIT; (释放锁) |
从上面的例子中,我们可以得出结论:
- 间隙锁与间隙锁之间不冲突,也就是事务A加了间隙锁,事务B可以在同一个间隙中加间隙锁。(之所以会用到间隙锁就是没有命中数据的时候,所以并没有必要去阻塞读,也没有必要阻塞其他事务对同一个间隙加锁)
- 间隙锁主要是会阻塞插入操作
间隙是如何确定的
test表中有5条记录,主键值分别为:1,5,8,10,20。那么就会有如下六个间隙:
(-∞,1),(1,5),(5,8),(8,10),(10,20),(20,+∞)
而假如主键不是int类型,那么就会转化为ASCII码之后再确定间隙。
临键锁(Next-Key Lock)
临键锁就是记录锁和间隙锁的结合。当我们进行一个范围查询,不但命中了一条或者多条记录,且同时包括了间隙,这时候就会使用临键锁,临键锁是InnoDB中行锁的默认算法。
注意了,这里仅针对RR隔离级别,对于RC隔离级除了外键约束和唯一性约束会加间隙锁,没有间隙锁,自然也就没有了临键锁,所以RC级别下加的行锁都是记录锁,没有命中记录则不加锁,所以RC级别是没有解决幻读问题的。
临键锁在以下两个条件时会降级成为间隙锁或者记录锁:
- 当查询未命中任务记录时,会降级为间隙锁。
- 当使用主键或者唯一索引命中了一条记录时,会降级为记录锁。
事务A | 事务B |
---|---|
BEGIN; | |
SELECT * FROM test WHERE id>=2 AND id<=6 FOR UPDATE; | |
INSERT INTO test VALUE (2,'张2'); 阻塞 | |
INSERT INTO test VALUE (6,'张6'); 阻塞 | |
INSERT INTO test VALUE (8,'张8'); 阻塞 | |
SELECT * FROM test WHERE id=8 FOR UPDATE; 阻塞 | |
INSERT INTO test VALUE (9,'张9'); 插入成功 | |
COMMIT; (释放锁) |
上面这个例子,事务A加的锁跨越了(1,5)和(5,8)两个间隙,且同时命中了5,然后我们发现我们对id=8这条数据进行操作也阻塞了,但是9这条记录插入成功了。
临键锁加锁规则
临键锁的划分是按照左开右闭的区间来划分的,也就是我们可以把test表中的记录划分出如下区间:(-∞,1],(1,5],(5,8],(8,10],(10,20],(20,+∞)。
那么临键锁到底锁住了哪些范围呢?
**临键锁中锁住的是最后一个命中记录的 key 和其下一个左开右闭的区间**
那么上面的例子中其实锁住了(1,5]和(5,8]这两个区间。
临键锁为何能解决幻读问题
临键锁为什么要锁住命中记录的下一个左开右闭的区间?答案就是为了解决幻读。
我们想一想上面的查询范围id>=2且id<=6,如果我们事务A只锁住了(1,5]这个区间,假如这时候事务B插入一条数据id=6,那么事务A再去查询,就会多出来了一条记录id=6,就会出现了幻读,所以我把你下一个区间5,10]也给锁住,就可以避免了幻读。
当然,其实如果我们执行的查询刚好是id>=2且id<=5,那么就算只锁住了(1,5],同样能避免幻读问题,只是我们要考虑到查询范围的最大值没有命中记录的情况,而锁住了下一个区间,可以确保不论是哪种范围查询,都可以避免幻读的产生。
在我们使用锁的时候,有一个问题是需要注意和避免的,我们知道,排它锁有互斥的特性。一个事务持有锁的时候,会阻止其他的事务获取锁,这个时候会造成阻塞等待,那么假如事务一直等待下去,就会一直占用CPU资源,所以,锁等待会有一个超时时间,在InnoDB引擎中,可以通过参数:innodb_lock_wait_timeout查询:
SHOW VARIABLES LIKE 'innodb_lock_wait_timeout';复制代码
默认超时时间是50s,超时后会自动释放锁回滚事务。但是我们想一下,假如事务A在等待事务B释放锁,而事务B又在等待事务A释放锁,这时候就会产生一个等待环路了,而这种情况是无论等待多久都不可能会获取锁成功的,所以是没有必要去等50s的,这种形成等待环路的现象又叫做死锁。
死锁(Dead Lock)
什么是死锁
死锁是指的两个或者两个以上的事务在执行过程中,因为争夺锁资源而造成的一种互相等待的现象。
事务A | 事务B |
---|---|
BEGIN; | |
SELECT * FROM test WHERE id=10 FOR UPDATE; | |
BEGIN; | |
SELECT * FROM test WHERE id=20 FOR UPDATE; | |
SELECT * FROM test WHERE id=20 FOR UPDATE; | |
SELECT * FROM test WHERE id=10 FOR UPDATE; | |
ERROR 1213 (40001): Deadlock found when trying to get lock; try restarting transaction | |
查询出结果 |
我们可以看到,发生死锁之后就会立刻回滚,而不会漫无目的的去等待50s之后超时再回滚事务,那么MySQL是如何知道产生了死锁的,是如何检测死锁的发生呢?
死锁的检测
目前数据库大部分采用wait-for graph(等待图)的方式来进行死锁检测,InnoDB引擎也是采用这种方式来检测死锁。数据库中会记录两种信息:
- 锁的信息链表
- 事务的等待链表
wait-for graph 算法会根据这两个信息构建一张图,当图中存在回路,则证明存在死锁:
如下图中,t1和t2之间存在回路,这就证明t1和t2事务之间存在死锁
死锁的避免
- 尽量将长事务拆分成多个小事务
- 查询时避免没有where条件语句查询,并尽可能使用索引查询
- 可以的话尽量使用等值查询
锁信息查询
InnoDB在information_schema库下提供了3张表供我们查询并排查事务和锁相关问题。
INNODB_TRX
记录了当前在InnoDB中执行的每个事务的信息,包括事务是否在等待锁、事务何时启动以及事务正在执行的SQL语句(如果有的话)。
列名 | 含义 |
---|---|
trx_id | InnoDD引擎中的事务的唯一ID |
trx_state | 事务状态:RUNNING, LOCK WAIT, ROLLING BACK,COMMITTING |
trx_started | 事务的开始时间 |
trx_requested_lock_id | 等待会务的锁ID,如果trx_state不为LOCK WAIT时,为null |
trx_wait_started | 事务等待开始的时间 |
trx_weight | 事务的权重,反映了一个事务修改和锁住的行数,当发生死锁时候,InnoDB会选择该值最小的事务进行回滚 |
trx_mysql_thread_id | MySQL中的线程ID,可以通过SHOW PROCESSLIST查询 |
trx_query | 事务运行的sql语句 |
trx_operation_state | 事务的当前操作状态,如果没有则为NULL |
trx_tables_in_use | 当前事务中执行的sql语句用到的表数量 |
trx_tables_locked | 已经被锁定表的数量(因为用的是行锁,所以虽然显示一张表被锁了,但是可能只是锁定的其中一行或几行,所以其他行还是可以被其他事务访问) |
trx_lock_structs | 当前事务保留的锁数量 |
trx_lock_memory_bytes | 当前事务的索结构在内存中的大小 |
trx_rows_locked | 当前事务中锁住的大致行数,包括已经被打上删除标记等物理存在的但是对当前事务不可见的数据 |
trx_rows_modified | 当前事务修改或者插入的行数 |
trx_concurrency_tickets | 并发数,指的是当前事务未结束前仍然可以执行的并发数,可以通过系统变量innodb_concurrency_tickets设置 |
trx_isolation_level | 当前事务隔离级别 |
trx_unique_checks | 是否为当前事务打开或者关闭唯一约束:0-否1-是 |
trx_foreign_key_checks | 是否为当前事务打开或者关闭外键约束:0-否1-是 |
trx_last_foreign_key_error | 最后一个外键错误信息,没有则为空 |
trx_adaptive_hash_latched | 自适应哈希索引是否被当前事务锁定。在分区自适应哈希索引搜索系统时,单个事务不会锁定整个自适应哈希索引。自适应哈希索引分区由innodb_adaptive_hash_index_parts控制,默认设置为8。 |
trx_adaptive_hash_timeout | 是立即放弃自适应哈希索引的搜索latch,还是在来自MySQL的调用中保留它。当没有自适应哈希索引争用时,这个值将保持为零,并且语句会保留latch直到它们完成。在争用期间,它的计数减少到零,并且语句在每一行查找之后立即释放锁存。当自适应哈希索引搜索系统被分区时(由innodb_adaptive_hash_index_parts控制),该值保持为0。 |
trx_is_read_only | 当前事务是否只读:0-否1-是 |
trx_autocommit_non_locking | 值为1表示这是一条不包含for update和lock in share model的语句,而且是在开启autocommit情况下执行的有且仅有这一条语句,当这列和TRX_IS_READ_ONLY都为1时,InnoDB会优化事务以减少与更改表数据事务的相关开销。 |
INNODB_LOCKS
记录了事务请求锁但未获得的每个锁的信息和一个事务持有锁但正在阻塞另一个事务的每个锁的信息。
列名 | 含义 |
---|---|
lock_id | 锁的id(虽然LOCK_ID当前包含TRX_ID,但LOCK_ID中的数据格式随时可能更改,不要编写解析LOCK_ID值的应用程序) |
lock_trx_id | 上一张表的事务ID |
lock_mode | 锁的模式: S, X, IS, IX, GAP, AUTO_INC,UNKNOWN |
lock_type | 锁的类型是表锁还是行锁 |
lock_table | 被锁住的表 |
lock_index | 被锁住的索引,表锁则为NULL |
lock_space | 锁记录的空间id,表锁则为NULL |
lock_page | 事务锁定页的数量,表锁则为NULL |
lock_rec | 事务锁定行的数量,表锁则为NULL |
lock_data | 事务锁定的主键值,表锁则为NULL |
INNODB_LOCK_WAITS
记录了锁等待的信息。每个被阻塞的InnoDB事务包含一个或多个行,表示它所请求的锁以及正在阻塞该请求的任何锁。
列名 | 含义 |
---|---|
lock_id | 锁的id(虽然LOCK_ID当前包含TRX_ID,但LOCK_ID中的数据格式随时可能更改,不要编写解析LOCK_ID值的应用程序) |
requesting_trx_id | 申请锁资源的事务ID |
requested_lock_id | 申请的锁的ID |
blocking_trx_id | 阻塞的事务ID |
blocking_lock_id | 阻塞的锁的ID |
以上是MySQL中锁解决幻读问题的方法的所有内容,感谢各位的阅读!希望分享的内容对大家有帮助,更多相关知识,欢迎关注行业资讯频道!