事务是一组操作的集合,是一个不可分割的工作单元,同时是数据库操作的基本单元,这些操作要么同时成功要么同时失败。它用于保证数据操作的原子性、一致性、隔离性和持久性(ACID)。
事务案例
查看以下案例:张三需要向李四的账户转账一千元,这件事由多个部分组成:
- 查询张三的账户余额,确保有足够的金额可以转账。
SELECT money from account where name = 'zhangsan';
- 将张三的账户余额减少1000元
UPDATE account set money = money - 1000 where name = 'zhangsan';
- 将李四的账号余额增加1000元
UPDATE account set money = money + 1000 where name = 'lisi';
这些步骤需要在一个事务中执行,以确保操作的一致性。如果我们将这三条SQL语句分别独立执行,可能会出现问题。例如:
- 如果前两条SQL语句执行成功,而在执行第三条时发生异常,张三的账户会被扣除1000元,但李四的账户余额不会增加。这就导致了数据不一致的问题。
引入事务后,这种情况就可以避免,因为事务的特性可以确保:
- 如果所有步骤都成功执行,转账操作完成。
- 如果某个步骤失败,整个事务会被回滚(rollback),所有改变都会撤销,数据会恢复到最初的状态。
因此,使用事务可以确保操作的原子性和一致性,使得复杂的数据库操作更加可靠和安全。
事务操作
MySQL 默认开启事务,也即每一条 DML 语句都算基本事务,可以通过以下 SQL 进行查询:
SELECT @@autocommit;
- 如果输出
1
,表示事务自动提交开启,这仅适用于单条 SQL 语句。 - 对于涉及多个操作的事务(如转账示例),需要手动管理事务。可以通过以下方式关闭自动提交:
SET @@autocommit = 0;
具体操作步骤:
-- 开始事务
START TRANSACTION;
-- 查询张三的余额,确保有足够金额可以转账
SELECT money FROM account WHERE name = 'zhangsan';
-- 如果余额充足,继续进行转账操作
-- 将张三的账户余额减少1000元
UPDATE account SET money = money - 1000 WHERE name = 'zhangsan';
-- 将李四的账户余额增加1000元
UPDATE account SET money = money + 1000 WHERE name = 'lisi';
-- 提交事务,所有操作确认成功
COMMIT;
-- 如果在操作过程中发生错误,执行以下操作回滚
-- ROLLBACK;
- 开始事务:通过
START TRANSACTION
语句启动事务,使得接下来的操作都在同一个事务范围内执行。 - 执行查询和更新操作:进行必要的查询和更新操作,以确保资金在账户间正确转移。
- 提交事务:通过
COMMIT
语句将所有操作提交,使得这些更改永久生效。 - 回滚事务:如果在事务过程中发生任何错误或异常,可以使用
ROLLBACK
语句撤销所有更改,将数据恢复到事务开始前的状态。
ACID
- 原子性(Atomicity):事务是不可分割的最小单元,要么全部成功,要么全部失败。
- 一致性(Consistency):事务完成时,必须使所有的数据都保持一致状态。
- 隔离性(Isolation):数据库提供的隔离机制,保证事务在不受外部并发操作影响的独立环境下运行。
- 持久性(Durability):事务一旦提交或回滚,它对数据库的数据的改变是永久的。
并发事务问题
脏读 (Dirty Read)
脏读发生在一个事务读取了另一个事务尚未提交的更改。如果读取的事务进行了回滚,那么读到的数据就变成了从未正式存在过的“脏”数据。
解决方法:通过提高事务的隔离级别来避免脏读。MySQL 提供的 读已提交(Read Committed)
、可重复读(Repeatable Read)
和 串行化(Serializable)
隔离级别都可以防止脏读问题的发生。
- 读未提交(Read Uncommitted):可能发生脏读。
- 读已提交(Read Committed):防止脏读,只允许读取已经提交的数据。
不可重复读
不可重复读指的是在同一事务中,前后两次读取同一数据时,读取到的结果不同。这是因为在两次读取之间,另一个事务对该数据进行了更新并提交。不可重复读的问题在于数据的一致性无法保证。
解决方法:通过设置更高的隔离级别,如 可重复读(Repeatable Read)
,可以避免不可重复读的问题。
- 读已提交(Read Committed):可能发生不可重复读。事务中的每次读取都会获取最新的已提交数据。
- 可重复读(Repeatable Read):解决不可重复读问题,保证在同一事务中多次读取同一数据的结果是一致的。
可重复读如何解决?
可重复读(Repeatable Read) 通过使用 多版本并发控制(MVCC) 或 锁机制 来确保事务在其生命周期内读取到的数据是固定的,即在同一个事务中多次读取同一行数据时,结果总是相同的。
1. 多版本并发控制(MVCC)
在 MySQL 的 InnoDB 存储引擎中,可重复读隔离级别通过 MVCC 来实现一致性读取。MVCC 通过创建数据的快照(snapshot)来避免读取其他事务未提交的数据,确保同一事务内的数据读取一致。
- 读取快照:当事务 A 开始读取时,它会获取一个数据快照,即该时刻的数据状态。事务 A 后续的所有读取操作都基于这个快照,而不是实时数据。
- 版本链:每条记录都有多个版本,通过隐藏的事务 ID 和版本链来管理。在事务 A 开始时,它只会读取在其开始前已经提交的数据版本,而忽略其他未提交或在其之后提交的版本。
2. 加锁机制
可重复读在某些情况下也会使用锁机制(如行锁),以确保在事务执行期间,其他事务不能修改事务 A 正在读取的数据行。
- 当事务 A 读取数据时,数据行会被锁定,其他事务(如事务 B)在 A 提交之前不能对这些数据行进行修改。即使 B 尝试修改数据,也会被阻塞直到 A 提交或回滚。
幻读
幻读发生在一个事务两次查询同一范围的数据时,第二次查询返回的结果集中包含了第一次查询没有的“幻影”行。这通常是因为在两次查询之间,另一个事务插入或删除了行。 解决方法:通过最高的隔离级别 串行化(Serializable)
或者使用锁机制来防止幻读。
- 可重复读(Repeatable Read):MySQL 默认隔离级别。虽然能够防止不可重复读,但可能发生幻读。
- 串行化(Serializable):通过对每个查询进行锁定,完全避免了幻读,但性能较低。
隔离级别
隔离级别 | 脏读 | 不可重复读 | 幻读 |
Read Uncommitted | √ | √ | √ |
Read committed | × | √ | √ |
Repeatable Read(默认) | × | × | √ |
Serializable | × | × | × |
Serializable
是隔离性最高的,但是性能是最差的;Read Uncommitted
是性能最好的,但是安全性最差。根据业务进行权衡。
事务的隔离级别查看与设置
-- 查看事务隔离级别
SELECT @@TRANSACTION_ISOLATION;
-- 设置事务隔离级别
SET [SESSION|GLOBAL] TRANSACTION ISOLATION LEVEL {READ UNCOMMITTED | READ COMMITTED | REPEATABLE READ | SERIALIZABLE}
总结
MySQL 提供了四种隔离级别,针对不同的并发问题提供不同程度的保护:
- 读未提交(Read Uncommitted):
- 可能发生脏读、不可重复读和幻读。
- 最低的隔离级别,几乎没有并发控制。
- 读已提交(Read Committed):
- 解决脏读问题,但仍可能发生不可重复读和幻读。
- 每次读取的数据都是最新已提交的结果。
- 可重复读(Repeatable Read):
- 解决脏读和不可重复读问题,但可能发生幻读。
- MySQL 的默认隔离级别,通过
MVCC
(多版本并发控制)来保证数据一致性。
- 串行化(Serializable):
- 解决脏读、不可重复读和幻读问题。
- 最高的隔离级别,但代价是降低并发性。事务以串行的方式执行,防止并发冲突。