sql死锁本质是多个事务 循环 等待对方持有的锁,典型原因包括交叉更新多表、非唯一索引范围更新、加锁顺序不一致及长事务频繁更新;可通过错误日志、SHOW ENGINE INNODB STATUS 定位,解决策略有重试机制、统 一加 锁顺序、减小事务粒度、优化索引与锁类型及加强监控压测。

SQL 死锁本质是两个或多个事务相互等待对方持有的锁,形成循环等待,导致所有相关事务都无法继续执行。
典型产生原因
数据库 在并发 环境下,为保证数据一致性,对资源加锁。当多个事务以不同顺序访问相同资源(如多张表、同一张表的不同行),且持 有锁 后又申请对方已持有的锁,就容易触发死锁。
常见死锁场景
- 交叉更新多张表:事务 A 先更新 user 表再更新 order 表;事务 B 反向操作——先更新 order 再更新 user。若两者同时执行,可能各自持有一把锁并等待另一把。
- 非唯一索引上的范围更新 :例如 UPDATE orders SET status=1 WHERE create_time > ‘2024-01-01’,若 create_time 无唯一约束,mysql 可能对索引区间加间隙锁(Gap Lock),多个事务扫描重叠范围时易锁冲突。
- 未按约定顺序加锁:业务逻辑中对同一组记录,有的事务按 id 升序更新,有的按 name 排序更新,底层获取行锁的顺序不一致,埋下死锁隐患。
- 长事务 + 频繁更新:一个事务持续时间过长,期间其他事务反复尝试修改其涉及的数据,增大锁竞争概率。
快速定位与分析方法
以 MySQL 为例,可通过以下方式确认死锁:
- 查看错误日志:出现 Deadlock found when trying to get lock 字样,并附带死锁详情(包括每个事务正在执行的 SQL、持有 / 等待的锁类型和行信息)。
- 执行 SHOW ENGINE INNODB STATUSG:输出中 LATEST DETECTED DEADLOCK 段会完整展示最近一次死锁的参与者、sql 语句、锁状态及事务 堆栈。
- 开启死锁检测日志(如 performance_schema.data_locks + events_statements_history_long)辅助回溯。
实用解决与规避策略
- 应用层重试机制 :捕获死锁异常(mysql 错误 码 1213),自动回滚并重试事务(建议加随机退避,避免重试风暴)。
- 统一 DML 操作顺序:对涉及多表或多行的更新,约定固定顺序(如按主键 ID 升序、按表名字母序),确保所有事务加锁路径一致。
- 减少事务粒度 :只在真正需要原子性的地方开启事务,避免把查询、日志、http 调用等无关操作包进事务里。
- 合理使用索引与锁类型:确保 WHERE 条件走高效索引,避免全表扫描引发大量行锁;必要时用select … FOR UPDATE 配合具体主键值,而非模糊条件。
- 监控与压测提前暴露:在上线前对高并发路径做压力测试,结合慢日志、锁等待指标(如 InnoDB_row_lock_waits)识别潜在风险点。