sql并发 冲突本质是事务间资源争用引发的逻辑矛盾,需通过可控复现、三类日志分析(INNODB STATUS/Error log/information_schema)、SQL 关联查询定位阻塞链,并从索引优化、缩短事务、调整隔离级别三方面根治。

SQL 并发冲突不是偶然报错,而是多个事务在读写同一数据时因资源争用触发的逻辑矛盾。关键不在“有没有冲突”,而在“怎么快速定位谁、在哪、为什么 冲突”。下面从复现到排查,讲清楚实用路径。
复现并发冲突的典型场景
不靠生产环境碰运气,用可控方式快速复现:
- 开两个 数据库 连接(如两个 mysql 客户端或 SSMS 窗口),都执行BEGIN TRANSACTION
- 连接 A 执行:select * FROM users WHERE id = 100 FOR UPDATE;(加行锁但不提交)
- 连接 B 立刻执行同样语句或UPDATE users SET name=’x’ WHERE id = 100;
- 此时 B 会卡住——这就是典型的锁等待;若 A 和 B 交叉操作不同行再回环更新,几秒内大概率触发死锁
- 注意:必须关闭自动提交(SET autocommit = 0;),否则事务一执行完就释放锁,看不到冲突
三类核心日志与状态入口
别只盯着报错信息,真正有用的线索藏在三个地方:
- SHOW ENGINE INNODB STATUSG:重点看 LATEST DETECTED DEADLOCK(最近死锁详情)和TRANSACTIONS 段中状态为 LOCK WaiT 的事务
- 错误日志(error log):开启 innodb_print_all_deadlocks = ON 后,每次死锁都会完整记录两个事务的 SQL、锁类型、索引、等待链
- information_schema 系统表 :INNODB_TRX 查活跃事务,INNODB_LOCK_WAITS查谁在等谁,用标准关联查询一眼看出阻塞源头
快速定位冲突 SQL 与事务链
一句 SQL 就能揪出正在互相卡住的事务:
SELECT r.trx_id AS waiting_trx_id, r.trx_query AS waiting_query, b.trx_id AS blocking_trx_id, b.trx_query AS blocking_query FROM information_schema.INNODB_LOCK_WAITS w JOIN information_schema.INNODB_TRX b ON b.trx_id = w.blocking_trx_id JOIN information_schema.INNODB_TRX r ON r.trx_id = w.requesting_trx_id;
结果里 waiting_query 是卡住的 SQL,blocking_query是它等着的那个 SQL。如果 blocking_query 为空,说明对方已提交或已断开,但锁还没释放完——这时要查 INNODB_TRX 里的 trx_state 和trx_started时间,判断是否是长事务拖着不提交。
索引与事务设计是根因所在
90% 的写冲突问题,其实跟 SQL 本身无关,而在于底层支撑没做对:
- UPDATE/delete的 WHERE 条件字段必须有索引,否则 InnoDB 会升级为表锁或间隙锁,波及大量无关行
- 事务越短越好——读完马上更新,不要“先查再算再改”,中间插入业务逻辑等于给锁留空档
- 考虑把隔离级别从默认的 REPEATABLE READ 降到 READ COMMITTED,能显著减少间隙锁使用
- 高频更新单行场景(如计数器),可用 UPDATE … SET cnt = cnt + 1 代替先查后更,避免应用层竞争
基本上就这些。复现是为了理解机制,排查是为了找到那个具体 SQL 和事务 ID,而优化永远落在索引、事务长度和隔离策略上。