sql读请求分流核心是读写分离 + 从库分组 路由 ,通过 GTID 版本对齐保障强一致性,结合多级缓存与代理层统一调度实现 负载均衡 与故障自动切换。

SQL 读请求分流和负载均衡,核心是把只读查询从主库卸载到多个从库,避免单点压力过大,同时保证数据一致性可控、路由 逻辑清晰、故障时能自动切换。
读写分离 + 从库分组路由
应用层或 中间件 识别 SQL 类型,INSERT/UPDATE/delete 走主库,select(不含 for UPDATE)走从库。不是所有 SELECT 都能读从库——比如刚写完立刻查,需强制走主库(即“读己之写”场景)。建议按业务模块或数据范围对从库分组,例如订单类读请求固定打到 group-1(含 2 台从库),用户类读请求走 group-2(另 2 台),便于容量规划与故障隔离。
- 用注释标记强一致性需求:SELECT /*master*/ id FROM order WHERE …
- 从库组内用轮询或权重方式分发请求,避免某台从库过热
- 监控从库延迟(Seconds_Behind_Master),延迟超阈值(如 500ms)自动剔除该节点
基于 Gtid 或位点的延迟感知路由
单纯看 Seconds_Behind_Master 不够准,尤其在大事务或网络抖动时。更可靠的方式是结合 GTID(mysql 5.6+)或 binlog 位点做“读取版本对齐”。应用提交写操作后,拿到当前 GTID_SET;后续读请求带上该 GTID_SET,路由中间件选择已同步该 GTID 的从库执行。这样能确保读到最新写入的数据,不依赖时间差判断。
- 适用于 金融、库存等对强一致性敏感的场景
- 需在客户端或代理层维护 GTID 上下文(如 ThreadLocal 存储最近写入的 gtid_executed)
- 从库必须开启 gtid_mode=ON,且主从 GTID 一致
多级缓存 + 数据库 兜底降级
不是所有读都要压到数据库。高频、低更新的读请求(如城市列表、商品类目)优先走 redis 或本地缓存;中频、有更新但容忍短时 stale 的(如用户资料、订单状态)可设较短 TTL 并配合主动失效;真正需要实时准确的(如账户余额、未读消息数)才穿透到数据库,并通过读写分离路由到合适从库。
- 缓存击穿场景加互斥锁,防止 DB 瞬时洪峰
- 当所有从库异常时,自动降级为读主库(需评估主库承受力)
- 关键 接口 配置熔断阈值(如从库连续 3 次超时),触发快速失败或降级
代理层统一调度(推荐中小规模落地)
直接改应用代码侵入性强,初期可用轻量代理如 MaxScale、proxySQL 或自研简单路由网关。它们能解析 SQL、识别读写、管理从库健康状态、支持权重 / 延迟 / 会话一致性等多种路由策略,并提供统计面板。上线前务必压测代理自身 性能瓶颈(如连接数、QPS、解析开销)。
- ProxySQL 支持 runtime 修改路由规则,无需重启
- 注意连接池复用:代理与 后端 DB 之间保持长连接,避免频繁建连消耗
- 开启 slow query 日志采集,识别未走从库的“漏网 SELECT”
不复杂但容易忽略的是:分流不是一劳永逸,得持续观察从库负载差异、复制延迟分布、慢查迁移效果。一次上线只是开始,真正的平衡在迭代中达成。