golang的singleflight机制通过合并重复请求防止缓存击穿。1. 它确保相同key的并发请求中只有一个goroutine执行实际操作,其余阻塞等待结果;2. 适用于缓存失效时避免数据库压力过大;3. 不适用于缓存穿透场景,需配合空对象或布隆过滤器使用;4. 存在局限性,如无法合并不同key的请求、错误共享和需合理设置超时。结合业务场景选择合适的缓存策略才能有效提升系统性能与一致性。
golang的singleflight机制,简单来说,就是用来合并重复的正在进行的请求。它能有效防止缓存击穿,特别是当大量并发请求同时请求一个不存在或已失效的缓存时,避免对数据库或底层服务的冲击。
解决方案
singleflight的核心思想是,对于相同的请求,只允许一个goroutine去执行,其他的goroutine会被阻塞,直到第一个goroutine执行完毕,然后将结果返回给所有等待的goroutine。这就像排队买票,只有一个窗口真正处理购票请求,其他人排队等待。
立即学习“go语言免费学习笔记(深入)”;
Golang标准库 sync/singleflight 提供了这个功能。使用起来也很简单:
import ( "fmt" "sync/singleflight" "time" ) var g singleflight.Group func getData(key string) (interface{}, error) { v, err, shared := g.Do(key, func() (interface{}, error) { // 模拟从数据库或底层服务获取数据 fmt.Println("fetching data for key:", key) time.Sleep(2 * time.Second) // 模拟耗时操作 return "data for " + key, nil }) fmt.Printf("key: %s, value: %v, shared: %vn", key, v, shared) return v, err } func main() { for i := 0; i < 5; i++ { go func() { data, err := getData("my_key") if err != nil { fmt.Println("error:", err) } else { fmt.Println("data:", data) } }() } time.Sleep(5 * time.Second) }
在这个例子中,g.Do 接收一个 key 和一个函数。如果 g 中已经存在一个正在执行的 key 对应的函数,那么后续的 g.Do 调用会被阻塞,直到第一个函数执行完毕。shared 变量指示结果是否被共享,即是否由其他goroutine计算得到。
缓存击穿场景下的应用
假设我们有一个缓存系统,当缓存失效时,会去数据库查询。如果没有singleflight,大量并发请求同时请求同一个失效的缓存,会导致大量请求直接打到数据库,造成数据库压力过大。
使用singleflight,可以保证只有一个请求去数据库查询,其他的请求等待第一个请求的结果,然后从缓存中获取。
缓存穿透与singleflight:是否适用?
缓存穿透指的是请求一个不存在的key,导致每次请求都穿透到数据库。 Singleflight在这种场景下作用有限。因为每次请求的都是不存在的key,所以singleflight无法合并请求。 解决缓存穿透的常见方法是:
-
缓存空对象: 如果数据库中不存在该key,则在缓存中设置一个空对象,下次再请求该key时,直接返回空对象。 需要注意的是,空对象也需要设置过期时间,避免占用过多缓存空间。
-
布隆过滤器: 在缓存之前使用布隆过滤器进行过滤,如果布隆过滤器判断key不存在,则直接返回,避免请求数据库。
Singleflight的局限性与注意事项
虽然singleflight很实用,但也有一些局限性:
- 适用场景: singleflight适用于计算密集型或者IO密集型,并且请求的key相同的场景。如果请求的key不同,singleflight无法合并请求。
- 错误处理: 如果第一个请求失败,那么所有的等待请求都会收到同样的错误。需要根据实际情况考虑是否需要重试。
- 超时控制: 需要设置合理的超时时间,避免请求长时间阻塞。 可以通过context来实现超时控制。
如何选择合适的缓存策略?
缓存策略的选择取决于具体的业务场景。没有一种缓存策略是万能的。
- 读多写少: 可以使用redis、memcached等缓存系统。
- 读少写多: 可以考虑使用本地缓存,例如golang的map。 需要注意的是,本地缓存需要考虑数据一致性问题。
- 对数据一致性要求高: 可以考虑使用强一致性缓存,例如etcd。
总而言之,理解singleflight的原理,并结合具体的业务场景,才能更好地使用它来解决缓存击穿的问题。