Node.js中如何实现缓存？-小浪学习网

答案：node.JS缓存策略分内存缓存和分布式缓存（如redis），前者适用于单实例、低复杂度场景，后者适合多实例、高并发环境；常用方案包括使用node-cache或lru-cache实现内存缓存，或通过ioredis连接Redis进行分布式缓存；缓存适用于降低数据库压力、提升响应速度、应对重复访问及昂贵计算；选择时需权衡一致性、扩展性与维护成本；失效策略推荐TTL结合Cache Aside模式，必要时引入Redis Pub/Sub实现实时失效。

Node.js中如何实现缓存？

在Node.js中实现缓存，核心上可以归结为两种主要策略：应用内部的内存缓存（In-Memory Cache）和外部的分布式缓存（如Redis）。选择哪种方式，很大程度上取决于你的应用规模、数据一致性要求以及对扩展性的考量。对于小型应用或特定数据，内存缓存简单高效；而对于需要跨服务共享数据、高可用性及大规模并发的场景，分布式缓存无疑是更健壮的选择。

解决方案

说实话，Node.js本身并没有一个“内置”的、开箱即用的高级缓存系统，这与它轻量级的哲学相符。所以，我们通常会借助第三方库或者外部服务来实现。

1. 内存缓存（In-Memory Cache）

这是最直接也最容易上手的方式。你可以简单地使用一个JavaScript对象或

map

来存储数据，或者利用一些成熟的库。

简单实现:

const myCache = new Map();  function getFromCache(key) {     return myCache.get(key); }  function setToCache(key, value, ttl = 60000) { // 默认TTL 60秒     myCache.set(key, value);     setTimeout(() => {         myCache.delete(key);     }, ttl); }  // 示例 // setToCache('user:123', { id: 123, name: 'Alice' }, 5000); // console.log(getFromCache('user:123')); // 应该能拿到 // setTimeout(() => console.log(getFromCache('user:123')), 6000); // 应该拿不到

这种方式虽然简单，但需要自己管理过期时间（TTL）。

使用第三方库（推荐：

node-cache

或

lru-cache

）: 像

node-cache

这样的库，它封装了过期管理、设置/获取等操作，用起来更方便。而

lru-cache

则实现了LRU（Least Recently Used）淘汰策略，非常适合缓存大小有限的场景。

以

node-cache

为例：

const NodeCache = require("node-cache"); const myCache = new NodeCache({ stdTTL: 100, checkperiod: 120 }); // 默认TTL 100秒  async function getUserData(userId) {     let user = myCache.get(`user:${userId}`);     if (user) {         console.log(`从缓存获取用户 ${userId}`);         return user;     }      console.log(`从数据库获取用户 ${userId}`);     // 模拟从数据库获取数据     user = await new Promise(resolve => setTimeout(() => resolve({ id: userId, name: `User ${userId}`, email: `user${userId}@example.com` }), 500));     myCache.set(`user:${userId}`, user, 30); // 特定key设置30秒过期     return user; }  // (async () => { //     await getUserData(1); // 第一次从DB //     await getUserData(1); // 第二次从缓存 //     await new Promise(resolve => setTimeout(resolve, 31000)); // 等待过期 //     await getUserData(1); // 再次从DB // })();

内存缓存的问题也很明显：它只在当前Node.js进程中有效。如果你的应用是多进程部署（PM2），或者有多个服务实例，那么每个实例都有自己的缓存，数据就可能不一致。而且，如果进程重启，缓存数据也就丢失了。

2. 分布式缓存（Distributed Cache – Redis是首选）

对于生产环境，尤其是微服务架构或需要高可用性的场景，Redis几乎是标准答案。Redis是一个内存数据结构存储，可以用作数据库、缓存和消息代理。它支持多种数据结构（字符串、哈希、列表、集合等），并且提供了持久化、主从复制、集群等高级功能。

基本用法（使用

ioredis

库）:

const Redis = require("ioredis"); const redis = new Redis({     port: 6379,          // Redis port     host: "127.0.0.1",   // Redis host     // password: "auth", // 如果有密码     db: 0, });  async function getProductData(productId) {     let product = await redis.get(`product:${productId}`);     if (product) {         console.log(`从Redis获取产品 ${productId}`);         return json.parse(product); // Redis存储的是字符串     }      console.log(`从数据库获取产品 ${productId}`);     // 模拟从数据库获取数据     product = await new Promise(resolve => setTimeout(() => resolve({ id: productId, name: `Product ${productId}`, price: 99.99 }), 800));     await redis.set(`product:${productId}`, JSON.stringify(product), 'EX', 60); // 设置60秒过期     return product; }  // (async () => { //     await getProductData(101); // 第一次从DB //     await getProductData(101); // 第二次从Redis //     // await redis.del(`product:101`); // 手动清除缓存 //     await getProductData(101); // 再次从DB (如果手动清除了) // })();

Redis的优势在于：

数据共享: 多个Node.js实例可以共享同一个Redis缓存，保证数据一致性。
持久化: 可以配置RDB或AOF进行数据持久化，防止重启丢失。
高性能: 内存操作，速度极快。
丰富的数据结构: 不仅仅是简单的键值对，还能做很多高级操作。
高可用性与扩展性: 支持主从复制、哨兵模式和集群，能满足高并发、高可用的需求。

当然，引入Redis也意味着增加了系统的复杂性，你需要部署和维护Redis服务，并考虑网络延迟、连接池管理等问题。但就实际价值而言，这点投入往往是值得的。

Node.js应用中何时以及为何需要引入缓存机制？

在我看来，引入缓存机制，说到底是为了解决“慢”和“贵”的问题。当你的Node.js应用遇到以下几种情况时，就该认真考虑缓存了：

数据库负载过高： 频繁地查询数据库是性能瓶颈的常见根源。如果你的数据库CPU或I/O经常跑满，响应时间变长，那很可能是因为大量的重复查询压垮了它。缓存能有效拦截这些查询，减少数据库的压力。
响应时间不理想： 用户体验对现代应用至关重要。如果某个API的响应时间经常超过几百毫秒甚至一两秒，用户很可能就会感到不耐烦。缓存能够显著缩短数据获取时间，提升API的响应速度。
数据访问模式重复且数据变化不频繁： 很多数据，比如商品详情、文章内容、配置信息、用户基本资料等，在短时间内不会频繁变动，但会被大量用户反复访问。这些数据是缓存的绝佳候选。
计算密集型操作结果： 有些操作可能需要复杂的计算或聚合，耗时较长。如果这些计算的结果在一定时间内是稳定的，那么缓存这些结果，下次直接取用，能大幅节省计算资源。
外部服务调用频繁且耗时： 比如调用第三方API获取汇率、天气数据等。这些外部调用不仅有网络延迟，还可能受到调用频率限制。缓存这些结果可以减少对外部服务的依赖，提高自身服务的稳定性。

简而言之，缓存就像是应用和它所依赖的慢速资源（数据库、外部服务、复杂计算）之间的一个快速通道。它用少量的内存和一点点逻辑复杂性，换取了巨大的性能提升和资源节约。

在Node.js中选择何种缓存策略，是内存缓存还是外部缓存？

选择缓存策略，我个人觉得没有绝对的对错，只有适不适合。这真的需要你结合项目的实际情况来权衡。

内存缓存（In-Memory Cache）的适用场景与局限性：
- 适用场景：
  - 单体应用或单进程Node.js服务： 如果你的应用不需要水平扩展，或者只运行在一个Node.js进程中，内存缓存是最简单、最快的选择。
  - 缓存数据量不大： 内存是有限的，如果你的缓存数据量很大，可能会导致Node.js进程内存溢出。
  - 对数据一致性要求不高： 比如一些统计数据、不那么重要的配置项，即使偶尔出现不一致也能接受。
  - 开发和部署简单： 无需额外服务，引入一个库即可。
- 局限性：
  - 无法跨进程/服务共享： 这是最大的痛点。一旦你的应用需要多进程或多实例部署，每个实例的缓存都是独立的，数据一致性就成了问题。
  - 进程重启数据丢失： 任何进程的重启都会导致缓存清空，这意味着重启后首次请求仍会打到后端资源。
  - 内存限制： 容易受到Node.js进程可用内存的限制，不适合缓存大量数据。
  - 淘汰策略需手动或库管理： 如果不使用LRU等策略，很容易导致内存泄漏或缓存命中率下降。
外部缓存（分布式缓存，如Redis）的适用场景与权衡：
- 适用场景：
  - 微服务架构或多实例部署： 这是Redis的杀手级应用场景，所有服务实例共享同一个缓存，保证数据一致性。
  - 高并发、大数据量： Redis能处理极高的并发请求，并且可以配置持久化，数据丢失风险小。
  - 需要高级缓存功能： 例如发布/订阅模式用于缓存失效通知、原子操作、排行榜等。
  - 对数据一致性有较高要求： 通过集中式管理，更容易实现缓存与数据库之间的数据同步。
  - 需要持久化： 即使Redis服务重启，数据也能通过RDB/AOF恢复。
- 权衡：
  - 引入额外复杂性： 你需要部署、维护Redis服务，考虑其高可用、监控、备份等。
  - 网络延迟： 客户端与Redis服务器之间的网络通信会引入一定的延迟，虽然通常很低，但相比内存缓存还是会多一点。
  - 成本： 部署和运行Redis服务需要额外的服务器资源或云服务费用。

我的建议是，对于初创项目或原型，从简单的内存缓存开始无可厚非。但一旦项目开始增长，需要水平扩展，或者面临高并发挑战，那么果断切换到Redis这样的分布式缓存是明智之举。不要等到问题爆发了才去考虑，那样会更被动。

如何有效管理Node.js缓存的失效与更新策略？

缓存失效与更新是缓存策略中最复杂也最容易出错的部分，它直接关系到你提供的数据是新鲜的还是过时的。在我看来，这几个策略是你在实践中必须考虑的：

TTL (Time To Live) – 基于时间的失效： 这是最常见也是最简单的失效策略。你给缓存项设置一个生命周期，时间一到，缓存自动失效。
- 优点： 实现简单，无需额外逻辑。
- 缺点： 无法立即反映源数据的变化。如果数据在TTL过期前发生了更新，用户会看到旧数据。
- 适用场景： 数据变化不频繁，或者对实时性要求不高的场景，比如热门文章列表（每5分钟更新一次可以接受）、配置信息等。
- 实践： 在
  node-cache
  或Redis的
```
SETEX
```
  命令中直接设置过期时间。选择合适的TTL很重要，太短会降低命中率，太长则可能导致数据过时。
LRU (Least Recently Used) – 基于使用频率的淘汰： 当缓存达到预设的最大容量时，淘汰最长时间未被访问的缓存项。
- 优点： 能够保留最“有用”的数据，提高缓存命中率。
- 缺点： 无法保证数据的新鲜度，同样存在数据过时的问题。
- 适用场景： 缓存空间有限，且访问模式符合“热点数据”规律的场景。
- 实践： 使用
  lru-cache
  这样的库，或者Redis的
```
maxmemory-policy
```
  配置。
Cache Aside (旁路缓存) 模式： 这是最常用的缓存模式之一。
- 读操作：
  1. 先从缓存中读取数据。
  2. 如果命中，直接返回。
  3. 如果未命中，从数据库（或其他源）读取数据。
  4. 将数据放入缓存，并设置过期时间。
  5. 返回数据。
- 写操作：
  1. 先更新数据库。
  2. 然后删除缓存中的对应数据（而不是更新缓存）。
- 优点： 简单直观，能有效避免脏读（虽然有短暂不一致窗口）。删除缓存而不是更新，是为了避免并发写时缓存与数据库不一致的复杂性。
- 缺点： 第一次请求未命中时，会有一个延迟。如果写操作频繁，缓存命中率可能会受影响。
- 实践： 这就是前面Redis示例中
```
getProductData
```
  函数所采用的模式。
Write Through (直写) 模式：
- 写操作：
  1. 同时更新数据库和缓存。
- 优点： 缓存和数据库的数据总是保持一致。
- 缺点： 写入延迟增加（需要同时操作两个存储）。如果缓存写入失败，可能导致数据不一致。
- 适用场景： 对数据一致性要求极高，且写操作不那么频繁的场景。但说实话，在Node.js中，我很少看到直接使用这种模式，因为它的复杂性和潜在问题。
Write Back (回写) 模式：
- 写操作：
  1. 只更新缓存。
  2. 缓存中的数据会在某个时机（比如批量、定时或缓存淘汰时）异步写入数据库。
- 优点： 写入速度快。
- 缺点： 数据丢失风险（如果缓存服务在数据写入数据库前崩溃）。实现复杂。
- 适用场景： 对写入性能要求极高，且能容忍少量数据丢失的场景。在Node.js应用层面，我很少直接实现，这更多是底层存储系统（如操作系统文件系统）的策略。

更高级的缓存失效：发布/订阅模式

对于分布式缓存（如Redis），当你需要更精细、更实时的缓存失效控制时，可以考虑结合Redis的Pub/Sub（发布/订阅）模式。

场景： 当数据库中的某个数据被更新时，数据库服务（或一个专门的缓存管理服务）可以向一个Redis频道发布一条消息，通知所有订阅者（你的Node.js服务实例）某个key已经失效。
Node.js服务： 订阅这个频道，收到消息后，主动从本地或Redis中删除对应的缓存项。
优点： 几乎实时地使所有相关缓存失效，保证数据最新。
缺点： 增加了系统的复杂性，需要额外的消息发布机制。

总的来说，管理缓存失效是一个权衡的过程。没有银弹，你需要根据你的业务场景、数据特性和对实时性的要求，选择最合适的策略组合。我通常会从TTL结合Cache Aside开始，如果遇到一致性挑战，再考虑引入Pub/Sub或其他更复杂的机制。记住，缓存是为了解决问题，而不是制造新的复杂性。

文章版权归作者所有，未经允许请勿转载。

THE END