Prisma：实现关联数据分组聚合与字段扩展的策略-小浪学习网

Prisma：实现关联数据分组聚合与字段扩展的策略

本文探讨了在Prisma中对关联模型数据进行分组聚合，并同时获取关联模型额外字段的策略。针对Prisma groupBy操作无法直接使用include或select来扩展关联字段的限制，教程详细介绍了如何通过两次查询和数据映射来高效实现这一需求，确保在聚合结果中包含所需的关联实体信息，提升数据查询的灵活性和实用性。

1. 理解需求与Prisma模型结构

在许多数据管理场景中，我们需要对关联数据进行分组聚合。例如，在一个包含“管理员（admins）”和“支付（payment）”的模型系统中，我们可能需要统计每位管理员的总支付金额，并同时在结果中包含管理员的姓名等基本信息。

以下是示例的Prisma模型定义：

model admins {   id        Int       @id @default(autoincrement())   name      String   last_name String   phone     String    @unique   email     String?   @unique   nic       String?   @unique   image     String?   payments  payment[] // 管理员可以有多个支付记录 }  model payment {   id          Int       @id @default(autoincrement())   amount      Int   description String?   date        DateTime? @db.Date   admin_id    Int       // 外键，关联到admins表的id   admins      admins    @relation(fields: [admin_id], references: [id]) // 关联到admins模型 }

我们的目标是获取每个管理员的总支付金额，并且在结果中包含该管理员的name和last_name字段。

2. Prisma groupBy 的基本使用与限制

Prisma提供了 groupBy 方法用于对数据进行分组聚合。例如，要获取每个管理员的总支付金额，可以这样查询：

const paymentTotals = await prisma.payment.groupBy({   by: ["admin_id"],   _sum: {     amount: true,   }, });  console.log(paymentTotals);

执行上述查询，Prisma会返回一个数组，其中每个元素包含 admin_id 和该管理员对应的支付总额，例如：

[   { _sum: { amount: 1650 }, admin_id: 1 },   { _sum: { amount: 2000 }, admin_id: 2 } ]

然而，groupBy 方法存在一个重要的限制：它不支持直接使用 include 或 select 来包含关联模型的字段。这意味着我们无法在一次 groupBy 查询中同时获取 admin 的 name 和 last_name。如果尝试这样做，Prisma会抛出错误。

我们期望的最终结果是每个聚合项都能包含管理员的姓名信息，例如：

[   {      _sum: { amount: 1650 },      admin_id: 1,      name: "admin-name",      last_name: "admin-last-name"   },   // ... 其他管理员 ]

3. 解决方案：分步查询与数据映射

鉴于 groupBy 的限制，最常见的解决方案是执行两次查询并进行数据映射。这种方法既高效又灵活，能够满足在聚合结果中扩展关联字段的需求。

3.1 步骤一：执行分组聚合查询

首先，我们像之前一样，使用 groupBy 查询获取每个 admin_id 对应的支付总额：

const paymentData = await prisma.payment.groupBy({   by: ["admin_id"],   _sum: {     amount: true,   }, });  // paymentData 示例: // [ //   { _sum: { amount: 1650 }, admin_id: 1 }, //   { _sum: { amount: 2000 }, admin_id: 2 } // ]

3.2 步骤二：获取关联实体信息并合并

接下来，我们需要遍历 paymentData 数组。对于数组中的每一个 admin_id，我们执行一次 prisma.admins.findUnique 查询来获取对应的管理员信息（name 和 last_name），然后将这些信息合并到聚合结果中。

为了提高效率，特别是当 paymentData 数组较大时，我们应该使用 promise.all 来并行执行所有 findUnique 查询，而不是串行执行，以避免潜在的性能瓶颈（N+1查询问题）。

const dataWithAdminInfo = await Promise.all(paymentData.map(async (item) => {   // 根据admin_id查询对应的管理员信息   const admin = await prisma.admins.findUnique({     where: { id: item.admin_id },     select: { // 仅选择需要的字段，减少数据传输       name: true,       last_name: true     }   });    // 将管理员信息合并到聚合结果中   return {     ...item, // 包含 _sum 和 admin_id     name: admin?.name, // 使用可选链操作符以防admin为null     last_name: admin?.last_name   }; }));  console.log(dataWithAdminInfo);

通过上述代码，dataWithAdminInfo 将包含我们期望的结构：

[   {      _sum: { amount: 1650 },      admin_id: 1,      name: "Admin Name 1",      last_name: "Admin Last Name 1"   },   {      _sum: { amount: 2000 },      admin_id: 2,      name: "Admin Name 2",      last_name: "Admin Last Name 2"   }   // ... ]

4. 注意事项与性能考量

N+1 查询问题缓解: 虽然这种方法本质上是“N+1”查询模式（一次 groupBy 查询，N次 findUnique 查询），但通过使用 Promise.all，我们将这N次查询并行化，大大减少了总的等待时间，使其在多数情况下都能接受。
字段选择: 在 findUnique 查询中，使用 select 语句只选择 name 和 last_name 字段。这有助于减少从数据库传输的数据量，优化性能。
索引: 确保 payment 表的 admin_id 字段和 admins 表的 id 字段上都有合适的索引。这将极大地提高 groupBy 和 findUnique 查询的性能。
大数据量处理: 对于拥有数百万甚至更多记录的超大型数据集，如果并行查询的开销仍然过高，可能需要考虑更高级的策略，例如：
- 在数据库层面创建视图（View）来预聚合数据。
- 使用原始 sql 查询（prisma.$queryRaw）来执行复杂的联接和聚合操作。
- 在数据仓库或etl流程中进行离线聚合。但对于大多数常见的应用场景，上述的分步查询加 Promise.all 策略是完全足够且高效的。

5. 总结

尽管Prisma的 groupBy 方法在聚合时不支持直接 include 或 select 关联字段，但通过“分步查询与数据映射”的策略，我们可以优雅地解决这一问题。首先执行 groupBy 聚合，然后利用 Promise.all 并行查询关联数据并进行合并。这种方法兼顾了代码的清晰性、可维护性以及在多数情况下的良好性能，是处理此类需求时的推荐实践。

文章版权归作者所有，未经允许请勿转载。

THE END

前端教学
# 数据库 # ai # sql # select # include # promise # etl