Prisma:实现关联数据分组聚合与字段扩展的策略

Prisma:实现关联数据分组聚合与字段扩展的策略

本文探讨了在Prisma中对关联模型数据进行分组聚合,并同时获取关联模型额外字段的策略。针对Prisma groupBy操作无法直接使用includeselect来扩展关联字段的限制,教程详细介绍了如何通过两次查询和数据映射来高效实现这一需求,确保在聚合结果中包含所需的关联实体信息,提升数据查询的灵活性和实用性。

1. 理解需求与Prisma模型结构

在许多数据管理场景中,我们需要对关联数据进行分组聚合。例如,在一个包含“管理员(admins)”和“支付(payment)”的模型系统中,我们可能需要统计每位管理员的总支付金额,并同时在结果中包含管理员的姓名等基本信息。

以下是示例的Prisma模型定义:

model admins {   id        Int       @id @default(autoincrement())   name      String   last_name String   phone     String    @unique   email     String?   @unique   nic       String?   @unique   image     String?   payments  payment[] // 管理员可以有多个支付记录 }  model payment {   id          Int       @id @default(autoincrement())   amount      Int   description String?   date        DateTime? @db.Date   admin_id    Int       // 外键,关联到admins表的id   admins      admins    @relation(fields: [admin_id], references: [id]) // 关联到admins模型 }

我们的目标是获取每个管理员的总支付金额,并且在结果中包含该管理员的name和last_name字段。

2. Prisma groupBy 的基本使用与限制

Prisma提供了 groupBy 方法用于对数据进行分组聚合。例如,要获取每个管理员的总支付金额,可以这样查询:

const paymentTotals = await prisma.payment.groupBy({   by: ["admin_id"],   _sum: {     amount: true,   }, });  console.log(paymentTotals);

执行上述查询,Prisma会返回一个数组,其中每个元素包含 admin_id 和该管理员对应的支付总额,例如:

[   { _sum: { amount: 1650 }, admin_id: 1 },   { _sum: { amount: 2000 }, admin_id: 2 } ]

然而,groupBy 方法存在一个重要的限制:它不支持直接使用 include 或 select 来包含关联模型的字段。这意味着我们无法在一次 groupBy 查询中同时获取 admin 的 name 和 last_name。如果尝试这样做,Prisma会抛出错误。

我们期望的最终结果是每个聚合项都能包含管理员的姓名信息,例如:

[   {      _sum: { amount: 1650 },      admin_id: 1,      name: "admin-name",      last_name: "admin-last-name"   },   // ... 其他管理员 ]

3. 解决方案:分步查询与数据映射

鉴于 groupBy 的限制,最常见的解决方案是执行两次查询并进行数据映射。这种方法既高效又灵活,能够满足在聚合结果中扩展关联字段的需求。

3.1 步骤一:执行分组聚合查询

首先,我们像之前一样,使用 groupBy 查询获取每个 admin_id 对应的支付总额:

const paymentData = await prisma.payment.groupBy({   by: ["admin_id"],   _sum: {     amount: true,   }, });  // paymentData 示例: // [ //   { _sum: { amount: 1650 }, admin_id: 1 }, //   { _sum: { amount: 2000 }, admin_id: 2 } // ]

3.2 步骤二:获取关联实体信息并合并

接下来,我们需要遍历 paymentData 数组。对于数组中的每一个 admin_id,我们执行一次 prisma.admins.findUnique 查询来获取对应的管理员信息(name 和 last_name),然后将这些信息合并到聚合结果中。

为了提高效率,特别是当 paymentData 数组较大时,我们应该使用 promise.all 来并行执行所有 findUnique 查询,而不是串行执行,以避免潜在的性能瓶颈(N+1查询问题)。

const dataWithAdminInfo = await Promise.all(paymentData.map(async (item) => {   // 根据admin_id查询对应的管理员信息   const admin = await prisma.admins.findUnique({     where: { id: item.admin_id },     select: { // 仅选择需要的字段,减少数据传输       name: true,       last_name: true     }   });    // 将管理员信息合并到聚合结果中   return {     ...item, // 包含 _sum 和 admin_id     name: admin?.name, // 使用可选链操作符以防admin为null     last_name: admin?.last_name   }; }));  console.log(dataWithAdminInfo);

通过上述代码,dataWithAdminInfo 将包含我们期望的结构:

[   {      _sum: { amount: 1650 },      admin_id: 1,      name: "Admin Name 1",      last_name: "Admin Last Name 1"   },   {      _sum: { amount: 2000 },      admin_id: 2,      name: "Admin Name 2",      last_name: "Admin Last Name 2"   }   // ... ]

4. 注意事项与性能考量

  • N+1 查询问题缓解: 虽然这种方法本质上是“N+1”查询模式(一次 groupBy 查询,N次 findUnique 查询),但通过使用 Promise.all,我们将这N次查询并行化,大大减少了总的等待时间,使其在多数情况下都能接受。
  • 字段选择: 在 findUnique 查询中,使用 select 语句只选择 name 和 last_name 字段。这有助于减少从数据库传输的数据量,优化性能。
  • 索引: 确保 payment 表的 admin_id 字段和 admins 表的 id 字段上都有合适的索引。这将极大地提高 groupBy 和 findUnique 查询的性能。
  • 大数据量处理: 对于拥有数百万甚至更多记录的超大型数据集,如果并行查询的开销仍然过高,可能需要考虑更高级的策略,例如:
    • 在数据库层面创建视图(View)来预聚合数据。
    • 使用原始 sql 查询(prisma.$queryRaw)来执行复杂的联接和聚合操作。
    • 在数据仓库或etl流程中进行离线聚合。 但对于大多数常见的应用场景,上述的分步查询加 Promise.all 策略是完全足够且高效的。

5. 总结

尽管Prisma的 groupBy 方法在聚合时不支持直接 include 或 select 关联字段,但通过“分步查询与数据映射”的策略,我们可以优雅地解决这一问题。首先执行 groupBy 聚合,然后利用 Promise.all 并行查询关联数据并进行合并。这种方法兼顾了代码的清晰性、可维护性以及在多数情况下的良好性能,是处理此类需求时的推荐实践。

© 版权声明
THE END
喜欢就支持一下吧
点赞12 分享