Prisma 关联模型数据聚合与字段扩展查询指南

Prisma 关联模型数据聚合与字段扩展查询指南

本文深入探讨在Prisma中如何对关联模型的数据进行聚合(如求和),并同时获取关联实体的额外字段信息。针对Prisma groupBy操作当前不支持直接includeselect关联字段的限制,文章提出了一种分步查询的有效策略:首先使用groupBy完成数据聚合,然后通过迭代聚合结果,为每个分组单独查询并补充关联实体的详细信息,最终实现包含聚合数据和关联字段的完整输出。

在现代应用开发中,数据聚合是常见的需求,尤其是在处理具有一对多或多对多关系的模型时。例如,我们可能需要计算每个管理员(admins)的总支付金额(payment),并同时获取管理员的姓名等详细信息。prisma作为一款强大的orm,提供了groupby方法来实现数据聚合。然而,其在处理关联字段时存在一定的局限性。

Prisma groupBy操作的局限性

考虑以下两个Prisma模型定义,它们描述了管理员与其支付记录之间的关系:

model admins {   id        Int       @id @default(autoincrement())   name      String   last_name String   phone     String    @unique   email     String?   @unique   nic       String?   @unique   image     String?   payments  payment[] // 一个管理员可以有多条支付记录 }  model payment {   id          Int       @id @default(autoincrement())   amount      Int   description String?   date        DateTime? @db.Date   admin_id    Int   admins      admins    @relation(fields: [admin_id], references: [id]) // 支付记录属于一个管理员 }

为了获取每个管理员的支付总额,我们自然会想到使用prisma.payment.groupBy方法:

const data = await prisma.payment.groupBy({   by: ["admin_id"],   _sum: {     amount: true,   }, }); console.log(data);

上述查询会返回类似以下的结果:

[   { _sum: { amount: 1650 }, admin_id: 1 },   { _sum: { amount: 2000 }, admin_id: 2 } ]

这个结果包含了每个admin_id对应的支付总额。然而,实际需求往往希望在聚合结果中直接包含关联模型的字段,例如管理员的name和last_name,期望得到类似如下的结构:

[   { _sum: { amount: 1650 }, admin_id: 1, name: "admin-name-1", last_name: "admin-last-name-1" },   { _sum: { amount: 2000 }, admin_id: 2, name: "admin-name-2", last_name: "admin-last-name-2" } ]

遗憾的是,Prisma的groupBy操作目前(截至本文撰写时)不支持直接通过include或select来获取关联模型的字段。这意味着我们无法在一次groupBy查询中同时完成聚合和关联字段的获取。

两阶段查询策略实现关联字段扩展

针对Prisma groupBy的这一限制,我们可以采用一种分阶段的查询策略来达到目标。这种方法分为两个主要步骤:首先执行聚合查询,然后根据聚合结果补充关联模型的详细信息。

阶段一:聚合支付总额

第一步是利用groupBy方法,专注于计算每个管理员的支付总额。这一步与前面尝试的查询相同:

const paymentData = await prisma.payment.groupBy({   by: ["admin_id"],   _sum: {     amount: true,   }, });  // paymentData 示例: // [ //   { _sum: { amount: 1650 }, admin_id: 1 }, //   { _sum: { amount: 2000 }, admin_id: 2 } // ]

paymentData数组包含了每个admin_id及其对应的支付总额。

阶段二:补充管理员信息

获取到聚合数据后,我们可以遍历paymentData数组。对于数组中的每一个聚合结果,我们利用其admin_id去admins模型中查询对应的管理员详细信息(name和last_name),然后将这些信息合并到原有的聚合结果中。为了提高效率,特别是当paymentData包含大量分组时,我们应该使用promise.all来并发执行这些独立的管理员信息查询。

const dataWithAdminInfo = await Promise.all(paymentData.map(async (item) => {   // 对于每一个聚合结果,根据admin_id查询对应的管理员信息   const admin = await prisma.admins.findUnique({     where: { id: item.admin_id }   });    // 返回包含聚合数据和管理员信息的合并对象   return {     ...item, // 展开原有的聚合数据 (_sum, admin_id)     name: admin.name,     last_name: admin.last_name   }; }));  console.log(dataWithAdminInfo);

执行上述代码后,dataWithAdminInfo将包含我们期望的结构,即每个管理员的支付总额以及他们的姓名和姓氏:

[   { _sum: { amount: 1650 }, admin_id: 1, name: "John", last_name: "Doe" },   { _sum: { amount: 2000 }, admin_id: 2, name: "Jane", last_name: "Smith" }   // ...更多管理员数据 ]

性能考量与最佳实践

虽然上述两阶段查询策略能够有效解决问题,但在处理极大规模数据时,仍需考虑其潜在的性能影响。

  1. N+1 查询问题: 尽管使用了Promise.all来并发执行管理员信息查询,但本质上,对于paymentData中的每一个独立admin_id,都会发起一次findUnique查询。如果paymentData包含N个不同的admin_id,这将导致1次groupBy查询 + N次findUnique查询。对于小到中等规模的数据集,这通常不是问题,但对于包含成千上万个唯一admin_id的超大型数据集,这种模式可能会增加数据库负载和查询延迟。

  2. 替代方案(针对超大数据集):

    • 原始 sql 查询: 对于对性能要求极高或数据集极其庞大的场景,直接使用Prisma的$queryRaw或$queryRawUnsafe方法执行原始SQL查询可能是更优的选择。通过SQL的JOIN和GROUP BY操作,可以在数据库层面一次性完成聚合和关联字段的获取,避免多次往返数据库。
      SELECT     a.id AS admin_id,     a.name,     a.last_name,     SUM(p.amount) AS totalAmount FROM     admins AS a JOIN     payment AS p ON a.id = p.admin_id GROUP BY     a.id, a.name, a.last_name;
    • 批量查询优化: 如果不希望使用原始SQL,且N+1问题确实影响性能,可以考虑先收集所有唯一的admin_id,然后使用prisma.admins.findMany({ where: { id: { in: uniqueAdminIds } } })一次性查询所有管理员信息,最后在内存中将聚合数据与管理员信息进行匹配。这种方法将N次findUnique减少为1次findMany,但增加了内存匹配的复杂性。
  3. Prisma 发展: Prisma是一个活跃开发的ORM框架,其功能不断完善。未来的版本可能会直接支持在groupBy查询中include或select关联字段,届时可以简化此类复杂查询的实现。

总结

尽管Prisma的groupBy方法在当前版本中不支持直接获取关联模型的字段,但通过本文介绍的两阶段查询策略,我们能够有效地实现对关联数据的聚合,并成功地将关联实体的详细信息整合到聚合结果中。在实践中,对于大多数场景,利用Promise.all并发执行查询的方案是高效且易于维护的。然而,对于处理极大规模数据集的场景,开发者应根据具体性能需求,考虑采用原始SQL查询等更底层的优化手段。

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享