本文深入探讨在Prisma中如何对关联模型的数据进行聚合(如求和),并同时获取关联实体的额外字段信息。针对Prisma groupBy操作当前不支持直接include或select关联字段的限制,文章提出了一种分步查询的有效策略:首先使用groupBy完成数据聚合,然后通过迭代聚合结果,为每个分组单独查询并补充关联实体的详细信息,最终实现包含聚合数据和关联字段的完整输出。
在现代应用开发中,数据聚合是常见的需求,尤其是在处理具有一对多或多对多关系的模型时。例如,我们可能需要计算每个管理员(admins)的总支付金额(payment),并同时获取管理员的姓名等详细信息。prisma作为一款强大的orm,提供了groupby方法来实现数据聚合。然而,其在处理关联字段时存在一定的局限性。
Prisma groupBy操作的局限性
考虑以下两个Prisma模型定义,它们描述了管理员与其支付记录之间的关系:
model admins { id Int @id @default(autoincrement()) name String last_name String phone String @unique email String? @unique nic String? @unique image String? payments payment[] // 一个管理员可以有多条支付记录 } model payment { id Int @id @default(autoincrement()) amount Int description String? date DateTime? @db.Date admin_id Int admins admins @relation(fields: [admin_id], references: [id]) // 支付记录属于一个管理员 }
为了获取每个管理员的支付总额,我们自然会想到使用prisma.payment.groupBy方法:
const data = await prisma.payment.groupBy({ by: ["admin_id"], _sum: { amount: true, }, }); console.log(data);
上述查询会返回类似以下的结果:
[ { _sum: { amount: 1650 }, admin_id: 1 }, { _sum: { amount: 2000 }, admin_id: 2 } ]
这个结果包含了每个admin_id对应的支付总额。然而,实际需求往往希望在聚合结果中直接包含关联模型的字段,例如管理员的name和last_name,期望得到类似如下的结构:
[ { _sum: { amount: 1650 }, admin_id: 1, name: "admin-name-1", last_name: "admin-last-name-1" }, { _sum: { amount: 2000 }, admin_id: 2, name: "admin-name-2", last_name: "admin-last-name-2" } ]
遗憾的是,Prisma的groupBy操作目前(截至本文撰写时)不支持直接通过include或select来获取关联模型的字段。这意味着我们无法在一次groupBy查询中同时完成聚合和关联字段的获取。
两阶段查询策略实现关联字段扩展
针对Prisma groupBy的这一限制,我们可以采用一种分阶段的查询策略来达到目标。这种方法分为两个主要步骤:首先执行聚合查询,然后根据聚合结果补充关联模型的详细信息。
阶段一:聚合支付总额
第一步是利用groupBy方法,专注于计算每个管理员的支付总额。这一步与前面尝试的查询相同:
const paymentData = await prisma.payment.groupBy({ by: ["admin_id"], _sum: { amount: true, }, }); // paymentData 示例: // [ // { _sum: { amount: 1650 }, admin_id: 1 }, // { _sum: { amount: 2000 }, admin_id: 2 } // ]
paymentData数组包含了每个admin_id及其对应的支付总额。
阶段二:补充管理员信息
获取到聚合数据后,我们可以遍历paymentData数组。对于数组中的每一个聚合结果,我们利用其admin_id去admins模型中查询对应的管理员详细信息(name和last_name),然后将这些信息合并到原有的聚合结果中。为了提高效率,特别是当paymentData包含大量分组时,我们应该使用promise.all来并发执行这些独立的管理员信息查询。
const dataWithAdminInfo = await Promise.all(paymentData.map(async (item) => { // 对于每一个聚合结果,根据admin_id查询对应的管理员信息 const admin = await prisma.admins.findUnique({ where: { id: item.admin_id } }); // 返回包含聚合数据和管理员信息的合并对象 return { ...item, // 展开原有的聚合数据 (_sum, admin_id) name: admin.name, last_name: admin.last_name }; })); console.log(dataWithAdminInfo);
执行上述代码后,dataWithAdminInfo将包含我们期望的结构,即每个管理员的支付总额以及他们的姓名和姓氏:
[ { _sum: { amount: 1650 }, admin_id: 1, name: "John", last_name: "Doe" }, { _sum: { amount: 2000 }, admin_id: 2, name: "Jane", last_name: "Smith" } // ...更多管理员数据 ]
性能考量与最佳实践
虽然上述两阶段查询策略能够有效解决问题,但在处理极大规模数据时,仍需考虑其潜在的性能影响。
-
N+1 查询问题: 尽管使用了Promise.all来并发执行管理员信息查询,但本质上,对于paymentData中的每一个独立admin_id,都会发起一次findUnique查询。如果paymentData包含N个不同的admin_id,这将导致1次groupBy查询 + N次findUnique查询。对于小到中等规模的数据集,这通常不是问题,但对于包含成千上万个唯一admin_id的超大型数据集,这种模式可能会增加数据库负载和查询延迟。
-
替代方案(针对超大数据集):
- 原始 sql 查询: 对于对性能要求极高或数据集极其庞大的场景,直接使用Prisma的$queryRaw或$queryRawUnsafe方法执行原始SQL查询可能是更优的选择。通过SQL的JOIN和GROUP BY操作,可以在数据库层面一次性完成聚合和关联字段的获取,避免多次往返数据库。
SELECT a.id AS admin_id, a.name, a.last_name, SUM(p.amount) AS totalAmount FROM admins AS a JOIN payment AS p ON a.id = p.admin_id GROUP BY a.id, a.name, a.last_name;
- 批量查询优化: 如果不希望使用原始SQL,且N+1问题确实影响性能,可以考虑先收集所有唯一的admin_id,然后使用prisma.admins.findMany({ where: { id: { in: uniqueAdminIds } } })一次性查询所有管理员信息,最后在内存中将聚合数据与管理员信息进行匹配。这种方法将N次findUnique减少为1次findMany,但增加了内存匹配的复杂性。
- 原始 sql 查询: 对于对性能要求极高或数据集极其庞大的场景,直接使用Prisma的$queryRaw或$queryRawUnsafe方法执行原始SQL查询可能是更优的选择。通过SQL的JOIN和GROUP BY操作,可以在数据库层面一次性完成聚合和关联字段的获取,避免多次往返数据库。
-
Prisma 发展: Prisma是一个活跃开发的ORM框架,其功能不断完善。未来的版本可能会直接支持在groupBy查询中include或select关联字段,届时可以简化此类复杂查询的实现。
总结
尽管Prisma的groupBy方法在当前版本中不支持直接获取关联模型的字段,但通过本文介绍的两阶段查询策略,我们能够有效地实现对关联数据的聚合,并成功地将关联实体的详细信息整合到聚合结果中。在实践中,对于大多数场景,利用Promise.all并发执行查询的方案是高效且易于维护的。然而,对于处理极大规模数据集的场景,开发者应根据具体性能需求,考虑采用原始SQL查询等更底层的优化手段。