本文旨在解决Prisma中groupBy聚合查询无法直接包含关联字段的限制。通过一个实际案例,详细阐述如何利用Prisma的groupBy功能进行数据聚合,并结合二次查询和JavaScript的异步处理能力,有效地将聚合结果与相关联的实体信息(如用户姓名)合并,从而获取一个既包含聚合数据又包含关联实体详情的完整数据集。
理解 Prisma groupBy 的应用与限制
在数据库操作中,聚合查询是常见的需求,例如计算某个字段的总和、平均值或计数。prisma 提供了强大的 groupby 功能来满足这类需求。考虑以下两个关联模型:
model admins { id Int @id @default(autoincrement()) name String last_name String phone String @unique email String? @unique nic String? @unique image String? payments payment[] } model payment { id Int @id @default(autoincrement()) amount Int description String? date DateTime? @db.Date admin_id Int admins admins @relation(fields: [admin_id], references: [id]) }
假设我们需要查询每个管理员(admin)的总支付金额。我们可以使用 prisma.payment.groupBy 进行聚合:
const data = await prisma.payment.groupBy({ by: ["admin_id"], _sum: { amount: true, }, }); console.log(data);
上述查询将返回如下格式的结果:
[ { "_sum": { "amount": 1650 }, "admin_id": 1 }, { "_sum": { "amount": 2000 }, "admin_id": 2 } ]
这个结果包含了每个 admin_id 对应的支付总额,但它缺少了管理员的 name 和 last_name 等关联信息。
核心限制: Prisma 的 groupBy 查询目前不支持直接使用 include 或 select 来获取关联模型的数据。这意味着你无法在一次 groupBy 查询中同时完成聚合和关联数据的加载。这是 Prisma 设计上的一个特点,旨在保持聚合操作的简洁和高效。
解决方案:分步查询与数据合并
为了解决 groupBy 无法直接获取关联字段的问题,我们可以采用分步查询并手动合并数据的方法。这种方法的核心思想是:
- 执行聚合查询: 首先,使用 groupBy 获取所需的聚合数据(例如,每个 admin_id 的总金额)。
- 获取关联信息: 针对聚合结果中的每个唯一 admin_id,执行一次单独的查询来获取对应的管理员详细信息。
- 合并数据: 将聚合结果与获取到的关联信息进行合并,形成最终所需的数据结构。
以下是具体的实现代码:
import { PrismaClient } from '@prisma/client'; const prisma = new PrismaClient(); async function getAdminPaymentTotalsWithDetails() { // 步骤1: 执行聚合查询,获取每个管理员的支付总额 const paymentData = await prisma.payment.groupBy({ by: ["admin_id"], _sum: { amount: true, }, }); // 步骤2 & 3: 遍历聚合结果,为每个admin_id获取关联的管理员信息并合并 const dataWithAdminInfo = await promise.all( paymentData.map(async (item) => { // 为每个聚合项查询对应的管理员详情 const admin = await prisma.admins.findUnique({ where: { id: item.admin_id }, select: { // 仅选择需要的字段以优化性能 name: true, last_name: true } }); // 合并聚合数据和管理员信息 return { ...item, // 包含 _sum 和 admin_id name: admin?.name, // 使用可选链操作符以防admin不存在 last_name: admin?.last_name }; }) ); console.log(dataWithAdminInfo); return dataWithAdminInfo; } // 调用函数 getAdminPaymentTotalsWithDetails() .catch(e => { console.error(e); process.exit(1); }) .finally(async () => { await prisma.$disconnect(); });
上述代码的输出将符合预期:
[ { "_sum": { "amount": 1650 }, "admin_id": 1, "name": "admin-name-1", "last_name": "admin-last-name-1" }, { "_sum": { "amount": 2000 }, "admin_id": 2, "name": "admin-name-2", "last_name": "admin-last-name-2" } ]
注意事项与性能考量
- Promise.all 的使用: 在上述解决方案中,我们使用了 Promise.all 来并发执行对每个 admin_id 的 findUnique 查询。这大大提高了效率,避免了串行查询可能导致的性能瓶颈。如果没有 Promise.all,每个 findUnique 查询都会等待上一个查询完成后再执行,这会非常慢。
- select 优化: 在 findUnique 查询中,我们使用了 select: { name: true, last_name: true }。这是一个重要的性能优化点,它确保我们只从数据库中检索所需的字段,而不是整个 admin 对象,从而减少了数据传输量。
- 数据量考量: 对于聚合结果集非常庞大(例如,数万甚至数十万个不同的 admin_id)的场景,这种分步查询的方法可能会导致大量的数据库查询。在这种极端情况下,你可能需要考虑以下替代方案:
- 数据库视图或存储过程: 在数据库层面创建视图或存储过程,直接在数据库中完成聚合和关联,然后通过 Prisma 查询该视图或调用存储过程。
- Prisma 原生查询 ($queryRaw): 如果复杂性超出了 Prisma ORM 的能力范围,可以直接使用 $queryRaw 或 $queryRawUnsafe 执行原生 sql 查询,充分利用数据库的聚合和 JOIN 能力。
- 数据缓存: 如果关联信息不经常变动,可以考虑将管理员信息缓存起来,减少对数据库的查询次数。
- 错误处理: 在实际应用中,需要对查询结果进行更健壮的错误处理,例如当 admin 未找到时(admin 可能为 NULL),确保代码不会抛出异常。上述代码中使用了可选链操作符 (admin?.name) 来增强健壮性。
总结
尽管 Prisma 的 groupBy 查询在设计上不允许直接包含关联字段,但通过结合其强大的查询API和JavaScript的异步处理能力,我们能够优雅地实现聚合数据与关联信息的高效合并。这种分步查询、并发执行和精细化选择字段的策略,是处理复杂数据查询需求时一个实用且高性能的模式。在面对大规模数据时,理解并权衡不同解决方案的性能影响至关重要。