Prisma groupBy 结合关联数据获取：实现聚合与关联字段的查询-小浪学习网

Prisma groupBy 结合关联数据获取：实现聚合与关联字段的查询

本文旨在解决Prisma中groupBy聚合查询无法直接包含关联字段的限制。通过一个实际案例，详细阐述如何利用Prisma的groupBy功能进行数据聚合，并结合二次查询和JavaScript的异步处理能力，有效地将聚合结果与相关联的实体信息（如用户姓名）合并，从而获取一个既包含聚合数据又包含关联实体详情的完整数据集。

理解 Prisma groupBy 的应用与限制

在数据库操作中，聚合查询是常见的需求，例如计算某个字段的总和、平均值或计数。prisma 提供了强大的 groupby 功能来满足这类需求。考虑以下两个关联模型：

model admins {   id        Int       @id @default(autoincrement())   name      String   last_name String   phone     String    @unique   email     String?   @unique   nic       String?   @unique   image     String?   payments  payment[] }  model payment {   id          Int       @id @default(autoincrement())   amount      Int   description String?   date        DateTime? @db.Date   admin_id    Int   admins      admins    @relation(fields: [admin_id], references: [id]) }

假设我们需要查询每个管理员（admin）的总支付金额。我们可以使用 prisma.payment.groupBy 进行聚合：

const data = await prisma.payment.groupBy({   by: ["admin_id"],   _sum: {     amount: true,   }, }); console.log(data);

上述查询将返回如下格式的结果：

[   { "_sum": { "amount": 1650 }, "admin_id": 1 },   { "_sum": { "amount": 2000 }, "admin_id": 2 } ]

这个结果包含了每个 admin_id 对应的支付总额，但它缺少了管理员的 name 和 last_name 等关联信息。

核心限制： Prisma 的 groupBy 查询目前不支持直接使用 include 或 select 来获取关联模型的数据。这意味着你无法在一次 groupBy 查询中同时完成聚合和关联数据的加载。这是 Prisma 设计上的一个特点，旨在保持聚合操作的简洁和高效。

解决方案：分步查询与数据合并

为了解决 groupBy 无法直接获取关联字段的问题，我们可以采用分步查询并手动合并数据的方法。这种方法的核心思想是：

执行聚合查询： 首先，使用 groupBy 获取所需的聚合数据（例如，每个 admin_id 的总金额）。
获取关联信息： 针对聚合结果中的每个唯一 admin_id，执行一次单独的查询来获取对应的管理员详细信息。
合并数据： 将聚合结果与获取到的关联信息进行合并，形成最终所需的数据结构。

以下是具体的实现代码：

import { PrismaClient } from '@prisma/client';  const prisma = new PrismaClient();  async function getAdminPaymentTotalsWithDetails() {   // 步骤1: 执行聚合查询，获取每个管理员的支付总额   const paymentData = await prisma.payment.groupBy({     by: ["admin_id"],     _sum: {       amount: true,     },   });    // 步骤2 & 3: 遍历聚合结果，为每个admin_id获取关联的管理员信息并合并   const dataWithAdminInfo = await promise.all(     paymentData.map(async (item) => {       // 为每个聚合项查询对应的管理员详情       const admin = await prisma.admins.findUnique({         where: { id: item.admin_id },         select: { // 仅选择需要的字段以优化性能           name: true,           last_name: true         }       });        // 合并聚合数据和管理员信息       return {         ...item, // 包含 _sum 和 admin_id         name: admin?.name, // 使用可选链操作符以防admin不存在         last_name: admin?.last_name       };     })   );    console.log(dataWithAdminInfo);   return dataWithAdminInfo; }  // 调用函数 getAdminPaymentTotalsWithDetails()   .catch(e => {     console.error(e);     process.exit(1);   })   .finally(async () => {     await prisma.$disconnect();   });

上述代码的输出将符合预期：

[   {     "_sum": { "amount": 1650 },     "admin_id": 1,     "name": "admin-name-1",     "last_name": "admin-last-name-1"   },   {     "_sum": { "amount": 2000 },     "admin_id": 2,     "name": "admin-name-2",     "last_name": "admin-last-name-2"   } ]

注意事项与性能考量

Promise.all 的使用： 在上述解决方案中，我们使用了 Promise.all 来并发执行对每个 admin_id 的 findUnique 查询。这大大提高了效率，避免了串行查询可能导致的性能瓶颈。如果没有 Promise.all，每个 findUnique 查询都会等待上一个查询完成后再执行，这会非常慢。
select 优化： 在 findUnique 查询中，我们使用了 select: { name: true, last_name: true }。这是一个重要的性能优化点，它确保我们只从数据库中检索所需的字段，而不是整个 admin 对象，从而减少了数据传输量。
数据量考量： 对于聚合结果集非常庞大（例如，数万甚至数十万个不同的 admin_id）的场景，这种分步查询的方法可能会导致大量的数据库查询。在这种极端情况下，你可能需要考虑以下替代方案：
- 数据库视图或存储过程： 在数据库层面创建视图或存储过程，直接在数据库中完成聚合和关联，然后通过 Prisma 查询该视图或调用存储过程。
- Prisma 原生查询 ($queryRaw)： 如果复杂性超出了 Prisma ORM 的能力范围，可以直接使用 $queryRaw 或 $queryRawUnsafe 执行原生 sql 查询，充分利用数据库的聚合和 JOIN 能力。
- 数据缓存： 如果关联信息不经常变动，可以考虑将管理员信息缓存起来，减少对数据库的查询次数。
错误处理： 在实际应用中，需要对查询结果进行更健壮的错误处理，例如当 admin 未找到时（admin 可能为 NULL），确保代码不会抛出异常。上述代码中使用了可选链操作符 (admin?.name) 来增强健壮性。

总结

尽管 Prisma 的 groupBy 查询在设计上不允许直接包含关联字段，但通过结合其强大的查询API和JavaScript的异步处理能力，我们能够优雅地实现聚合数据与关联信息的高效合并。这种分步查询、并发执行和精细化选择字段的策略，是处理复杂数据查询需求时一个实用且高性能的模式。在面对大规模数据时，理解并权衡不同解决方案的性能影响至关重要。

文章版权归作者所有，未经允许请勿转载。

THE END