
本教程详细介绍了如何将包含父子关系信息的扁平化数组数据,转换为具有层级结构的嵌套数组。通过构建索引和迭代分配子元素,文章提供了一个通用的 php 解决方案,适用于处理如问答、评论树等多种场景,确保 数据结构 清晰、易于访问和管理。
在许多应用场景中,我们经常需要处理来自 数据库 或其他数据源的扁平化数据集,这些数据行之间存在着内在的父子关系。例如,一个问答系统可能包含问题和答案,其中答案关联到特定的问题;一个评论系统则可能包含多级回复。将这种扁平数据转换为嵌套的、具有层级结构的数组,不仅能更好地反映数据间的真实关系,也便于 前端 展示和业务逻辑处理。
问题描述:从扁平到层级
假设我们有一个包含“问题”和“答案”的数组,每个元素都有一个唯一的 PARTY_ID 和一个 PARENT_USER_CONTENT_ID,后者指向其父元素的 PARTY_ID。如果 PARENT_USER_CONTENT_ID 为空,则表示该元素是一个顶级元素(例如,一个问题)。
原始扁平数据示例:
$flatData = [[ 'TYPE' => 'Question', 'PARTY_ID' => 112, 'PARENT_USER_CONTENT_ID' => ''], ['TYPE'=>'Answer','PARTY_ID'=> 115,'PARENT_USER_CONTENT_ID'=> 112], ['TYPE'=>'Question','PARTY_ID'=> 113,'PARENT_USER_CONTENT_ID'=>''], ['TYPE' => 'Answer', 'PARTY_ID' => 116, 'PARENT_USER_CONTENT_ID' => 113], ['TYPE' => 'Answer', 'PARTY_ID' => 117, 'PARENT_USER_CONTENT_ID' => 112], // 112 有两个答案 ['TYPE' => 'Comment', 'PARTY_ID' => 118, 'PARENT_USER_CONTENT_ID' => 117], // 答案下的评论 ];
期望的层级结构示例:
立即学习“PHP 免费学习笔记(深入)”;
[[ 'TYPE' => 'Question', 'PARTY_ID' => 112, 'PARENT_USER_CONTENT_ID' => '','children'=> [ ['TYPE'=>'Answer','PARTY_ID'=> 115,'PARENT_USER_CONTENT_ID'=> 112,'children'=> [] // 或者没有此键 ], ['TYPE'=>'Answer','PARTY_ID'=> 117,'PARENT_USER_CONTENT_ID'=> 112,'children'=> [ ['TYPE'=>'Comment','PARTY_ID'=> 118,'PARENT_USER_CONTENT_ID'=> 117,'children'=> [] ] ] ] ] ], ['TYPE'=>'Question','PARTY_ID'=> 113,'PARENT_USER_CONTENT_ID'=>'', 'children' => [ [ 'TYPE' => 'Answer', 'PARTY_ID' => 116, 'PARENT_USER_CONTENT_ID' => 113, 'children' => [] ] ] ] ]
解决方案:迭代构建树形结构
构建这种层级结构的核心思想是:首先创建一个所有元素的快速查找索引,然后遍历这些元素,将子元素归属到它们的父元素下,并最终收集所有顶级元素。这种方法能够处理任意深度的嵌套关系。
步骤一:创建元素索引和初始化子元素容器
首先,我们需要遍历原始的扁平数据,为每个元素创建一个以其 PARTY_ID 为键的索引,以便能快速通过 ID 查找任何元素。同时,为每个元素预留一个 children 数组,用于存放其子元素。
$tree = []; // 最终的层级结构数组,存放所有顶级元素 $indexedItems = []; // 临时索引,用于通过 ID 快速查找元素 // 第一次遍历:索引所有元素并初始化 'children' 数组 foreach ($flatData as &$item) {$item['children'] = []; // 为每个元素添加一个空的 'children' 数组 $indexedItems[$item['PARTY_ID']] = &$item; // 使用引用存储,以便后续修改能反映到原始数据 } unset($item); // 解除最后一次循环的引用,避免意外修改
说明:
- $indexedItems 数组的键是每个元素的 PARTY_ID,值是对原始 $flatData 中对应元素的引用。这意味着当我们通过 $indexedItems 修改一个元素时,$flatData 中的原始元素也会随之改变。
- $item[‘children’] = []; 为每个元素添加了一个 children 键,初始化为空数组,用于存放其子元素。
步骤二:构建层级关系
接下来,我们再次遍历索引后的元素。对于每个元素,如果它有 PARENT_USER_CONTENT_ID 且其父元素存在于 $indexedItems 中,就将当前元素添加到其父元素的 children 数组中。如果一个元素没有 PARENT_USER_CONTENT_ID,则它是一个顶级元素,应将其添加到最终的 $tree 数组中。
// 第二次遍历:构建层级关系 foreach ($indexedItems as $id => &$item) {$parentId = $item['PARENT_USER_CONTENT_ID']; // 检查是否存在父 ID 且父元素在索引中 if (!empty($parentId) && isset($indexedItems[$parentId])) {// 将当前元素添加到其父元素的 'children' 数组中 $indexedItems[$parentId]['children'][] = &$item;} else {// 如果没有父 ID,则它是一个顶级元素,添加到最终的 $tree 数组中 $tree[] = &$item; } } unset($item); // 解除最后一次循环的引用
说明:
- 这里同样使用了引用 (&$item),确保当我们将子元素添加到父元素的 children 数组时,实际是添加了对子元素在 $indexedItems 中位置的引用。这样可以避免深拷贝,节省内存,并允许后续对子元素的修改反映在整个树结构中。
- $tree 数组最终将只包含所有顶级元素。由于子元素是通过引用添加到其父元素的 children 数组中的,整个层级结构就此构建完成。
完整代码示例
将以上两个步骤结合起来,形成一个完整的函数或代码块:
<?php $flatData = [[ 'TYPE' => 'Question', 'PARTY_ID' => 112, 'PARENT_USER_CONTENT_ID' => ''], ['TYPE'=>'Answer','PARTY_ID'=> 115,'PARENT_USER_CONTENT_ID'=> 112], ['TYPE'=>'Question','PARTY_ID'=> 113,'PARENT_USER_CONTENT_ID'=>''], ['TYPE' => 'Answer', 'PARTY_ID' => 116, 'PARENT_USER_CONTENT_ID' => 113], ['TYPE' => 'Answer', 'PARTY_ID' => 117, 'PARENT_USER_CONTENT_ID' => 112], ['TYPE' => 'Comment', 'PARTY_ID' => 118, 'PARENT_USER_CONTENT_ID' => 117], ['TYPE' => 'Comment', 'PARTY_ID' => 119, 'PARENT_USER_CONTENT_ID' => 117], ['TYPE' => 'Question', 'PARTY_ID' => 120, 'PARENT_USER_CONTENT_ID' => ''], ]; function buildHierarchy(array $flatData, string $idKey ='PARTY_ID', string $parentKey ='PARENT_USER_CONTENT_ID', string $childrenKey ='children'): array {$tree = []; $indexedItems = []; // 第一次遍历:索引所有元素并初始化'children'数组 foreach ($flatData as &$item) {$item[$childrenKey] = []; $indexedItems[$item[$idKey]] = &$item; } unset($item); // 解除引用 // 第二次遍历:构建层级关系 foreach ($indexedItems as $id => &$item) {$parentId = $item[$parentKey]; if (!empty($parentId) && isset($indexedItems[$parentId])) {$indexedItems[$parentId][$childrenKey][] = &$item;} else {$tree[] = &$item; } } unset($item); // 解除引用 return $tree; } $hierarchicalData = buildHierarchy($flatData); echo'<pre>'; print_r($hierarchicalData); echo'</pre>'; ?>
注意事项与总结
- 引用(&)的使用: 在构建过程中,大量使用了 PHP 的引用特性。这使得我们能够直接修改 $indexedItems 中的元素,并且这些修改会反映到最终的 $tree 结构中,而无需进行昂贵的数组深拷贝,从而提高了内存效率。使用完毕后,务必 unset($item) 来解除引用,避免潜在的副作用。
- 键名可配置: 提供的 buildHierarchy 函数允许您通过参数指定 ID 键、父 ID 键和子元素键的名称,使其更具通用性。
- 处理孤立子元素: 如果 PARENT_USER_CONTENT_ID 指向的父元素不存在于 $flatData 中,那么该子元素也将被视为顶级元素,并添加到 $tree 数组中。这通常是期望的行为,但如果需要严格的父子关系,您可能需要在将子元素添加到 $tree 之前进行额外的检查或错误处理。
- 性能: 这种迭代方法的时间复杂度为 O(N),其中 N 是 $flatData 中的元素数量,因为它主要涉及两次遍历。对于大多数数据集而言,这种性能表现是高效且可接受的。
- 输出结构: 最终的 $hierarchicalData 数组将包含所有顶级元素,每个顶级元素内部的 children 数组又包含了其直接子元素,子元素又可以有自己的 children 数组,以此类推,形成了完整的树形结构


