php二维数组去重有四种方法:一、array_unique 配合 serialize/unserialize,适用于简单结构;二、循环 +in_array 严格比较,兼容性强但效率低;三、array_column 结合关联键去重,高效但需统一键名;四、SplFixedArray 加自定义哈希,适合超 大数据 量。

如果您拥有一个 PHP 二维数组,其中包含多个子数组,而这些子数组存在内容完全相同的情况,则需要去除重复项以保证数据唯一性。以下是实现该目标的多种技术路径:
一、使用 array_unique 配合 serialize 和 unserialize
该方法将每个子数组序列化为 字符串 ,利用 array_unique 对字符串列表去重,再反序列化还原为数组。此方式适用于子数组结构较简单且不包含资源、 闭包 等不可序列化元素的情形。
1、遍历原始二维数组,对每个子数组调用 serialize 函数,生成字符串形式的键值表示。
2、将所有序列化后的字符串存入一维数组中。
立即学习“PHP 免费学习笔记(深入)”;
3、对该一维 字符串数组 调用 array_unique 函数,去除重复字符串。
4、对去重后的 字符串数组 逐一执行 unserialize 操作,恢复为二维数组结构。
5、重新索引结果数组,确保键名连续,可使用 array_values 函数包裹最终结果。
二、使用循环 +in_array 比较
该方法通过逐个取出子数组,并在新数组中检查是否已存在相同结构的子数组,从而构建无重复的新二维数组。它不依赖序列化,兼容所有 PHP 数组类型,但时间复杂度较高,适合中小规模数据。
1、初始化一个空数组作为结果容器。
2、使用 foreach 遍历原始二维数组中的每一个子数组。
3、对当前子数组调用 in_array 函数,传入第三个参数 TRUE,进行严格全等比较,判断其是否已存在于结果数组中。
4、若 in_array 返回 FALSE,说明该子数组尚未加入结果集,则将其追加至结果数组末尾。
5、遍历结束后,结果数组即为去重完成的二维数组。
三、使用 array_column 配合关联键去重
当二维数组具有统一的键名结构(例如每项都有 ’id’ 或 ’name’ 字段),可通过提取某列作为唯一标识,借助键名自动覆盖机制实现去重。该方式效率高,但仅适用于存在天然唯一字段的场景。
1、确认二维数组中存在可用于判重的公共键名,如 ’user_id’ 或 ’email’。
2、使用 array_column 获取该字段的所有值,形成索引数组。
3、将原始二维数组与该字段数组组合为 关联数组,以该字段值为键、子数组为值,例如:$result[$item[‘user_id’]] = $item;
4、重复键名会自动覆盖前值,从而保留最后一次出现的子数组。
5、对最终关联数组调用 array_values 函数,重置数字索引,获得标准索引二维数组。
四、使用 SplFixedArray 与自定义哈希逻辑
对于超大二维数组且需高频去重操作的场景,可构造基于 MD5 或 sha1 的哈希指纹,结合 SplFixedArray 提升内存访问效率。该方式避免序列化开销,同时规避 PHP 默认数组键名限制,但需手动管理哈希冲突。
1、为每个子数组计算标准化哈希值:先 ksort 排序键名,再 json_encode 编码,最后用 md5 处理字符串。
2、初始化一个空的 SplFixedArray 或普通数组用于存储哈希值集合。
3、遍历原始数组,对每个子数组生成哈希值。
4、检查该哈希值是否已在哈希集合中存在;若不存在,则将当前子数组存入结果数组,并将哈希值加入集合。
5、完成遍历后,结果数组即为去重后的二维数组,注意需确保 json_encode 时字符 编码 统一为 UTF-8。
以上就是