Python列表组合筛选：高效排除特定组合-小浪学习网

Python列表组合筛选：高效排除特定组合

本文将介绍一种在python中筛选列表组合的高效方法，该方法可以避免使用大量的if语句来排除特定的组合。正如摘要所说，我们将使用all()和any()函数以及列表推导式来实现简洁高效的筛选逻辑。

问题背景

假设我们有一个包含从1到52中选取6个数字的所有可能组合的列表。我们的目标是排除那些组合，其中每个数字都属于一个不同的预定义数字分组。例如，我们有以下数字分组：

D = [1, 2, 3, 4, 5, 6, 7, 8, 9]
T = [10, 11, 12, 13, 14, 15, 16, 17, 18, 19]
L = [20, 21, 22, 23, 24, 25, 26, 27, 28, 29]
H = [30, 31, 32, 33, 34, 35, 36, 37, 38, 39]
K = [40, 41, 42, 43, 44, 45, 46, 47, 48, 49]
M = [50, 51, 52]

我们想要排除的组合是那些包含来自每个分组的一个数字的组合。例如，如果一个组合包含来自D、T、L、H、K和M中每个分组的一个数字，那么这个组合应该被排除。

解决方案

以下是一种使用列表推导式和all()和any()函数来解决这个问题的简洁方法：

立即学习“Python免费学习笔记（深入）”；

D = [1, 2, 3, 4, 5, 6, 7, 8, 9] T = [10, 11, 12, 13, 14, 15, 16, 17, 18, 19] L = [20, 21, 22, 23, 24, 25, 26, 27, 28, 29] H = [30, 31, 32, 33, 34, 35, 36, 37, 38, 39] K = [40, 41, 42, 43, 44, 45, 46, 47, 48, 49] M = [50, 51, 52]  groups = [D, T, L, H, K, M]  # 假设 res 是包含所有组合的列表 # 例如: import itertools perm = itertools.combinations(range(1, 53), 6) res = [list(val) for val in perm]   output_list = [combo for combo in res if all(any(n in combo for n in group) for group in groups)]

代码解释:

groups = [D, T, L, H, K, M]: 将所有数字分组存储在一个列表中，方便迭代。
output_list = [combo for combo in res if all(any(n in combo for n in group) for group in groups)]: 这是一个列表推导式，它遍历res中的每个组合combo，并根据if条件来决定是否将其添加到output_list中。
all(any(n in combo for n in group) for group in groups): 这是if条件的核心。它使用嵌套的all()和any()函数来检查是否满足以下条件：
- for group in groups: 外层循环遍历每个数字分组。
- any(n in combo for n in group): 内层循环检查当前组合combo中是否至少包含一个来自当前分组group的数字。 n in combo for n in group 会生成一个布尔值序列，如果分组中的任何数字出现在组合中，则为True，否则为False。any()函数会检查此序列中是否有任何True值。
- all(…): all()函数确保所有分组都满足至少包含一个数字的条件。换句话说，只有当组合中包含来自每个分组的至少一个数字时，all()函数才会返回True。

因此，这段代码会筛选出那些组合，这些组合包含来自所有预定义数字分组的至少一个数字。

更清晰的逻辑版本

为了更好地理解上述代码，以下是一个更详细的版本，它使用显式的循环和条件判断：

D = [1, 2, 3, 4, 5, 6, 7, 8, 9] T = [10, 11, 12, 13, 14, 15, 16, 17, 18, 19] L = [20, 21, 22, 23, 24, 25, 26, 27, 28, 29] H = [30, 31, 32, 33, 34, 35, 36, 37, 38, 39] K = [40, 41, 42, 43, 44, 45, 46, 47, 48, 49] M = [50, 51, 52]  groups = [D, T, L, H, K, M]  output_list = [] for combo in res:     satisfied = []     for group in groups:         found = False         for num in group:             if num in combo:                 satisfied.append(True)                 found = True                 break         if not found:             satisfied.append(False)     if all(satisfied):         output_list.append(combo)

这个版本使用嵌套循环来遍历每个组合和每个数字分组。对于每个分组，它检查组合中是否包含该分组中的任何数字。如果找到任何数字，它将True添加到satisfied列表中，否则添加False。最后，它使用all()函数来检查satisfied列表是否只包含True值。如果是，则将该组合添加到output_list中。

使用集合(Sets)优化性能

如答案中提到的，使用集合可以显著提高性能，特别是对于大型数据集。这是因为集合提供了快速的成员资格测试。以下是使用集合的优化版本：

D = {1, 2, 3, 4, 5, 6, 7, 8, 9} T = {10, 11, 12, 13, 14, 15, 16, 17, 18, 19} L = {20, 21, 22, 23, 24, 25, 26, 27, 28, 29} H = {30, 31, 32, 33, 34, 35, 36, 37, 38, 39} K = {40, 41, 42, 43, 44, 45, 46, 47, 48, 49} M = {50, 51, 52}  groups = [D, T, L, H, K, M]  # 假设 res 是包含所有组合的列表 # 例如: import itertools perm = itertools.combinations(range(1, 53), 6) res = [list(val) for val in perm]   output_list = [combo for combo in res if all(any(n in group for n in combo) for group in groups)]

唯一的区别是将数字分组定义为集合而不是列表，并在内层循环中交换了 n 和 combo 的位置，以利用集合的快速成员资格测试。这样做是因为 n in group 对于集合来说比 n in combo （当 combo 是列表时）快得多。