Elasticsearch嵌套数组筛选：如何高效查询指定时间段内数组元素数量大于N的文档？-小浪学习网

Elasticsearch嵌套数组筛选：如何高效查询指定时间段内数组元素数量大于N的文档？

elasticsearch嵌套数组精准筛选：高效定位指定时间范围内数组元素数量大于N的文档

本文深入探讨Elasticsearch中嵌套数组的条件筛选技巧。假设索引包含名为change_records的嵌套数组字段，每个数组元素都包含change_time字段（时间戳）。目标是查询特定年份内，change_time值数量大于等于N的文档。

直接使用脚本查询访问change_records数组可能会失败，报错信息类似“no field found for [change_records]”。这是因为脚本查询需要正确引用字段路径。简单的exists查询只能验证字段存在性，无法满足筛选数组元素的需求。

解决方案：利用script_score查询和Painless脚本

script_score查询结合Painless脚本，允许自定义评分逻辑，根据文档内容进行精准筛选。这有效解决了嵌套数组条件筛选难题。

以下是一个示例查询结构：

{   "query": {     "script_score": {       "query": {         "match_all": {}  // 可在此处添加其他查询条件       },       "script": {         "source": """           int matches = 0;           for (map t : doc['change_records']) {             long changeTime = t['change_time'];             if (changeTime >= params.start && changeTime < params.end) {               matches++;             }           }           return matches >= params.n ? 1 : 0;         """,         "params": {           "start": 1640995200000, // 2022-01-01 00:00:00 UTC           "end": 1672531200000,   // 2023-01-01 00:00:00 UTC           "n": 2                 // 至少2个change_time在指定范围内         }       }     }   } }

此查询中，script_score的query部分使用match_all匹配所有文档（可根据需要替换为更精确的查询）。核心在于script部分：