Linux文本处理命令解析_Linux grep与awk综合用法讲解

3次阅读

grep 负责快速筛选匹配行，awk 负责按字段处理、计算和格式化输出；二者组合可高效解决日志分析、配置提取等实际问题。

Linux 文本处理命令解析_Linux grep 与 awk 综合用法讲解

linux 中 grep 和 awk 是文本处理的两大利器，它们分工明确又常配合使用：grep 负责“找”，快速筛选匹配行；awk 负责“拆”和“算”，按字段处理、计算、格式化输出。掌握二者组合用法，能高效解决日志分析、配置提取、数据清洗等实际问题。

grep 默认逐行匹配正则，但很多场景需要更稳更准：

awk 默认以空白（空格 / 制表符）为分隔符，用 $1、$2…… 引用字段，$0 表示整行：

打印第 2 列且第 3 列大于 100：awk '$3 > 100 {print $2}' data.txt
统计某列出现次数：awk '{count[$1]++} END {for (i in count) print i, count[i]}' access.log
自定义分隔符（如冒号）：awk -F':' '$3 >= 500 {print $1}' /etc/passwd
内置变量 NF（字段数）、NR（当前行号）很实用，比如跳过首行：awk 'NR>1 {print $1,$3}' file.csv

单独用一个命令往往不够，组合才能应对复杂需求。典型流程是：grep 快速缩小范围 → awk 精细提取或加工：

查 nginx 错误日志中状态码为 500 的请求 URL：grep '500' /var/log/nginx/error.log | awk '{print $7}'
提取所有 IPv4 地址并去重计数：grep -oE '([0-9]{1,3}.){3}[0-9]{1,3}' access.log | awk '{ip[$0]++} END{for (i in ip) print i, ip[i]}'
筛选含关键词且满足数值条件的行（先 awk 再 grep 更高效）：awk '$5 > 200 {print $0}' app.log | grep 'timeout'

组合使用时容易忽略细节，导致结果不准或效率低下：

基本上就这些。熟练后你会发现，一条简洁的管道命令，就能替代几十行 python 脚本——不复杂，但容易忽略细节。

发表于：运维

近一天内

复制链接

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

如何在 Composer 中使用 config.github-protocols 来选择 git 或 https 协议？

Java DOM Level 3 Core是什么新增了哪些功能