容器化应用的性能监控工具链推荐（Prometheus/Grafana）？-小浪学习网

prometheus与grafana如何搭建容器化应用监控体系？1.使用docker compose部署prometheus，配置prometheus.yml文件指定抓取目标如prometheus自身、node_exporter等；2.部署grafana并配置prometheus为数据源，导入现成dashboard查看指标；3.在应用中使用prometheus_client暴露指标，配置prometheus抓取该端点；4.通过promql查询并在grafana创建可视化图表；5.结合各类exporter如node exporter、cadvisor等监控不同服务性能。

容器化应用的性能监控工具链推荐（Prometheus/Grafana）？

容器化应用的性能监控，用Prometheus + Grafana 几乎是标配。它们俩加起来，能让你对应用的运行状态了如指掌，排查问题也方便很多。

Prometheus负责收集各种指标数据，Grafana负责把这些数据可视化，让你一眼就能看出问题所在。

Prometheus + Grafana 如何搭建一套完整的容器化应用监控体系？

解决方案

Prometheus 的部署和配置：

首先，你需要一个运行 Prometheus 的地方。可以直接在服务器上部署，也可以用 docker 容器化部署。推荐后者，方便管理和扩展。
- Docker 部署： 直接用 Docker Compose 文件搞定。创建一个 docker-compose.yml 文件，内容如下：
```
version: '3.7' services:   prometheus:     image: prom/prometheus:latest     ports:       - 9090:9090     volumes:       - ./prometheus.yml:/etc/prometheus/prometheus.yml     restart: always
```
- 配置 Prometheus： 创建一个 prometheus.yml 文件，告诉 Prometheus 去哪里抓取数据。
```
global:   scrape_interval:     15s   evaluation_interval: 15s  scrape_configs:   - job_name: 'prometheus'     static_configs:       - targets: ['localhost:9090']    - job_name: 'node_exporter'     static_configs:       - targets: ['node-exporter:9100']
```
这个配置里，Prometheus 会每 15 秒抓取一次自己的数据（localhost:9090），还会抓取 node_exporter 的数据（node-exporter:9100）。 node_exporter 用来收集服务器的硬件和操作系统指标。
- 启动 Prometheus： 在 docker-compose.yml 文件所在的目录运行 docker-compose up -d。
Grafana 的部署和配置：

Grafana 也是用 Docker 部署，和 Prometheus 类似。
- Docker 部署： 修改 docker-compose.yml 文件，添加 Grafana 的配置：
```
version: '3.7' services:   prometheus:     image: prom/prometheus:latest     ports:       - 9090:9090     volumes:       - ./prometheus.yml:/etc/prometheus/prometheus.yml     restart: always    grafana:     image: grafana/grafana:latest     ports:       - 3000:3000     depends_on:       - prometheus     restart: always
```
- 启动 Grafana： 运行 docker-compose up -d。
- 配置 Grafana： 打开浏览器，访问 http://localhost:3000，用默认的用户名密码 admin/admin 登录。然后，添加 Prometheus 数据源，地址填 http://prometheus:9090。最后，导入一些现成的 Dashboard，比如 Node Exporter Full dashboard，就能看到服务器的各种指标了。
监控容器化应用：

要监控容器化应用，需要在应用中暴露 Prometheus 格式的指标。有很多现成的库可以做到这一点，比如 python 的 prometheus_client。
- 暴露指标： 在你的应用中，用 prometheus_client 收集各种指标，比如 HTTP 请求数量、响应时间等等。然后，暴露一个 HTTP 端点，让 Prometheus 可以抓取这些指标。
- 配置 Prometheus： 修改 prometheus.yml 文件，添加一个 job，指向你的应用的 HTTP 端点。
```
scrape_configs:   - job_name: 'my_app'     static_configs:       - targets: ['my-app:8000']
```
- 重启 Prometheus： 让 Prometheus 重新加载配置。
- 在 Grafana 中可视化： 在 Grafana 中，创建新的 Dashboard，用 Prometheus 的查询语言 PromQL 查询你的应用的指标，然后把它们可视化出来。

Prometheus Exporter 有哪些？

Prometheus Exporter 相当于一个适配器，它负责把各种数据源的数据转换成 Prometheus 可以理解的格式。种类很多，常见的有：

Node Exporter: 监控服务器的硬件和操作系统指标，比如 CPU 使用率、内存占用、磁盘 I/O 等等。
cadvisor: 监控 Docker 容器的资源使用情况，比如 CPU、内存、网络 I/O 等等。
mysql Exporter: 监控 MySQL 数据库的性能指标，比如连接数、查询速度、慢查询等等。
redis Exporter: 监控 Redis 数据库的性能指标，比如内存使用、键的数量、QPS 等等。
HAProxy Exporter: 监控 HAProxy 负载均衡器的性能指标，比如连接数、请求数量、响应时间等等。

Prometheus 的指标类型有哪些？

Prometheus 的指标类型主要有四种：

Counter: 计数器，只能增加，不能减少。比如 HTTP 请求总数、错误数量等等。重启后会清零。
Gauge: 仪表盘，可以增加也可以减少。比如 CPU 使用率、内存占用、温度等等。
Histogram: 直方图，用于统计数据的分布情况。比如 HTTP 请求的响应时间分布。
Summary: 摘要，和直方图类似，但是它会直接计算分位数，比如 95% 响应时间。

Prometheus 的 PromQL 查询语言怎么用？

PromQL 是 Prometheus 的查询语言，功能很强大。

基本查询： 直接输入指标的名称，就可以查询该指标的当前值。比如 node_cpu_seconds_total。
时间范围查询： 用 [] 指定时间范围。比如 node_cpu_seconds_total[5m] 表示查询过去 5 分钟的 CPU 使用率。
聚合查询： 用 sum(), avg(), max(), min() 等函数进行聚合。比如 sum(node_cpu_seconds_total) 表示计算所有 CPU 的总使用率。
过滤查询： 用 {} 指定过滤条件。比如 node_cpu_seconds_total{cpu=”0″} 表示查询 CPU 0 的使用率。
速率查询： 用 rate() 函数计算指标的变化速率。比如 rate(node_cpu_seconds_total[5m]) 表示计算过去 5 分钟的 CPU 使用率的变化速率。

Prometheus 和 Grafana 的最佳实践有哪些？