如何分析启动耗时 systemd-analyze诊断工具

首先运行systemd-analyze查看总启动时间,判断问题是出在内核阶段还是用户空间阶段;2. 使用systemd-analyze blame列出各服务启动耗时,找出耗时过长的服务;3. 通过systemd-analyze critical-chain分析关键路径,识别串行瓶颈服务;4. 必要时使用systemd-analyze plot生成svg图表可视化启动过程;5. 根据分析结果禁用非必要服务、调整服务启动顺序或优化配置以提升启动速度。

如何分析启动耗时 systemd-analyze诊断工具

linux 系统中,系统启动速度是衡量系统性能的重要指标之一。当发现开机变慢时,可以使用

systemd-analyze

工具来诊断启动耗时,找出拖慢启动过程的关键环节。这个工具是 systemd 提供的内置分析功能,能帮助我们快速了解系统从开机到进入用户空间的整个时间分布。

一、查看整体启动时间:

systemd-analyze

最简单的用法是直接运行:

systemd-analyze

输出示例:

Startup finished in 5.234s (kernel) + 8.765s (userspace) = 13.999s

这行信息告诉我们:

  • 内核启动耗时 5.234 秒(从 BIOS 交出控制权到 initramfs 完成)
  • 用户空间启动耗 8.765 秒(从 systemd 启动到默认目标(如 multi-user.target 或 graphical.target)就绪)
  • 总共耗时约 14 秒

这是第一步,判断问题出在内核阶段还是用户空间阶段。

二、分析服务启动耗时:

systemd-analyze blame

如果用户空间耗时较长,可以进一步查看哪些服务拖慢了启动:

systemd-analyze blame

输出示例:

  3.212s nginx.service   2.876s docker.service   1.543s app-server.service   800ms  NetworkManager-wait-online.service    ...

这个列表按耗时从高到低排序,清楚显示每个服务的启动时间。重点关注耗时超过 1 秒的服务。

常见“拖后腿”的服务包括:

  • NetworkManager-wait-online.service

    :等待网络连通,容易卡住启动(尤其在无网络或网络慢的环境)

  • 某些自定义应用服务或数据库服务(如 mysqlredis)
  • Docker 及其依赖服务(启动容器多时会很慢)

优化建议:

  • 对非关键服务使用
    Type=oneshot

    或延迟启动(通过

    Wants=

    +

    After=

    控制顺序)

  • 禁用不必要的服务:
    sudo systemctl disable 服务名
  • NetworkManager-wait-online

    ,若不需要等待网络,可禁用它:

    sudo systemctl disable NetworkManager-wait-online.service

三、查看服务依赖与并行情况:

systemd-analyze critical-chain

这个命令展示从系统启动到默认目标(target)完成的关键路径:

systemd-analyze critical-chain

输出示例:

graphical.target @10.234s └─multi-user.target @10.233s   └─app-server.service @8.690s +1.543s     └─network-online.target @8.689s       └─NetworkManager-wait-online.service @7.889s +800ms         └─NetworkManager.service @2.123s +5.765s           └─network-pre.target @2.122s             └─firewalld.service @1.800s +322ms               └─basic.target @1.799s                 └─sockets.target @1.798s                   └─docker.socket @1.797s                     └─sysinit.target @1.796s                       └─systemd-timesyncd.service @1.700s +95ms                         └─local-fs.target @1.699s                           └─tmp.mount @1.690s +9ms                             └─local-fs-pre.target @1.689s                               └─...

关键点:

  • 每行显示服务名称、启动时间(@)和持续时间(+)
  • 关键路径上的服务是“串行瓶颈”,优化这些服务能显著缩短总启动时间
  • 如果某个服务耗时长且位于关键链上,优先优化它

四、可视化启动过程(可选):生成 SVG 图

systemd-analyze

还支持生成启动过程的可视化图表:

systemd-analyze plot > boot-time.svg

然后用浏览器打开

boot-time.svg

,可以看到所有服务的启动时间线,直观展示并行与串行关系。

适用场景:

  • 多服务启动顺序复杂,需要整体把握
  • 向团队汇报启动性能问题
  • 调试服务依赖冲突

小结:诊断流程建议

  1. 先运行
    systemd-analyze

    看总时间,判断是内核还是用户空间问题

  2. blame

    找出耗时最长的服务

  3. critical-chain

    查看关键路径,识别串行瓶颈

  4. 针对性优化:禁用、延迟、并行化或调整服务配置
  5. 必要时用
    plot

    生成图形辅助分析

基本上就这些。不复杂,但能快速定位大多数启动慢的问题。

© 版权声明
THE END
喜欢就支持一下吧
点赞7 分享