遇到linux服务启动失败时,应优先使用systemctl自带调试工具排查问题。首先执行systemctl status xxx.service查看服务状态和错误信息,如显示“inactive (dead)”或“failed at step xx spawning…”可直接定位问题;其次用journalctl -u xxx.service结合–since、–until、-f、-b等参数查详细日志;接着确认unit文件是否被正确加载,必要时运行systemctl daemon-reload重载配置;再用systemd-analyze verify检查unit文件语法;最后可临时修改loglevel=debug提升日志详细度辅助排查,但用后需恢复默认设置。
遇到linux服务启动失败时,很多人第一反应是去翻日志、看配置文件,但其实systemctl本身就有不少调试手段。特别是systemctl debug相关的命令和技巧,用好了能省不少时间。
查看服务状态:
systemctl status xxx.service
systemctl status xxx.service
这个命令虽然基础,但非常关键。它不仅能告诉你服务当前的状态(是否运行),还能显示最近的错误信息。比如:
- 如果服务没启动成功,会提示“inactive (dead)”;
- 有时候还会显示“Failed at step XX spawning…”这样的错误,直接指向问题根源;
- 最下面一般会列出journal日志的位置,可以结合
journalctl
进一步查看。
建议先执行:
systemctl status nginx.service
看看有没有明显报错,别急着往下查。
使用
journalctl
journalctl
结合
systemctl
查详细日志
systemd的日志系统和systemctl配合得非常好。当你在status里看到日志位置后,可以用
journalctl -u xxx.service
来查看完整的日志输出。
举个例子:
journalctl -u sshd.service --since "1 hour ago"
这条命令能帮你快速定位过去一小时内sshd服务有没有异常退出或加载失败的情况。
几个实用参数你可以记一下:
-
--since
和
--until
:按时间范围查日志;
-
-f
:实时追踪日志输出;
-
-b
:只看本次开机的日志。
检查服务单元文件:
systemctl daemon-reload
systemctl daemon-reload
有时你修改了服务的unit文件(比如
/etc/systemd/system/xxx.service
),但服务没生效,这时候要记得执行:
systemctl daemon-reload
这个命令会重新加载所有unit配置,否则你的改动可能根本不会被systemd识别。
另外,还可以用:
systemctl list-units --type=service | grep xxx
确认服务有没有被正确加载。
如果你怀疑unit文件写错了,可以试试:
systemd-analyze verify /etc/systemd/system/xxx.service
它会对unit文件做语法检查,提示哪里有问题。
设置调试环境:临时启用更详细的日志
如果前面的方法都试了还没头绪,可以考虑临时调整systemd的log级别,让systemctl输出更多信息。这一步稍微进阶一点,但对排查深层问题很有帮助。
操作步骤大概是这样:
- 修改
/etc/systemd/system.conf
,把
LogLevel=
改成
debug
;
- 然后执行
systemctl daemon-reexec
重启systemd管理器;
- 再次启动服务,就能在journal日志中看到更详细的执行流程。
注意:改完之后记得恢复默认值,不然日志会变得特别多,影响性能。
基本上就这些方法,都是日常排查systemd服务问题时最常用的。不复杂但容易忽略的是,很多时候我们只是没仔细看status和journal里的信息,反而绕远路去查配置文件。下次再遇到服务起不来,不妨先从systemctl自带的调试手段入手。