三峡大学硕士刘战 (@sanxialiuzhan) 在 整理一份服务器问题排查常用命令,新手向 中发帖
最近帮朋友排查 VPS / 小服务问题时,发现很多时候不是问题复杂,而是第一眼不知道该看哪里。整理一份我自己常用的排查命令,新手可以先收藏,真出事时按顺序扫一遍。
1. 先看机器是不是快满了
# 磁盘剩余空间
df -h
# 当前目录下谁占空间最多
du -sh * | sort -h
# 内存使用情况
free -h
磁盘满了会引发很多奇怪问题:日志写不进去、数据库启动失败、构建失败、服务莫名 500。
2. 看进程和资源占用
# 实时看 CPU / 内存
top
# 按内存占用排序
ps aux --sort=-%mem | head
# 按 CPU 占用排序
ps aux --sort=-%cpu | head
如果是小机器,先看是不是某个进程把内存吃完了。很多服务本身没坏,只是被 OOM 或卡住了。
3. 看端口有没有监听
# 查看监听端口和对应进程
ss -tu...