神奇的程序员 (@likaia) 在 从已损坏的备份中拯救数据 中发帖
[999]
前言
12月15号早上,一觉醒来,拿起手机看到我的邮箱收到了内网服务无法访问的告警邮件,本以为只是简单的服务卡死,将服务器重启后就去上班了。
后来,陆续有好友联系我说网站挂了。
[iPhone镜像 2025-12-17 21.18.12]
定位问题
晚上下班回家后,尝试将电脑断电重启,发现pve只能存活2分钟左右,然后整个系统卡死,无法进行任何操作。首先,我想到的是:会不会某个vm虚拟机或者ct容器影响到宿主机了。
因为系统只能存活几分钟,在执行禁用操作的时候,强制重启了好几次服务器。当所有的服务都停止启动后,卡死的问题依旧存在。
翻日志
没辙了,这已经不是简单的软件问题了,只好翻日志,看报错信息了。
nvme nvme0: I/O timeout, aborting
如上所示,日志中出现了好几条I/O超时消息,顿感不妙,该不会硬盘坏了吧…
找到原因
找了一圈...