V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Distributions
Ubuntu
Fedora
CentOS
中文资源站
网易开源镜像站
lithiumii
V2EX  ›  Linux

怎样排查 Linux 下的系统盘是否掉盘?

  •  
  •   lithiumii · 2022-08-23 13:54:22 +08:00 · 3736 次点击
    这是一个创建于 828 天前的主题,其中的信息可能已经有所发展或是发生改变。

    新装的 Manjaro GNOME Kernel 是 5.15.60-1-MANJARO 机器是 NUC8i5BEK 装了一块 2T 的致态 TiPlus5000 买的时候看便宜就买了,没注意到差评里有人说这款会掉盘,毕竟以前用 PC005 挺好的。

    昨天用着用着忽然点啥都没反应了(图形界面都在,点按钮无反应),shell 里报错说"Read-only file system",按电源重启后恢复正常。 然后电脑开了一夜,早上起来看到正常的锁屏界面,但是来不及登录就黑了,重启后正常登入。 有用 Prometheus 监控,同时从本机和另一台机器上记录,另一台机器上温度记录的截图如下:

    黄色和绿色的线是硬盘的温度,在大约 8:59 到 9:35 (今天重启的时间)之间没有记录。是不是可以推测是硬盘在 8:59 左右掉盘了?同时间本机的 Prometheus 这一段全空了,推测是因为掉盘了所以啥都没写入。journalctl 也查不到任何相关的 log ,估计也是因为系统盘没了所以啥都没写下来。

    目前机器继续用着(重要数据都有备份),希望等下一次发生的时候能有针对性地排查一下。

    9 条回复    2022-10-18 18:01:21 +08:00
    mrzhiin
        1
    mrzhiin  
       2022-08-23 13:59:30 +08:00   ❤️ 1
    TiPlus5000 我在 Windows 下出现过两次掉盘,换新后仍有掉盘的情况,最后退了。这个月致态有发布新的固件,或许可以更新试试
    billlee
        2
    billlee  
       2022-08-23 16:18:45 +08:00 via Android   ❤️ 1
    终端预先开好 dmesg -w 等着,或者给把 journald 持久化存储关了同时 syslog 转发到其他机器。
    yanqiyu
        3
    yanqiyu  
       2022-08-23 19:19:37 +08:00
    让 journald 把日志写道别的盘?
    julyclyde
        4
    julyclyde  
       2022-08-24 13:45:52 +08:00
    smartctl 看看硬盘的状态吧
    不一定是温度,也可能是别的因素
    lithiumii
        5
    lithiumii  
    OP
       2022-08-24 19:44:26 +08:00
    @mrzhiin 在长江储存官网找到了升级工具,发现已经是最新版本了
    @billlee @yanqiyu 感谢指点,只能这样守株待兔了
    @julyclyde 不是说因为温度而掉盘,只是恰好温度监控记录里可以看到几点几分开始,没有来自 SSD 的温度传感器的数据了,怀疑就是在这个时刻掉盘
    julyclyde
        6
    julyclyde  
       2022-08-25 14:07:09 +08:00
    @lithiumii 把监控数据存到别的地方试试?
    hootigger
        7
    hootigger  
       2022-10-17 19:28:19 +08:00
    @lithiumii 你的现在怎么样了 我装 pve ( debian )然后今天也出现了 系统无响应,重启正常。。日志查不到报错,也是出现了 什么写入都没有的情况。致钛 5000 1t 的盘
    lithiumii
        8
    lithiumii  
    OP
       2022-10-17 20:18:23 +08:00
    @hootigger

    确定了是硬盘的问题就找售后了,但我估计这盘搞不好是设计问题,没救了。

    京东换货第一次,没有任何改善(掉盘频率一周两三次)。
    第二次,掉盘频率下降了,大概一个月两次吧。
    所以前两天第三次找客服了,客服说又上线了新固件。刷上了,暂时还没掉,但还需要观察。
    hootigger
        9
    hootigger  
       2022-10-18 18:01:21 +08:00 via iPhone
    @lithiumii 我也是今天联系长江存储技术客服了,说 10 月 14 刚更新了固件,我刚才刷好了,观察中。主要是这硬盘温度控制的很不错,适合我这小主机希望能稳定
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1047 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 21:42 · PVG 05:42 · LAX 13:42 · JFK 16:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.