unraid 上拿了块爱国者 p5000z 当缓存盘,默认使用的是 btrfs 发现 corrupt 一直在增加,是固态硬盘体质的问题吗? Google 了一波 unraid 官方都是建议跑下 memetest86 排除下内存原因 我跑了 2 次都是 pass 看着不是内存的锅
Jul 24 12:47:01 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 192, gen 0
Jul 24 12:47:01 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 352 off 679936 csum 0xd522135e expected csum 0xf038c045 mirror 1
Jul 24 12:47:01 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 193, gen 0
Jul 24 13:15:05 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 286 off 4337909760 csum 0x2b937fde expected csum 0x9fed556b mirror 1
Jul 24 13:15:05 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 194, gen 0
Jul 24 13:19:51 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 272 off 1601867776 csum 0x55387ecc expected csum 0x294104e2 mirror 1
Jul 24 13:19:51 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 195, gen 0
Jul 24 13:20:03 Tower kernel: BTRFS warning (device sdb1): csum failed root 5 ino 278 off 9227800576 csum 0xc036916f expected csum 0x4b8aade4 mirror 1
Jul 24 13:20:03 Tower kernel: BTRFS error (device sdb1): bdev /dev/sdb1 errs: wr 0, rd 0, flush 0, corrupt 196, gen 0
1
cheng6563 2023-07-24 14:14:52 +08:00
内存不带校验的话基本就是内存问题了,这种跑测试一般跑不出来的。
有 RAID 吗?有的话能自动修复吧。 |
2
yjcn OP @cheng6563 木有加 raid 那这种内存问题还比较尴尬 请问还有啥定位方法吗? 两条科赋的 ddr4 3200 条子 之前在主力机上 打游戏好像也没出现啥问题 后来放到 nas 上了
|
4
mokiki 2023-07-24 16:10:04 +08:00 1
硬盘问题的可能性更大
|
5
yjcn OP |
6
yjcn OP 或者换个文件系统 不行就切回 xfs ?
|
7
yanqiyu 2023-07-24 17:07:18 +08:00
dmesg 里面可能有具体出问题的文件路径
以及可以跑一遍 scrub 看看具体怎样 |
8
wizardyhnr 2023-07-25 23:19:35 +08:00
smartmoontools 能看见 Media and Data Integrity Errors 不,会不会已经有 0E 了.
|
9
yjcn OP @wizardyhnr 木有 盘是新买的 也 check 过 smart 没有 0e 就很迷
|
10
yjcn OP 换了对内存条 发现还是会有 corrupt 难受了 到底是啥原因呢。。。
|
11
busier 2023-07-26 19:29:39 +08:00
盘的问题!说白了,相当于你在硬盘 btrfs 文件系统上存了一大堆文件,然后在读的时候,被 btrfs sum check 发现与存的时候不一致!
排除内存问题导致的计算错误!大概率就是硬盘问题! 还有一种小概率的可能性,就是另一个直接以设备块方式操作硬盘的程序(例如 dd )绕过 btrfs 文件系统,直接在写硬盘块设备! |