V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
wolfcdd
V2EX  ›  硬件

3 块硬盘做 raid5,现在因硬盘故障抽走一块,剩余的两块能否正常运行

  •  
  •   wolfcdd · 2023-10-19 16:04:26 +08:00 · 1620 次点击
    这是一个创建于 384 天前的主题,其中的信息可能已经有所发展或是发生改变。

    3 块硬盘做 raid5 ,现在因硬盘故障抽走一块,剩余的两块能否正常运行,是否会影响两块硬盘上数据及服务呢?剩余的两块还算一个阵列吗?如果后续再换上一块好的硬盘,原来的 raid5 阵列会自动构建吗?剩下的两块硬盘中的数据是否还会有 raid 同步呢?

    11 条回复    2023-10-27 14:00:02 +08:00
    263
        1
    263  
       2023-10-19 16:14:08 +08:00
    如果是坏了一块,先确认阵列状态,确保其它两块是正常状态,然后可以拔掉坏硬盘,要及时替换新硬盘上去,然后正常情况 RAID 会自动开始重建,重建期间不能拔出任何硬盘,替换上去的硬盘容量要和其它硬盘一致。
    ferock
        2
    ferock  
       2023-10-19 16:19:18 +08:00
    这就是 raid5 的风险

    1. 其他两块现在很容易坏,坏了数据就全 GG
    2. 插上新的硬盘,重构整列,其他两块更容易坏,坏了数据就全 GG
    chronos
        3
    chronos  
       2023-10-19 16:34:46 +08:00
    坏了一块 raid5 就降级了,数据还能取出来,但风险很大。尽快换一块硬盘上去重建吧。
    winterx
        4
    winterx  
       2023-10-19 17:08:13 +08:00
    1 、可以正常运行,阵列会降级
    2 、换上新盘,阵列会自动重新构建

    以上基于 DELL H745 阵列卡亲测答复
    murmur
        5
    murmur  
       2023-10-19 17:27:44 +08:00
    不一定,因为数据重建这种大负载可能让以前濒临挂掉的磁盘也挂掉,如果是寿命不是点背某个盘提前坏
    JF65851a20L5hj7v
        6
    JF65851a20L5hj7v  
       2023-10-19 19:27:09 +08:00
    先备份数据,再重建阵列!!!
    先备份数据,再重建阵列!!!
    yolee599
        7
    yolee599  
       2023-10-20 09:25:27 +08:00 via Android
    @ferock #2 不同批次,使用时间不一样的硬盘应该能减少同时坏概率吧
    ferock
        8
    ferock  
       2023-10-20 09:47:05 +08:00
    @yolee599 #7

    你也说“应该”,显然心里没底呀
    hcocoa
        9
    hcocoa  
       2023-10-20 11:09:55 +08:00
    1.抓紧备份数据
    2.切到备份系统
    3.插硬盘等重建
    4.切回生产系统
    lqzhgood
        10
    lqzhgood  
       2023-10-21 10:17:59 +08:00
    我来解释一下上面说的 R5 重构整列 为啥更容易坏

    1T * 3 R5 A,B,C C 损坏更换

    1. 阵列恢复是针对全盘的,不是数据的
    数据只有 1K ,全盘恢复也是针对 1T 全盘空间计算的,因为阵列并不知道什么叫 ”有效数据“,A B 两个盘都需要从 0 读完 1T 空间

    2. 基于以上,夸张 夸张 夸张 三点说,若盘中因为宇宙射线、灰电平衡等各种原因,盘上有个 0 -> 1 了,那么校验失败就会导致整个阵列重建崩溃。(平时的电脑里可能就有因为以上原因损坏的文件,只是你并不会全盘去检查)

    3. 单盘空间越大,故障率直线上升 (单个 0->1 故障率 10^-14 ,1T * 10^-14 这个意思。 ) 盘数越多同理

    1T *3 错误率 10^14 的情况下 理论重建成功率 R5 85%

    重建成功率计算: http://magj.github.io/raid-failure/


    总结:
    说的如此夸张是为了让大家重视 Raid 只是提升数据可靠性,备份一定要多处

    这里有 100TB R5 重建成功的案例。https://post.smzdm.com/p/a6lnpx9z/


    小知识:来自 [维基百科]
    > 独立硬盘冗余阵列( RAID, Redundant Array of Independent Disks ),旧称廉价磁盘冗余阵列( Redundant Array of Inexpensive Disks ),简称磁盘阵列。
    Inexpensive !!!
    RexKang
        11
    RexKang  
       2023-10-27 14:00:02 +08:00
    楼上已经解释的很清楚了,所以日常要做好数据备份。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   5652 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 26ms · UTC 06:33 · PVG 14:33 · LAX 22:33 · JFK 01:33
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.