V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
请不要把任何和邀请码有关的内容发到 NAS 节点。

邀请码相关的内容请使用 /go/in 节点。

如果没有发送到 /go/in,那么会被移动到 /go/pointless 同时账号会被降权。如果持续触发这样的移动,会导致账号被禁用。
jeremyding
V2EX  ›  NAS

组 raid1 不如 数据复制到两份硬盘

  •  1
     
  •   jeremyding · 1 天前 · 2437 次点击
    以下是群晖技术支持给我的回复,说实话,如果只是数据复制到两份硬盘,而不是组 raid1 ,估计也不会遇到数据恢复失败的问题。


    我们已收到您的日志。根据目前信息,您使用硬盘 2 修复硬盘 1 的存储池时,出现了 UNC 错误和写入错误[1],修复失败[2]。自 2026.01.18 起,存储池降级运行,仅依赖存在大量 UNC 错误的硬盘 1 。2026.01.24 硬盘 1 再次报错,存储池损毁,进入只读保护状态。

    目前,您的数据仅存于硬盘 1 ,该硬盘已出现严重硬件错误( UNC 错误和介质错误“media error”[3])。建议您更换故障硬盘并从备份恢复数据。

    若无备份且数据重要,建议停止操作,避免加重硬盘损伤,并联系专业数据救援服务。

    对于硬盘 2 ,能从当前的日志看到的是修复没有完成报失败,说明硬盘 2 并没有和硬盘 1 执行完全同步,我们认为硬盘 2 中并没有有意义的数据(不完整)。
    46 条回复    2026-02-11 12:30:48 +08:00
    luoshengdu
        1
    luoshengdu  
       1 天前   ❤️ 1
    热数据怎么办?一个持续占用的数据库怎么复制 [买热备软件=花钱]
    24 小时随机时间有业务写入,怎么持续复制 [高频度监测事件=性能开销]
    数据可恢复性,复制相较于 raid 控制器的延迟有优势吗? [数据落盘的可靠性]
    RAID1 上面不止可以放数据,可以放任何系统以便热迁移。复制能不停机热迁移吗?

    本主题说的只是在我们这种低端家用场景,确实用不着高可用、高可靠性。丢数据、停机、数据不一致都是无所谓的!
    newaccount
        2
    newaccount  
       23 小时 54 分钟前
    raid1 还是很有必要的,你的问题是在磁盘出问题之后,修复时继续出错
    硬盘损坏我也遇到过,做法是确认硬盘损坏之后,停机不再使用,等新硬件到货
    不过当时是考虑这个旧机器时间久了,怕以后出问题的几率增大,就买了新机器
    然后顺便升级一下配置,换成 5 盘位,这样两两 raid1 之后,还能剩余一块单独当备份用
    dcsuibian
        3
    dcsuibian  
       23 小时 46 分钟前
    每太看懂时间线,能理一下项目背景么
    另外没开邮件提醒么,开了邮件提醒的话,应该不至于出现这么大的问题
    OneLiteCore
        4
    OneLiteCore  
       23 小时 45 分钟前
    家用数据情况下备份是最重要的与其 Raid 不如 Crontab + Rsync ,商用场景的话那服务停机一秒都是损失,使用场景不一样
    datocp
        5
    datocp  
       23 小时 42 分钟前 via Android
    数据有价,

    一直对 raid1 感兴趣的一个问题,如果硬盘 1 某个数据出错,那么硬盘 2 数据是否会因为同步出错。鉴于对 raid 的盘如何恢复数据的不了解。直接将 r720 刷第三方 it/r730 使用官方 it 。心大,平时系统备份,数据库文件同步,相信自己的人品。。。至少这种常用的硬盘格式自己也有一定能力读取/修复数据。

    有人给我组了个 22 个盘的双 raid10 。可是这玩意小文件速度同样能掉到 5kb/s 以下。。。平时系统备份,数据库备份完成再同步到其它服务器。这种场景我更愿意使用自己了解的 it 模式,而不是 raid 取出硬盘不知道怎么恢复。
    loading
        6
    loading  
       23 小时 41 分钟前 via Android   ❤️ 4
    raid 技术是高可用技术,就是单个硬盘故障不会 down 机,它不是数据备份技术!
    asen001
        7
    asen001  
       23 小时 29 分钟前   ❤️ 1
    用 raid 不能代替备份,重要数据还是需要多备份
    Vipcw95
        8
    Vipcw95  
       23 小时 24 分钟前
    来点起因经过结果
    jeremyding
        9
    jeremyding  
    OP
       23 小时 14 分钟前
    感谢大家,已经明白 raid1 的作用了,跟数据备份不一样。
    zyq2280539
        10
    zyq2280539  
       23 小时 14 分钟前
    我一直都是 crontab+rsync 脚本手动备份,一直舍不得花钱用相同大容量盘做备份,一般都是按照文件夹的规模去寻找备份盘。
    Ketteiron
        11
    Ketteiron  
       23 小时 9 分钟前
    raid1 保证高可用,不保障数据安全,必须定时备份。
    有人可能会问,我都拿出一块盘来备份了怎么还得另外备份,这是很常见的误区。
    据我在多个 nas 群的观察,大部分人都是被人忽悠去上 raid 0,1,5,10 ,只知道优点,但不去了解这些技术的原理,并且错误地曲解了冗余和备份的关系。
    raid 保障的是即使出故障系统也不会挂的高可用性,大多数 nas 玩家其实并没有这么高级的需求,系统挂了数据不丢才是最要紧的事,说实话这跟 raid 没半毛钱关系,反而会因为 raid 引入的硬件复杂度+软件复杂度导致丢了不该丢的数据。

    只要问自己一句:"当发生意外时,我的 nas 是不是不能停机需要继续提供服务?"
    如果答案是 yes ,就去查看各种 raid 的优缺点,选一个合适的,并且依然需要备份兜底。
    如果答案是 no ,只需要找一个简单的定时/增量备份方案就行,raid 在这里只会带来害处。
    EchoWhale
        12
    EchoWhale  
       23 小时 7 分钟前 via iPhone
    raid != backup

    很多人用错了,大部分家庭用户不需要 raid ,搞好 321 备份就好了
    Ketteiron
        13
    Ketteiron  
       22 小时 55 分钟前
    @datocp #5 是的,raid1 的最大缺点就是会同步错误数据。
    https://serverfault.com/questions/2888/why-is-raid-not-a-backup
    stephenhallo
        14
    stephenhallo  
       22 小时 41 分钟前
    raid 是高可用,不是用来数据备份的
    dilidilid
        15
    dilidilid  
       22 小时 33 分钟前
    @luoshengdu 你说的所有这些问题几乎都可以用 ZFS/btrfs 快找/send+receive 解决。唯一的缺陷是不能保证实时性,但我想对绝大部分家用场景丢失几个小时的数据是无所谓的。

    另外就是你说的这些高频 IO 操作比如数据库现在几乎都在 SSD 上完成了,但 SSD 做 RAID1 的家用用户显然是少数。反倒是 rsync/send+receive 大法效果更好
    scegg
        16
    scegg  
       22 小时 8 分钟前
    RAID 不是备份。
    备份不是 RAID 。
    两个需求,没有互相替代的说法。
    需要什么,就上什么。都需要,就一起上。
    crazycen
        17
    crazycen  
       22 小时 4 分钟前
    很多企业以为做了 RAID1 RAID5 万事大吉,而不做备份,导致的数据丢失比比皆是!
    syubo2810
        18
    syubo2810  
       21 小时 58 分钟前
    我就没做 raid ,都是同步备份,同 nas 不同盘备份,没容量损失,也不容易丢数据
    做 raid 是为了服务器用的,保证高可用性,正常 nas 其实不需要
    momo1999
        19
    momo1999  
       21 小时 57 分钟前
    又一个把 raid 当备份的。
    mengyx
        20
    mengyx  
       21 小时 49 分钟前
    个人用途下,兼顾易用性、成本,可以考虑 Btrfs RAID1 / RAID1C3 ;
    支持文件级别的完整性校验、坏块自动修复、快照等能力,可以等效于 2 个/3 个本地副本;
    这样不会出现静默损坏,备份也只需考虑异地副本。
    esee
        21
    esee  
       21 小时 40 分钟前
    高可用 和 备份 不是二选一
    fbichijing
        22
    fbichijing  
       21 小时 34 分钟前
    看不太明白你想表达什么信息? raid1 不就是为了防止单磁盘坏掉数据丢失的一种技术吗?当发现有一块坏掉的时候,就需要人为换硬盘或者修复,让两块硬盘能继续工作。是什么情况会导致你说的这种结果?你说的现象是:磁盘一本身有问题,然后错误被同步到磁盘二。有一天磁盘一完全坏掉,raid1 想通过磁盘二修复磁盘一,但是发现磁盘二本身有问题。于是无法复原系统?
    eroko
        23
    eroko  
       21 小时 30 分钟前
    数据备份请记住 3-2-1
    ryd994
        24
    ryd994  
       21 小时 17 分钟前 via Android
    楼主你这个情况分两份也没用啊。现在的情况是 2 盘坏了,重建/重新同步时发现 1 盘也坏了。定期 smart 测试很重要。smart 测试可以检测到大部分读取错误,也就是 1 盘这种情况完全可以早就发现。smart 报错的盘只能降级为下载盘,随时坏了不心疼。

    你现在不定期跑 smart 测试,不定期读取数据验证,那就算你存了两份,还是躲不过盘 2 损毁,盘 1 无法读取的问题。因为你从来都没有验证过盘 1 上的数据是否能读取。没有恢复测试的备份等于不存在,因为你不知道这个备份是否还存活,备份内容是否还正确。备份不是把数据复制一份,然后指望硬件不坏就完事的。好的备份是一整套流程,从数据备份到校验到恢复,都需要定期执行。比如 zfs 定期 resilver ,就是验证数据和镜像内容。

    充分证明了我一贯的观点:如今这个大硬盘时代(单盘>2TB ),任何只有 1 度冗余的 raid 都是不够的。因为重建耗时超过 24 小时,且全程是满负荷读写,非常有可能在重建过程中再挂一块。你要数据安全,raid6 以上是必须。在这一点上 raid10 都不如 raid6 ,因为 raid10 是先做 raid1 再做 raid0 。重建时负荷最大的是坏盘配对的镜像盘,所以最有可能挂的还是那一块。偏偏最不能挂的就是那一块。根据墨菲定律,raid10 的安全性和 raid5 没有本质区别。

    对于家庭使用,瓶颈是网速,raid10 的性能优点没有实际意义。
    对于生产环境,性能是重点,数据安全可以通过别的方式解决。比如近年流行的分布式文件系统。不仅可以应对硬盘故障,还能应对机器任何部分的故障(比如电源炸了)。

    @datocp #5 你描述的情况属于冷错误。硬盘没有报错,但返回了错误数据。raid 原版模型里没有考虑这种情况。原版模型里硬盘只有正常工作和彻底掉线两种状态。不会卡死,不会返回错误数据。
    ZFS 带校验,可以排除冷错误问题。高级的 raid 卡可以在后台定期校验,也可以自动检测冷错误。

    非启动盘,一般不建议使用硬 raid 。你说的小文件速度慢,基本可以确定为没有 BBU cache ,也没有 nand cache 。自带非易失缓存的 raid 卡都是高端产品,价格不便宜。

    相反,ZFS 或 btrfs 都可以加 SSD 做缓存。而且基于文件系统的 raid 可以根据文件特点做不同的写入策略,也有助于性能。
    Alliot
        25
    Alliot  
       21 小时 15 分钟前
    @mengyx #20 嗯... 如果单纯存文件的话,Btrfs RAID 1 问题不大。 如果还需要跑点服务,还是 ext4 xfs 吧。
    ProphetN
        26
    ProphetN  
       18 小时 44 分钟前
    家用使用 rsync 和 SnapRAID 这些非实时同步技术毫无疑问是更好的。

    Raid 的同步写入本身就是风险操作,尤其是考虑家用 NAS 没有硬 Raid 、没有 ECC 内存、使用静音盘、成品 NAS 散热差的情况下。

    更何况使用 Raid ,还必须接受扩容困难的缺点。
    dufldylan1
        27
    dufldylan1  
       16 小时 49 分钟前
    老家县城一个 qnap 8t*3 ,北京租房里一个 windows 8t*2 。我直接一个 syncthing
    Meltdown
        28
    Meltdown  
       16 小时 47 分钟前
    没看懂,是太倒霉两块硬盘都坏了?那直接复制不也是会遇到这个问题吗
    S1ahs3r
        29
    S1ahs3r  
       16 小时 6 分钟前
    RAID 当然不是备份,但是如果你 RAID 阵列破损,此时服务还可用的话,即使你不去修复阵列,也能用应用层的导出功能提前保护数据。

    更可以 RAID+备份都做,毕竟频次不同。

    不用把网上的人说的当金科玉律一遍一遍的念。
    alfawei
        30
    alfawei  
       15 小时 39 分钟前
    我依旧建议 shr/raid1 , 去年群晖 ds220+ 8t 硬盘有一块故障,立刻收到邮件和推送,晚上下单新硬盘,之后重建恢复。 没有 raid1/shr 即使不丢数据是一方面 但我那么多 docker 数据,图片数据库,再折腾一遍配置 我会疯掉的。 我的机器有 30 多个 docker ,一般人不会再额外备份 docker ;还有大量的网盘同步设置,群晖之间互相同步数据。
    xjzshttps
        31
    xjzshttps  
       15 小时 26 分钟前
    我是觉得阵列还是需要上,
    但是推荐 zfs 等软件阵列,自带数据校验+快照的。

    我是使用的 zfs 的 raid10+ 定时快照。
    单纯讲 zfs ,
    不出现文件系统级别的恶行 bug 或 nas 本身被入侵加密勒索是可以看作有备份的。
    任何两块盘拿出来都能读出数据,还能回滚到特定时间。

    不过重要常用数据还是有 syncthing 多设备同步+syncthing 快照。
    YaakovZiv
        32
    YaakovZiv  
       14 小时 22 分钟前
    这是软件组建 raid 失败,所以数据并未在两个盘完整同步。真实使用的是硬件 raid 还是软件 raid 。
    RightHand
        33
    RightHand  
       14 小时 8 分钟前 via Android
    raid1 是当一块硬盘坏了的时候还能让你在进行备份一次的机会
    ashong
        34
    ashong  
       14 小时 7 分钟前
    raid1 本来也不是备份,raid1 + snapraid + 冷备
    zhandouji2023
        35
    zhandouji2023  
       13 小时 36 分钟前 via Android
    我有两个 4 盘位威联通,都组了 raid5,然后 2 号威联通同步 1 号威联通文件
    shakoon
        36
    shakoon  
       12 小时 47 分钟前 via Android
    最近我 pc 上用两个 6t 的紫盘组了 raid0 ,速度得到大幅提升。存的都是照片和视频,在 nas 上有备份,所以完全不担心。
    Lentin
        37
    Lentin  
       12 小时 11 分钟前
    老生常谈了,磁盘阵列不是备份
    https://201.ustclug.org/images/raid-is-not-backup.jpg
    msg7086
        38
    msg7086  
       4 小时 19 分钟前
    @ryd994 #24
    > 因为重建耗时超过 24 小时,且全程是满负荷读写,非常有可能在重建过程中再挂一块。

    这里其实有个误区,通常并不是因为满负荷导致再挂一块,而是因为第二块其实早就挂了,只不过是在重建的过程中再次「发现」了第二块硬盘挂了而已。

    扇区校验错误只有在读取扇区的时候才会被发现。也就是说,一般家用 RAID 环境,硬盘可能不知不觉早就已经千疮百孔了,因为某一次读取到了已经有错误的扇区,导致硬盘报错离线,然后重建阵列的时候轻易地读到了另一块硬盘上已经有错误的扇区,这才表现出好像是「重建时再挂一块硬盘」的表象。

    要解决这个问题,其实很简单,设置每隔一段时间做一次 scrub 就行了。scrub 本身就是模拟重建过程,如果硬盘已经千疮百孔,不至于到重建的时候才发现。
    jjx
        39
    jjx  
       3 小时 37 分钟前
    家用没必要上阵列,不过得确需要更简单的多盘备份工具
    mrzx
        40
    mrzx  
       2 小时 31 分钟前
    @msg7086 这就是为什么硬盘不要买一个批次的,而且要提前到 5 年左右就要主动更换了.

    并且群晖的硬盘健康检测机制存在问题.群晖是易用,但 SHR 的数据恢复就是一坨屎.

    我 2012 年就开始用 NAS 了,那时候是 freenas,现在改名 truenas,硬盘不知道已经坏了 7 块,还是 9 块了,一直用的 raidz1(类似 raid5,只允许坏一块盘),连硬件平台都更换了 3 波了..系统盘一直拿一块 16G 的 SLC 颗粒 U 盘(2 块 U 盘组 raid1),数据安全性拔高了不少

    硬盘只用企业级 CMR 硬盘,那个寿命跟家用级的硬盘也是不能比的...

    我现在 NAS 也做了自动快照,并不怕中勒索病毒,大不了就丢失 1 天的数据,立刻还原..
    obeyatonce
        41
    obeyatonce  
       1 小时 36 分钟前
    学到了,我就是那种拿 raid 当备份的 nas 用户。。。。这就去做冗余备份
    charles0
        42
    charles0  
       1 小时 23 分钟前 via iPhone
    现代的数据安全小贴士:
    1. RAID 不能代替备份
    2. 没有测试过能恢复数据的备份不算备份
    3. 备份遵循 3-2-1-1-0 原则( 3 份数据、2 种介质、1 份异地、1 份不可变/离线/空气间隔、0 恢复错误),其中 0 恢复错误指的是必须定期测试恢复数据
    charles0
        43
    charles0  
       1 小时 14 分钟前 via iPhone
    @msg7086 除了 scrub ,还有定期测试能否从备份中恢复数据,很多人强调过这一点,比如现代的 3-2-1-1-0 原则里的 0 恢复错误,要求定期从备份中恢复数据并进行校验,确保备份真正可用
    charles0
        44
    charles0  
       1 小时 9 分钟前 via iPhone
    @luoshengdu 你这些应该直接用分布式数据库了
    ryd994
        45
    ryd994  
       26 分钟前 via Android
    @msg7086 #38 持续读写负载导致发热、磨损,还是很严重的。虽然和硬盘的正常寿命比可能九牛一毛,但也可能是最后一根稻草。特别是如果都是同批次或者同时期购买,那概率就更大了。我的 nas 是希捷和西数不同型号混用,而且还有一块备件盘偶尔会换掉,避免磨损程度一样。

    此外,硬盘还有 ure 的问题。家用盘一般标称 10^-15 ,保守估计只能算它 10^-14 甚至更低。10TB 也不过是 10^13B ,所以这个概率就不可忽视了。所以只有一盘冗余是绝对不够的。

    @mrzx #40 truenas 的系统盘不需要用高级 SSD 。备份一下配置就够了。系统盘上没有什么有价值的数据。

    然后 smr 盘也不是绝对不能用。我的 raidz2 6 盘阵列里就有 2 块 smr 盘。smr 如果从零开始填数据,完全没有问题。性能差一点,但也超过 100MB/s 。
    但是绝对不能往有数据的 zpool 里加空的 smr 盘,resilver 过程是持续随机写入,smr 盘能掉到 1MB/s 以下。
    怎么办?你需要有一块同容量或更大的 cmr/ssd 作为暂存。先用 cmr 盘重建。重建完成之后下线 cmr 盘,dd 复制到 smr 盘上,再把 smr 盘加回阵列里,之后只需要很少 resilver 就能同步。如果能把 zpool 下线就更好,那就连 resilver 都不需要。
    Pteromyini
        46
    Pteromyini  
       19 分钟前
    raid 不是备份用的啊,搬个老回复:
    阵列提供服务保证,备份提供数据保证
    RAID0:提高顺序性能->增强存储服务质量
    RAID1-X:冗余数量内硬件损坏不中断服务提高系统 SLA->增强存储服务持续性
    热备、冷备、异地:提供数据备份和安全保证。
    家用或者某些临时写入场景,冗余阵列的目的基本是保证提供最低限度服务和有机会导出阵列内的资料而不是直接重建。
    个人认为:
    正确做法是:导出资料、上热备、下线出错阵列、线下尝试恢复阵列或者抛弃
    关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   2286 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 100ms · UTC 04:50 · PVG 12:50 · LAX 20:50 · JFK 23:50
    ♥ Do have faith in what you're doing.