V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
a342191555
V2EX  ›  NAS

DS918,遭遇两次 SSD 缓存损毁了

  •  
  •   a342191555 · 44 天前 · 4250 次点击
    这是一个创建于 44 天前的主题,其中的信息可能已经有所发展或是发生改变。

    DS918 下面有两个 M.2 插槽,本着不浪费插槽的原则,插了两块 HP 250GB 的 EX900 ,做 RAID-1 的 SSD 缓存群组。

    22 年 3 月底,有一天在拷贝大量文件时,NAS 突然发出 哔-哔 的声音,发现提示 SSD 缓存已降级,其中一块盘状态变成了“堪用”。在 PC 上查看 S.M.A.R.T ,没见到明显问题,写入量仅 8T (相当于全盘仅写入 32 次 )。

    那段时间 SSD 降价,于是在京东又买了两块 CUSO 的 500GB 硬盘,把前面两块 SSD 换下来了。刚刚,又是在拷贝大量文件(总大小>100GB )时,又有一块盘被干掉了。。因为 NAS 不在身边,暂时没在 PC 上看 S.M.A.R.T 信息,对于写入量我预测也相当低,因为平时使用非常少。

    哎,头疼…

    47 条回复    2023-02-10 11:36:01 +08:00
    shinession
        1
    shinession  
       44 天前   ❤️ 1
    N 年前入手过 412 和 914, 西数红盘 2T 4T 8T 的加起来有 8 块, 其中 6 块盘在 3 年内坏掉, 同期的台式机里 2 块西数盘十年都没坏, 后来就没再玩过群晖了, 找了个报废笔记本外挂硬盘盒搞定
    hanssx
        2
    hanssx  
       44 天前 via iPhone   ❤️ 1
    据说大内存比缓存好用,我使用的 32G 内存,没有缓存版,另外可以尝试只用一块盘做读缓存?
    GrayXu
        3
    GrayXu  
       44 天前   ❤️ 1
    好奇是完全坏了,还是只是出现掉盘
    documentzhangx66
        4
    documentzhangx66  
       44 天前   ❤️ 1
    监控磁盘温度,然后再拷贝大量文件试试。
    a342191555
        5
    a342191555  
    OP
       44 天前
    @shinession #1 啊我里面放的 HDD 也是 WD 的红盘,有点慌

    @hanssx #2 这个 CPU (J3455) 看 ark.intel.com 上写最大 8GB ,但我用的是 8GB x 2 也能识别,没想到 32G 居然也行? 我之前是用一块盘做只读缓存,也的确一直没遇到什么问题。

    @GrayXu #3 不是完全坏,可以理解成掉盘,在 DSM 里能看到那个盘,但它的状态是损毁,即使在 PC 上格式化后再插回去,也依然是损毁,无法被 DSM 使用,但在 PC 上还是能正常用的,读写量较低,但是剩余寿命会掉得比较明显。

    @documentzhangx66 #4 这个缓存已经损毁了,再拷贝就和 SSD 缓存无关,应该也没什么帮助了。刚刚损毁时看了一下温度,基本是室温,十几度。
    Admstor
        6
    Admstor  
       44 天前   ❤️ 1
    你说的 8T 是 host writes 还是 NAND writes?
    250G 的 TLC,用作缓存的,实际因为 SLC 模拟的关系,写入放大会很多很多
    dingdangnao
        7
    dingdangnao  
       44 天前 via iPhone   ❤️ 1
    我的 918 有一天早上突然连不上,电源灯一直闪,重置之后一两分钟 就又开始连不上,闪….然后走售后,售后修了半个月 回来了,机器给我磕坏了…..最后退了 85%的款……现在硬盘还在闲置😂😂
    Huelse
        8
    Huelse  
       44 天前   ❤️ 1
    因为固态盘自带的缓存设计不同,所以得小心使用。一般建议把固态作为下载的临时存储区,下载完了转机械盘这样用。
    a342191555
        9
    a342191555  
    OP
       44 天前
    terranboy
        10
    terranboy  
       44 天前   ❤️ 1
    建议不要用 SSD 缓存 建议内存大点
    a342191555
        11
    a342191555  
    OP
       44 天前
    @dingdangnao #7 就,奇奇怪怪的,如果黑群自己还能看看,白群真没办法了👀


    @Huelse #8 群晖的 DSM 关于缓存是个黑盒,只要设置好后它会自动使用,无法手工做到“下载到临时的 SSD 存储”这件事。而且它也一直是作为“缓存”使用,随时移除也没有关系。
    ZeroClover
        12
    ZeroClover  
       44 天前   ❤️ 1
    918 这玩意儿就是这样,我的 SSD 缓存也被它认为损毁,问题是插电脑上不管是诊断工具还是各种系统、FreeNAS 之类的都认为这盘一点儿问题没有。
    cue
        13
    cue  
       44 天前 via iPhone   ❤️ 1
    你这还好,我的 920+已经在半年之内遭遇了 3 次硬盘损毁,( 2 块 4T 蓝盘,1 块 16T 的 HC550 )现在不得不用一块 2.5 寸 2TB sata ssd 顶着,要是固态也跪了我就砸了这破玩意,整个 NAS 还不够闹心的。
    xyjincan
        14
    xyjincan  
       44 天前   ❤️ 1
    缓存盘用大容量的试试?
    mrzx
        15
    mrzx  
       44 天前   ❤️ 1
    @a342191555 就是温度太高了,多贴一些散热片看看

    观察室温是没用的,主要是 2 块 SSD 放在 918 这么小的盒子里。怎么散热?

    后续看 SSD 发展都需要主动式散热了(加风扇)
    a342191555
        16
    a342191555  
    OP
       44 天前
    @terranboy #10 上面有虚拟机、有 docker 跑数据库,内存永远不够用


    @ZeroClover #12 是的,又有一块空盘不知道拿来干什么用了


    @cue #13 HDD 损毁感觉更闹心,做 SHR 或者 RAID 的话,还要让它重建


    @xyjincan #14 缓存空间一直没用完,RAID1 之后可用 500G ,长期占用 100-200G ,可能再大也没有帮助


    @mrzx #15 我的意思是在它损毁刚发生的时候,在存储管理器里看过这块盘的温度,显示的就是 15-16 度,没有很热
    a342191555
        17
    a342191555  
    OP
       44 天前
    @mrzx #15 的确没贴散热片,不过这次之后也懒得再搞 RAID-1 做缓存了,有点烦心
    Autonomous
        18
    Autonomous  
       44 天前
    群晖的 SSD 缓存机制有问题,SSD 写入之后长时间不会释放,盘快写满时会有写入放大效应。推荐的做法是用 SSH 命令把 SSD 作为存储空间使用。
    1145148964
        19
    1145148964  
       44 天前 via Android
    你需要企业级固态
    写 1pb 不眨眼那种
    SuperXX
        20
    SuperXX  
       44 天前 via iPhone
    要不要试试 傲腾,就是容量比较小,Newegg P1600X 118Gb 打折 65 刀左右
    d7101120120
        21
    d7101120120  
       44 天前
    我的 918+缓存使用的是金士顿 A1000 和铠侠的 RC20 ,都属于低端的 SSD ,不过并没有出现过问题。
    kappa
        22
    kappa  
       44 天前
    之前做缓存两年挂了两根 Intel 的,重新买了还是改成独立的 Storage Pool 跑 Docker instance 了。。
    WhatTheBridgeSay
        23
    WhatTheBridgeSay  
       44 天前
    群晖 DSM 就是动不动就报损毁的典型代表了,估计只有买群晖牌子的硬盘才能解决
    silymore
        24
    silymore  
       44 天前 via iPhone
    @a342191555 坏掉盘的能走售后吗
    elfive
        25
    elfive  
       44 天前 via iPhone
    楼主和我的 SSD 型号一模一样,不过我买得早,那个时候也是不到小半年,提示 SSD 损毁。我直接找 JD 换新的,然后配置成只读缓存,用了 3,4 年了,再也没出过问题。
    alfawei
        26
    alfawei  
       44 天前 via iPhone
    @WhatTheBridgeSay 使用了白裙七年,黑裙 3 年 都沒有遇到損毀問題
    luciferlulu
        27
    luciferlulu  
       44 天前 via Android
    我虚拟的硬盘都能损毁 一个 2t 的虚拟磁盘文件被群晖认为损毁了 当然我的群晖也是虚拟机里面安装的 至此群晖列入了我的黑名单 反正开着也是浪费 CPU
    zayia
        28
    zayia  
       44 天前 via iPhone
    用 nas 快 5 年了,第一个是 ds218 ,第二个是黑群晖,第三个是 ds920+,就坏了一个 4t 红盘
    zcq100
        29
    zcq100  
       44 天前
    群晖的损毁原因是磁盘阵列数据不同步,并不是硬盘出故障。用 basic 模式,基本上不再出现损毁。
    a342191555
        30
    a342191555  
    OP
       44 天前
    @Autonomous #18 以前想过,后来懒就没管了🤣

    @1145148964 #19 @SuperXX #20 做缓存而已,这样的投入不如放在更有效的地方,比如内存或者干脆坏了就换

    @d7101120120 #21 我平时也没遇到问题,但两次出现 SSD 缓存损毁都发生在从 USB 硬盘拷贝大文件到 NAS 的存储池

    @kappa #22 挂的原因是什么呢

    @WhatTheBridgeSay #23 群晖对硬盘健康度的要求太苛刻了

    @silymore #24 可以,HP 坏掉的那坏向京东申请售后了。我觉得两个 HP 盘换下来之后,寿命不一样,就没继续用它们了。

    @elfive #25 你坏掉前发生了什么吗,还是突然间坏掉的。我之前用只读缓存也一直没问题。

    @alfawei #26 @zayia #28 很棒,你们的硬盘寿命也很长

    @luciferlulu #27 愿意折腾的话,自建 NAS 还是更好

    @zcq100 #29 basic 坏掉就彻底没了🤣
    sm1314
        31
    sm1314  
       44 天前
    可以考虑买企业级 ssd 的洋垃圾 便宜耐操 有断电保护
    gogorush
        32
    gogorush  
       44 天前
    我的 920 也坏了一个 感觉这个 ssd 的管理有点问题
    jiezhi
        33
    jiezhi  
       44 天前
    920 插了 2 条 512 做读写缓存,前两天报一块故障,昨天拿出来换了位置后又继续用。不过提示缓存是上个版本 DSM 创建的,建议删了重新创建。
    manyeechen
        34
    manyeechen  
       44 天前
    之前看到说缓存的容量要设置到 80%左右,不要全部设置就可以,还有就是损毁了还能用
    anyinuo0413
        35
    anyinuo0413  
       43 天前
    曾经用 HP EX900 、EX920 掉盘 n 次,最后京东折价退款了
    findex
        36
    findex  
       43 天前
    nas 怎么省都可以,就是不可以省硬盘。因为数据无价。

    推荐西数黑盘+hsgt 企业盘。
    红盘+紫盘(不考虑),最次蓝盘。SSD 上三星。
    balduncle
        37
    balduncle  
       43 天前
    要缓存有什么用?我直接买的两块 hc550 ,直接下载在企业硬盘里面。系统盘是用的淘汰的 ssd 120g
    zx900930
        38
    zx900930  
       43 天前
    我用 pve 自建 ssd 缓存池, 用的旧的 thinkpad 上拆下来的 intel nvme ssd
    用了几个月, 目前写入 10T 左右
    Percentage Used: 4%
    Data Units Read: 82,758,230 [42.3 TB]
    Data Units Written: 18,900,082 [9.67 TB]

    可以把 110MB/s 左右读写速度的 HDD 直接撑满 2.5G 网络带宽上限, 反正对我来说缓存就这么一个用处, 拆旧的笔记本也算是废物利用了.
    Ericality
        39
    Ericality  
       43 天前
    群晖有缓存放大问题 上面有提到 个人用其实缓存意义不大 因为他只对小文件读写有一些效果 所谓放大就是在快满的时候只擦除最后一部份数据 然后写入 就导致单独的几个区块被反复磨损 进而导致硬盘寿命快速下降 最终损毁 所以建议一定上 ssd 缓存的话 只用额定空间的 80% 给 ssd 一些均衡损耗的空间
    peasant
        40
    peasant  
       43 天前
    https://s3.bmp.ovh/imgs/2023/02/06/0f8791c3050a7b73.png
    带缓存的盘只用来备份自己的数据,用着一切正常,可能因为我存的东西比较少,下载的文件放在另外单独的盘了,不经过缓存
    goodsavage
        41
    goodsavage  
       43 天前
    格式化重建就好了,会有随机崩溃的问题
    piku
        42
    piku  
       43 天前
    黑裙能理解。白裙这个情况建议先检查供电性能问题?也不排除硬盘自身不行
    nkidgm
        43
    nkidgm  
       43 天前   ❤️ 1
    DS 918+ 这款长期 24 小时开着早晚会翻车的,无一例外。
    它用的是 Intel Celeron J3455 ,这个 cpu 有时钟信号衰退的 bug ,属于硬件 bug ,无法通过更新 cpu 微码修复的。

    出处: https://news.mydrivers.com/1/645/645646.htm
    mapleincode
        44
    mapleincode  
       43 天前   ❤️ 1
    题主是缓存损毁、缓存损毁、缓存损毁、缓存损毁

    前面不少回答都在硬盘损毁,这是两件事。

    先说我的情况,我有一个黑裙使用一根 256 的 SSD 作为读取缓存,之前有长期开机记录,未出现问题。

    题主的情况,感觉更像像是群辉自身的缓存机制问题。

    建议也是不使用缓存,因为群辉的缓存对于千兆网提升极为有限
    standin000
        45
    standin000  
       42 天前
    @Autonomous 请教用 SSH 命令把 SSD 作为存储空间使用是啥意思,ssd 本来就可以做存储空间吧
    Autonomous
        46
    Autonomous  
       42 天前
    @standin000 DS918 不允许 m.2 插槽位的 SSD 做存储空间,只能通过 SSH 打命令完成。

    请参阅:Use NVME SSD as storage volume instead of cache
    https://www.reddit.com/r/synology/comments/a7o44l/guide_use_nvme_ssd_as_storage_volume_instead_of/
    oyaxira
        47
    oyaxira  
       39 天前
    都那么恐怖吗.
    我用的三星 980 x2 做的 ssd 缓存.
    ds920+ 跑了一年半了.长期开着 7x24 小时待机,不过任务不多,下载也不频繁,没遇到什么问题.
    关于   ·   帮助文档   ·   博客   ·   nftychat   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   实用小工具   ·   4478 人在线   最高记录 5556   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 47ms · UTC 08:54 · PVG 16:54 · LAX 01:54 · JFK 04:54
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.