是否可以现在提前正常关机?( btw 无 ups )
1
crc8 2020-09-11 14:09:13 +08:00 2
这个问题我觉得发明 RAID5 的时候已经有人想过了,不过呢,我看到群晖二字后,有点忐忑。
|
2
Ariver 2020-09-11 14:10:20 +08:00 1
你可以现在直接把新加的硬盘拔下来看看会发生什么。
|
3
Tink 2020-09-11 15:46:02 +08:00 via Android
会
|
4
Tink 2020-09-11 15:46:15 +08:00 via Android
现在赶紧买 ups,还来得及
|
6
elfive 2020-09-11 16:04:28 +08:00 via iPhone
不确定,我组的是 Raid10,重建过程中正常关机,重启后从头重建,没有啥问题。
但你这个是扩容,涉及到数据资料在硬盘间的移动,可能会出问题,建议赶紧电话联系群晖工程师,直接问得到的答案会比较靠谱。 如果联系不到,也没买到 UPS (实际买了不一定有用,UPS 要能撑过检修的那段时间,价格可能也不菲了),你可以尝试进 DSM,在右上角用户那里点击关机,如果有警告提示,则按提示操作(提示不允许那就是不能关机),如果没有提示(在不需要我负责的情况下)可以尝试关机…… |
7
mhycy 2020-09-11 16:14:52 +08:00
会,基于 MDADM 的群晖甚至会写花
可以确定的是,掉电过后,原始数据和扩容数据一并乱套,且如果直接开机会导致数据有永远不可挽回的丢失 |
8
mhycy 2020-09-11 16:16:42 +08:00
正确做法是,准备好灾难恢复:
把磁盘一个个独立接入到某个 PC,并准备好目标写入的磁盘(大于或等于阵列可用容量) 然后写脚本手动解析阵列元数据,并分段重建 |
9
mhycy 2020-09-11 16:17:10 +08:00
补充:此灾难恢复我做过,所以我非常清楚这东西有多折腾
|
10
mhycy 2020-09-11 16:18:02 +08:00
另补充:阵列卡有同样问题
|
11
raptor 2020-09-11 16:34:31 +08:00
所以个人的人生经验就是:不要用 RAID5
|
12
terrancesiu 2020-09-11 16:44:49 +08:00
ups 没用啊,顶不了多久。赶快买发电机+油。
|
13
sunziren 2020-09-11 16:51:34 +08:00
点进系统,然后暂停扩容,明天来了继续扩容
|
14
laminux29 2020-09-11 16:52:21 +08:00
又是 X-Y 问题。
你的问题并不是说断电会不会影响 raid 5 内的原始数据,而是扩容以及其他存储结构调整之类的事情,本身就是高风险操作,做这种操作之前,都应该提前做数据备份。做了备份后,就算扩容期间遇到突然断电,甚至操作设备突然故障,都不怕了。 |
15
qwerthhusn 2020-09-11 16:53:05 +08:00
柴油机,油,现在开车去买,不晚
|
16
springz 2020-09-11 16:54:16 +08:00
没事,事先关机就行。
|
17
springz 2020-09-11 16:55:11 +08:00
我这么干过一次,不信可以马上关机开机看看,进度都会保存。群晖的是软 raid,没关系的。
|
18
loading 2020-09-11 16:55:56 +08:00 via Android
群晖客服电话,都付钱了,白裙你有啥好害羞的?
|
19
springz 2020-09-11 16:56:19 +08:00
突然掉电不知道啥情况,但是中间关机是没问题的。
|
20
shyy06 2020-09-11 16:57:19 +08:00 1
我来回答下,在虚拟机环境中少量数据模拟软 RAID 扩容,过程中强制关闭虚拟机模拟断电,重新开机后数据不丢失,进度不丢失.
正式环境下使用群辉扩容没测试过,理论上,RAID 卡比软 RAID 应该更靠谱. 另外分享一条经验:业务服务器尽量不要采用 RAID5 阵列,RAID5 虽然磁盘利用率高,日常使用没问题,但是一旦有硬盘损坏或者需要扩容时候,由于 RAID5 的 I/O 性能限制,重建的时间会比较久,且需要对硬盘进行全盘擦除写入,这时候硬盘损坏概率要远高于平时,这个时候一旦有硬盘故障,将会是致命的。 |
21
testver 2020-09-11 17:11:51 +08:00
可以暂停的啊
|
22
lzz2394677796 OP @testver 完蛋了!没有暂停按钮,不能暂停。关机操作,提示不能关机,有 volume 操作进行中!听天由命了
|
23
jones2000 2020-09-11 17:30:04 +08:00
用 UPS, 可以顶 1-2 个小时。
|
24
xianqin 2020-09-11 18:02:36 +08:00 3
连 UPS 一起搬回家
|
25
ferock 2020-09-11 18:08:09 +08:00 1
|
26
loarland 2020-09-11 18:18:53 +08:00
单盘用户表示无所畏惧
|
27
superrichman 2020-09-11 18:19:22 +08:00 via iPhone
都这个点了,不如去烧个香 /doge
|
28
lzz2394677796 OP 如果 raid5 扩容逻辑严密,现在应该这样: 正在对新加入硬盘预填数据,老硬盘们数据进行拆分。等新硬盘 100%完成,老硬盘们进入新模式,丢弃重复数据。如果异常中断,则老硬盘们也不丢数据。
|
29
ntgeralt 2020-09-11 18:38:07 +08:00
建议你现在直接右上角-关机,群晖有关机指令,远好过断电
|
30
caltong 2020-09-11 19:11:47 +08:00
本来没 UPS,要上的话还是得断电一次的
|
31
felixcode 2020-09-11 21:03:35 +08:00 via Android
至少得正常关一下机,突然断电后 raid 的状态谁都不敢确定
|
32
sampeng 2020-09-11 21:21:16 +08:00 via iPhone
raid5 ? 40 小时数据?等着修数据吧。50%概率坏掉
|
33
geekvcn 2020-09-11 21:34:11 +08:00 via iPhone
说了多少遍了用 raid1,就是不听用 raid5,raid5 比单盘还麻烦
|
34
tim1103 2020-09-11 22:00:09 +08:00
关机总比突然断电好
|
35
gabon 2020-09-11 22:03:54 +08:00 via Android
插眼,希望明天分享一下经验,以后吸取教训
|
36
ttimasdf 2020-09-11 22:11:56 +08:00 via Android
😂如果对磁盘性能没要求,等重建以后改 mergerfs 吧,灾后重建就是把坏
|
37
SuzutsukiKaede 2020-09-11 22:16:51 +08:00
希望硬盘没事
|
38
HertzHz 2020-09-11 22:29:34 +08:00
默哀
|
39
LokiSharp 2020-09-11 22:42:48 +08:00
实际使用的话 raid5 和 raid0 没啥区别其实。。。
|
40
lzz2394677796 OP 结果暂未知!通知明天上午检修,短电确切时间不知,重新计算粗略 40 小时有误,至 17 时是 8 小时完成 30%,精确时间可推算。周一启动看结果(ー ー;)
|
41
lzz2394677796 OP 真服了群晖!找不到一个能联系到的电话,狗屁 400
|
42
morize 2020-09-12 00:03:10 +08:00
去年去群晖的台湾总部开放日参观,介绍过这种情况,说丢了但是后来搞了半天给客户恢复了。
|
43
jzphx 2020-09-12 00:04:16 +08:00
@lzz2394677796 等待开奖
|
44
morize 2020-09-12 00:04:25 +08:00
@lzz2394677796 没有的,当时问这块说,全球的客服都是台湾接的,就那么十来个人,只有工作日接。
|
45
mosliu 2020-09-12 00:11:11 +08:00
等下周一看结果 很好奇 希望楼主好运
|
46
lzz2394677796 OP 6 盘位,2 到 5 号位四块红盘。留 1,6 盘位。目前 1 盘位放了 ssd 加速,今天动 6 盘位扩容中。到时容量再告急,就换动 1 盘位。
|
47
LokiSharp 2020-09-12 00:39:09 +08:00 via iPhone
@lzz2394677796 可能会重建失败,认不出,不过大概率能找客服修好
|
48
KasuganoSoras 2020-09-12 00:48:20 +08:00
🙏希望硬盘没事
|
49
lzz2394677796 OP 如果至 17 时是 8 小时完成 31%,精确时间可推算:终需 25 小时,至 17 时还剩 17 小时,也就是明天上午 10 时 100%。从下午粗略估算到傍晚估算,实际扩容速度不会慢于估算时间。假设实际提早半小时,也就是明日上午 9 时 30 分 100%。检测工作算 9 时开始,估计不会马上断电,还是有机会 finis h 的。只能这样了
|
50
seakwan 2020-09-12 00:53:25 +08:00 via Android
周一看结果
|
51
lzz2394677796 OP 其二,如果没 finish 前异常断电,我猜测,大概率是开机重 0 新计算新增加硬盘,只是废时。因为显示扩容中提示,设备总容量仍旧显示着就容量。功能设计时机制应该是考虑到的
|
52
lzz2394677796 OP 原本设想 1 号闲置盘位放一个更大容量 basic 独立硬盘,为 raid5 做定时备份。后来想想都 raid5 了,还备份什么啊
|
53
lzz2394677796 OP qnap 时 raid1 闪灯一个盘坏过,取出后插上新盘 nn 小时后恢复正常,很方便。所以群晖我用了 raid5,说是闪灯了同样操作,也可以重建,只是计算时间更长,省容量但废重建时间也没觉得不好。
|
54
elfive 2020-09-12 07:17:53 +08:00 via iPhone
@lzz2394677796 #53 尽量别用 RAID5,重建过程中,硬盘容量越大,失败几率越高,这点在 V 站和很多地方是能够找到准确数据支持的。加上如果是用的同批次的硬盘(寿命接近)那么失败几率进一步提高……
|
55
YAFEIML 2020-09-12 08:42:41 +08:00
群晖硬盘管理太渣,适合 0 折腾
|
56
geniussoft 2020-09-12 09:04:49 +08:00
1. 能用 UPS 解决的问题,不用 UPS 。
2. 不用 UPS,提前关机也能解决的问题,非要不关机。(上面好几个人都告诉你了) 3. 非要作死,那就可能会死。 4. 说阵列卡更好的,那只是因为阵列卡上的电池。 |
57
lzz2394677796 OP @geniussoft 回答过了,dsm 无法进行暂停和关机操作。不能关机,ups 能顶过多久?
|
58
lzz2394677796 OP 对了,大家有经验吗??一般 raid5 装全新红盘 7*24 多久开始有故障?撑的过两年吗?
|
59
DopaminePlz 2020-09-12 09:41:58 +08:00 via Android
@qwerthhusn 买了也没有用,怎么把市电切换为后备用电?备用电源在停电几分钟前跟市电同时供电?万一两者相位相反柴油机供电和市电电路形成回路,两个都毁了。
|
60
ryd994 2020-09-12 10:22:53 +08:00 via Android
@DopaminePlz 那人家机房后备电源怎么做的?
ATX 电源标准要求断电后有零点几秒的维持能力。备用电源在这点时间内接上就行。这点时间当然不可能足够发电机启动,所以需要基于电池的 UPS,然后等发电机稳定后再切发电机。反向馈电当然有可能,也当然需要安装转换开关。 换成楼主的例子:UPS 是必须的。找人 24 小时值班。如果停电,把 UPS 拔下来插到发电机上去。小型发电机启动很快的。 如果要实现绝对不断电,也有。在线式 UPS 。输入电源整流成直流电,再逆变输出。电压频率相位全都无所谓。断电就直接从电池逆变输出。 或者更好的,高级的服务器电源内置电池。能撑个几分钟。就算 UPS 出问题也能顶一下。我就试过拔了插头还在跑的撞鬼场景。当然一直不插电还是会挂的。 |
61
ryd994 2020-09-12 10:27:44 +08:00 via Android
@lzz2394677796 你就看看现在用多少时间,再想想重建要多少时间? raid5 就是赌这段时间不会挂第二块?实际上呢?怕什么就会来什么。
你肯定没有演练过。比如没事突然拔掉一块盘这种事。 |
62
neroxps 2020-09-12 11:18:19 +08:00
楼主感觉你还是先把数据备份了。断电就真 GG 了
|
63
DopaminePlz 2020-09-12 11:22:05 +08:00 via Android
@ryd994 问题是后备电源是预先安装好的。楼主这里机器已经在运行了呀。
|
64
gamexg 2020-09-12 11:52:43 +08:00
备用电源目前的情况应该也能加上
先带电并接一个 双电源自动转换开关,主电源接到目前的市电上面,备电源接到 ups 。 然后掐断未经过转换开关的市电线路,使得电完全走转换开关。 注意转换开关需要选择 pc 级别的,也就是切换时间小于 30ms 的。 |
65
lzz2394677796 OP 临时抢备份是可行的,目前 raid5 数据都是可读可写的,usb3 上去可复制。但容量大速度慢,几十 t 数据 25 小时内抢不下来
|
66
lzz2394677796 OP @gamexg 30ms,这么专业
|
67
mhycy 2020-09-12 12:12:05 +08:00
|
68
geniussoft 2020-09-12 12:18:01 +08:00 via iPhone
|
69
lzz2394677796 OP 上午 9 点通知的检修开始,不知道几点断的电。等周一按电源键看结果了(ー ー;)
|
70
lzz2394677796 OP 我猜大概率群晖设计扩容时应该是考虑到的,毕竟群晖价格高三分之一,之前一直用 qnap,一直对 qnap 技术就很满意了。
|
71
mhycy 2020-09-12 12:42:24 +08:00
@lzz2394677796
群晖基于 MDADM,别说考虑到,别自动给你 resync 就烧高香了 |
72
mhycy 2020-09-12 12:43:12 +08:00
@lzz2394677796
另外,基于 MDADM 的系统按电源键就是赌博,一旦开始 RESYNC 你的数据是无法挽回的丢失 |
73
mhycy 2020-09-12 12:43:59 +08:00
@lzz2394677796
再次声明,这东西我修过!!别无视正确答案啊!! |
74
lzz2394677796 OP @lzz2394677796 我还有一个支持这个不破毁原数据原理的理由,就是选择扩容时,记得好像是二选一,满速检测硬盘和快速不检测,因为是新硬盘我就选了快速。按照这个逻辑,如果我放了一块半坏盘,并选择了快速不检测,扩容时遇到异常失败应该会进入恢复状态
|
75
lzz2394677796 OP @mhycy 谢谢🙏
|
76
mhycy 2020-09-12 12:53:31 +08:00
坐等看戏
|
77
Yangz 2020-09-12 14:55:22 +08:00
强烈建议联系售后 ww
|
78
wanguorui123 2020-09-12 15:49:22 +08:00 via iPhone
买几个移动硬盘赶紧备份重要资料
|
79
coala 2020-09-12 16:20:14 +08:00
Reid5 非企业盘非常危险。重组成功率感人 ,还是早日 Reid10 Reid6
楼主这种情况... 期待结果 |
80
reus 2020-09-12 17:03:14 +08:00
raid5 差不多等于无 raid,就是恢复时非常可能受到连击
|
82
ETiV 2020-09-12 17:48:32 +08:00 via iPhone
去买把锁头,给你们配电间加一把私锁,让他们没法检修不就完了。
|
83
lzz2394677796 OP 5 盘位 raid5,如果将来一盘报错换新,rebuild 一盘大概多久??可能要一周吗?
|
87
howellz 2020-09-12 20:16:44 +08:00
一路看下来,发现现在能认真把帖子看仔细、问题想清楚的人越来越少了,这还不是啥繁琐的技术问题。
让人家备份的,没看看现在无法中止操作了。 提醒用 UPS 的,没看看一是无法中止关机接上 UPS 了,而是人家也在不断提醒 UPS 能提供多长时间供电。 |
89
xcp3555 2020-09-12 21:08:27 +08:00
你这扩容系统不能中止吗?终止也行啊
|
90
ericww 2020-09-12 21:28:13 +08:00 via iPhone
@lzz2394677796 单盘 3T 6 个小时
|
91
yousabuk 2020-09-13 08:48:38 +08:00 via iPhone
学了一招:要进行如此重要如此长时间的数据操作前务必使用双供电系统线路,哪怕第二路不接(但是需要时可以直接接入),哪怕第二路使用柴油发电机呢。
|
93
ferock 2020-09-13 19:20:52 +08:00
持续关注中
|
94
kxuanobj 2020-09-13 20:55:36 +08:00
额。。为什么不试试休眠( hibernate )呢。。
|
95
enjoyCoding 2020-09-14 09:08:15 +08:00
周一了 数据还好嘛
|
96
lzz2394677796 OP 报告下情况如图: https://i.postimg.cc/52ZFNR84/image.png
教训是:UPS 对于 nas 还是重要的,不管撑半小时也好,断电时怀一起抱着上车找电源。 |
97
whenwind 2020-09-14 09:29:51 +08:00
结果当天就重建好了,今天才断的电?😂
|
98
lzz2394677796 OP @whenwind 不可能的,我要分析一下日志
|
99
MrYELiex 2020-09-14 10:38:29 +08:00
QNAP 用户 经历过重建断电
重建断电大概率会重建失败 重启后提示异常可以 resync 但是这个时候断电....我的结果是数据好 但是主板烧了 UPS 还是正解 如果可预期的断电且时间久 而且无法停止同步的话 那就只能先边同步边拷数据了 |