早上才说完自己行为不妥,会掉人品的,然后晚上真的掉了,重启acm的服务器,然后就再起不来,去机房一看,RAID阵列提示degraded。停在了启动的位置上面。

好吧,上网一段搜索,得到了这样一组解决方案:

首先,顺着degraded状态先进系统再说,当然,这里可能因为我比较幸运,用的是RAID10阵列,所以容灾还是挺好的。

进入系统后,用 mdadm -D /dev/md? 来检查那个阵列出了问题,我的问题是在/dev/md1上:

/dev/md1:
Version : 1.2
Creation Time : Mon Nov 14 16:36:47 2011
Raid Level : raid10
Array Size : 58591744 (55.88 GiB 60.00 GB)
Used Dev Size : 58591744 (55.88 GiB 60.00 GB)
Raid Devices : 2
Total Devices : 1
Persistence : Superblock is persistent

Update Time : Fri Nov 30 21:24:23 2012
State : clean, degraded
Active Devices : 1
Working Devices : 1
Failed Devices : 0
Spare Devices : 0

Layout : near=2
Chunk Size : 512K

Name :localhost:1 (local to host localhost)
UUID : 5a2—HIDDEN–13f7b
Events : 1—HIDDEN–4

Number Major Minor RaidDevice State
0 0 0 0 removed
1 8 18 1 active sync /dev/sdb2

因为装的就是RAID10,所以很明显,/dev/sda2这个分区没组上阵列,于是执行mdadm /dev/md1 -a /dev/sda2 把它加回来。

在看看 mdadm -D /dev/md1 的时候,就多了一些信息了:

…
State : clean, degraded, recovering
…
Rebuild Status : 25% complete
…

等完成后,重启就好了。不过中间过程,查资料什么的,我走了不少弯路。