6块300GSCSIRAID5,两块硬盘损坏后的数据恢复过程
【用户单位】 XXXX网站 【数据恢复故障描述】 DELLPOWEREDGE2850服务器,内置6块300GSCSI硬盘,组成RAID5,安装LINUXREDHAT4操作系统,存储大量照片,文件系统采用EXT3。 据后期推断,早先已有一块硬盘离线,但机房内并未发现,直至另一块硬盘掉线后系统瘫痪才知道。 DELL工程师建议将其中一块硬盘强制上线,但同时指出操作具有风险。 用户将某盘强制上线后,发现操作系统启动时异常,感觉不妙,于是关掉服务器,寻求专业数据恢复机构服务。 【数据恢复故障分析】 此类故障非常普遍,RAID5仅支持唯一一块硬盘掉线的冗余保护,当两块硬盘先后离线后,RAID即无法通过运算提供完整数据块,RAID便会下线。同时,控制器为了稳定起见,只要有硬盘下线,便不会自动上线,这样不通过人为干预,RAID但会进入瘫痪状态。 通常情况下,因RAID控制器的敏感性,掉线的硬盘多数不会有严重的物理问题,许多甚至于硬盘完好(掉线是因为信号受阻,电源波动或控制器BUG等随机原因),所以数据恢复的可靠性较高。 强制上线具有较大的风险,如果上线错误,会导致控制器自动做某些不可逆的操作,如果再进入操作系统,因文件系统不一致,会导致修复,继而导致全部硬盘数据不一致。本例即是如此。 【数据恢复过程】 1、完整备份所有硬盘,发现有多块硬盘已经存在坏道,只是RAID没有读到,暂时无下线。 2、在备份中分析原来RAID的组成结构,构建虚拟RAID环境。 3、验证RAID结构正确,修正部分后期破坏的结构后将数据导出到另一中间存储。 4、重新用完好硬盘搭建DELL2950上的新RAID5。 5、将数据迁移至新RAID。 【数据恢复结论】 历时2天,数据库100恢复成功。上千万图片文件中抽样检测,有极少数出现问题(概率及理论推断,不超过万分之一) 【负责工程师】 张宇,联系方式4006505646-810移动电话:13522617215,工程师ID:810 【数据恢复服务承诺】 1.免费检测 2.与客户签订保密协议(非定制免费),对客户的数据严格保密 3.数据恢复不成功不收费 4.专业工程师提供服务,同时由其他工程师审核、会诊数据恢复方案及流程 5.数据恢复前报价,客户确认后工程师开始数据修复 6.整个恢复过程不会对客户的原盘有任何的写操作,以确保原盘的数据完全 |