您所在的位置：首页 > 企业救援 > HP EVA数据恢复专题

企业救援Data Recovery

HP EVA成功案例

HP EVA8400存储数据恢复成功北亚数据恢复
【故障描述】某地法院一台HP EVA8400存储，2组扩展柜，物理磁盘由12个1T FATA磁盘（AG691A 454414-001）和10个300G 15K FC磁盘（AG690A 454411-001）组成，LUN数 ……更多 >>
HP EVA6400磁盘阵列硬盘报警数据恢复案例
恢复HP EVA6400磁盘阵列存储故障案例
HP EVA3000磁盘阵列误将数据库删除恢复案例
HP EVA6400磁盘阵列存储无法访问恢复案例
HP-EVA4100掉盘恢复案例
HP EVA6400磁盘阵列不能正常存储案例
HP EVA4400挂载文件显示未初始化案例

HP EVA恢复方案

HP EVA4400/6400/8400/P6000数据恢复解决方案

【引言】
       本文档建立在针对HP EVA的大量测试性研究基础上，所有的细节几乎均为对EVA的破译型研究，目前全球范围内尚未发现类似资料，故可能表述方式和结论并不精确，仅为参考之用。
      北亚数据恢复中心(www.datahf.net)为研究HP EVA系列算法，花费了大量的人力物力，目前应为全国唯一的研究此项技术的公司，转载请注明来源。

【前因】

      HP EVA4400/6400/8400因接近退役，已进入高故障区间，用户往往会认为花费几十万甚至上百万购买的eva系列应该是非常稳定的，但实际上无论多么昂贵的存储设备，使用的磁盘是相同或相似的。正如eva上销量极大的部件号为454414-001的1T FATA磁盘，其实就是臭名昭彰的希捷7200.11 系列的FC版，虽然前者正品售价仍高达近4K，后者却不足400，但两者的性能和稳定性表现几乎是相同的。这些1T FATA磁盘在经历2-3年的运行后，总会出现大批量的损坏，而且往往一旦损坏，几乎很难修复。一个我遇到的最夸张的案例，108块1T FATA的EVA6400，在半年内先后损坏50多块，这是让人惊讶的，实则也是正常的(缘于希捷这款产品的设计缺陷)。
     即便是使用15000rpm或10000rpm的FC磁盘，其实盘体也等同于希捷、日立等厂商的SAS磁盘(目前的EVA系列磁盘已经全部基于SAS了，即使是FC，也是通过转换电路实现SAS到FC的转换，如671148-001)。EVA是虚拟化的存储设备，平时数据会不断的迁移，加上应用通常较为繁重，所以磁盘的负载相对是较重的，也是很容易出现故障的。EVA是依靠大量磁盘的冗余空间，以及故障后rss冗余磁盘动态迁移来实现整个存储的数据保护，但随着越来越多的磁盘掉线，这种保护会接近临界，直至崩溃。
      通过eva command view下的 fieldservice执行强制激活命令，一则会导致cache dirty、数据块结构不一致导致数据出现损坏。二则修复只能建立在绕开坏道区域的基础上，如果坏道无法绕开，也是徒劳。
      另有一些情况：主机无法与扩展柜相连导致数据丢失，误删除vdisk等，也需要有切实的解决方案。
HP P6000系列控制器与EVA系列内部算法完全相同，不再单独提及。

【eva系列存储结构原理概述】

      VA系列存储是一款以虚拟化存储为实现目的的HP中高端存储设备，内部的结构组成完全不同于普通的基于简单RAID的存储，EVA内部称之为VRAID。包括一些资深的HP工程师，对EVA的理解其实是有误区的(也可能是HP官方的宏观描述)
     EVA会对每个物理磁盘(简称为PV)进行签名(写在每个磁盘的0扇区)，签名后即分配进不同的DISK GROUP。在disk group中，类似于aix 的卷管理，或HP LVM的卷管理一样，每个PV会按一定大小划分为若干存储单元(按AIX的说法，暂且称为PP吧)，PP的大小为2的整数次幂，且应该在2-16M之间。
      每个PV中有有限数量的PP，这些PP合起来形成整个DISK GROUP的可用空间。所有的PV按5-15组成若干组RSS(HP的官方资料中讲最小的RSS磁盘数量是6，最大应不到15，但对底层的分析得知，存在5和15个PV的RSS情况)，每个RSS就是一个所谓常规RAID的冗余组，但这个冗余组不等同于常规RAID，与常规RAID相似的是，常规RAID是以磁盘为单位的RAID算法，而RSS是基于PP的RAID算法。
      为提高性能，HP EVA会有倾向地轮流分配不同的RSS组，但这些RSS之间的数据存储是基于JBOD的(HP官方和很多资料上称是RAID0，或许是宏观的概念)，每个RSS组成的stripe 的成员其实是不同PV中不同位置的PP。
     无论RSS中成员数量有多少个，对于VRAID5，一个stripe中的PV数总是5个。对于VRAID6，一个stripe中的PV数总是6个。例如，对于VRAID5，EVA会尽可能在N个磁盘中做C(N,5)的组合情况，以期实现IO 负载均衡。
     当一个RSS中某个PV离线，控制器会从同一个RSS组中其他磁盘(同一条带中已存在的PV之外)中寻找可用的PP，在逻辑上实现每个stripe的rebuild，从而保证整个存储的安全性。
    当一个RSS中损坏的磁盘数量足够少时(少于等于6个)，这个RSS的安全性就非常低了，这时候，EVA会合并此RSS到另一个RSS中，这样可用的冗余空间就是共享的了，空间就可以从另一个较安全的RSS中迁移过来。
为了保证有足够的空间提供冗余保护，在创建disk group时，EVA会提供一个Protection Level的保护级别，single表示用2个磁盘的空间做冗余，double表示用4个磁盘的空间做冗余。但这个冗余不同于hotspare，这个冗余空间仅会预留到每个PV的尾部，一则，多个磁盘，IO会更均匀，更快；二则，尾部的空间通常是质量较差的空间。

【EVA系列常见故障】
1、RSS中多个磁盘掉线，超过冗余保护级别。
2、加入新磁盘，进行数据迁移时，新磁盘存在物理故障(此时无法回退，也无法前进)。
3、VDISK 删除或EVA initialize。
4、突发性主机与存储无法连接。无法discover到存储。

【数据恢复解决原理】
eva系列最核心的结构部分来自于所有vdisk的运算pp表，这个pp map表会因为磁盘的不断迁移而迁移。所有的故障均可基于此map进行恢复。
当pp map不存在时，根据不同的条带之间的冗余关系，可有优化算法对所有PP进行条带性集合，从而形成若干组正确的条带数据，再基于文件系统结构、数据结构等特征，重组若干条带。

【数据恢复解决过程】
1、原始磁盘镜像，将EVA主机一端的连线拔出，直接连入主机hba卡上，就可以认到所有物理硬盘，之后通过专业手段(Linux下的dd，windows下的winhex等)进行磁盘镜像。因eva主机与扩展柜之间多是铜线连接，故而，可能需要在扩展柜上增加光纤收发模块，再通过光链路接入fc hba卡上。当然，也可以把所有硬盘拆下来后，放入其他光纤通道柜中进行镜像。镜像方案见http://zhangyu.blog.51cto.com/197148/138974
使用EVA扩展柜进行镜像的连接图如下：

2、通过北亚frombyte recovery for hp eva程序进行vdisk重组，直接写入成镜像文件或目标物理磁盘。
3、按常规方式解释镜像文件或目标磁盘，迁移镜像或导出内部文件。

本文出自 “张宇51CTO专家(数据恢复)” 博客，转载请与作者联系！

HP EVA相关资料

一、P4500系统介绍
硬件图示

二、安装与设定
初始化存储系统,设定IP 与主机名

输入start进入初始配置界面:

按回车键,登入.

选择Network TCP/IP Settings, 回车

输入正确的网络配置信息, 移动光标至OK上回车.
在用于管理的计算机上安装CMC 9.0版本

添加存储系统
在第一次进入软件时会弹出如下窗口,选择”1.查找系统”,并利用”查找”或是”添加”功能,新增

进行存储的网络端口绑定:

选中其中一台存储中”TCP/IP 网络”,在右空格点击”TCP/IP任务”,选择”新增绑定”

在弹出的”新建绑定”窗口,选择绑定类型Adaptive Load Balancing(ALB)
确定IP地址信息,并点击”确定”

完成以后，在TCP/IP网络中就可以看到BOND0的信息。如上图

新建管理组与群集.

在”基本”选项卡中填入正确的信息,在高级选项卡中选择正确的数据保护级别..点击确定
** “群集可用空间”,是所有存储节点设置完本地RAID 以后的磁盘空间和, “报告大小”,这是我们实际需要分配给服务器的LUN的大小,这应该结合”数据保护级别”来进行计算后再划分,比如我们选择＂网络RAID-10(2向镜像)＂那么,报告大小=群集可用空间/2

创建服务器主机,并给主机分配磁盘.

在ESX主机配置中,启用软件ISCSI适配器,并记录该适配器的WWN(一串iqn.XXXX-XX)

回到CMC控制台,右击”Cluster”下的”服务器(0)”,在弹出的菜单中选择”新建服务器”(根据实际需要建立服务器,或是服务器群集,若是应用程序需要两台主机共享磁盘的时候,需要”建立服务器群集”,将服务器加入到群集中,然后将我们划分的卷,”分配给群集”)

在弹出的”新建服务器”窗口中,正确输入服务器名称,说明,WWN,并点击”确定”.完成服务器创建.

在左窗格选中新建的服务器”ksvm100”,点击下拉右边的”任务”按纽,
选择”分配和取消分配卷和快照…”

在ESX服务器上识别存储.

在ESX中配置ISCSI启动器属性,添加”动态发现” ISCSI服务器地址为,storage Cluster 虚拟IP, 此例中为10.8.8.3

点击”是”重新扫描主机总线适配器.

在数据存储中,可以看到我们格式化完成后的存储.

三、布署FOM
环境准备
Windows 2003 R2 安装 vmware workstation.
或ESX环境,
可以通过布置ESX OVF模板,来安装,下面以windows + vmware workstation为例

安装与配置FOM
运行HP storageWorks P4000 Management Software for Microsoft Windows 光盘,

点击完成以后自动启动vmware workstation程序.

四、检查与维护到此
LED 灯检查：
当硬件有报错时,设备前面板有警示灯,与HP Porlaint 服务器相同.
P4500 日志与性能监视器：
A：登录到CMC 管理组：
点击”事件”：

您所在的位置：首页 > 企业救援 > HP EVA数据恢复专题

企业救援Data Recovery

HP EVA成功案例

HP EVA8400存储数据恢复成功 北亚数据恢复

HP EVA恢复方案

HP EVA相关资料

HP EVA8400存储数据恢复成功北亚数据恢复