硬盘技术纵横谈—马达和保护技术篇
S.M.A.R.T技术其实不是一项新数据保护技术,只是由于它得到了广泛的应用,现在几乎所有的计算机系统中都能支持S.M.A.R.T技术,因此在这里笔者再简单多说几句。S.M.A.R.T.技术就象拼七巧板,需要把许多块拼图正确拼装在一起,最终形成一种图案。如前所述,推定故障就是其中的一块拼图。另一块就是确定属性的方法。属性是进行可靠性预测的参数,由制造商为各种硬盘量身设定。为了确定属性,硬盘的设计工程师们对返修硬盘进行了检查,研究设计要点,为他们所看到的各种故障确立相应的诊断属性。来自应用现场的信息可用于预测可靠性问题的研究,并最终纳入到新的可靠性结构之中。
尽管不同的硬盘属性各异,但是它们还是有以下一些共同之处:
<> 磁头飞行高度 <> 数据吞吐性能 <> 起旋时间 <> 重新分配的扇区计数 <> 寻道错误率 <> 寻道时间特性 <> 试旋重计数(spin try recount) <> 硬盘校准重试计数 (drive calibration retry count)
上面所列的属性是几种能反映可靠性的典型指标。从根本上讲,硬盘的设计决定了制造商将选定哪些属性。因此可以认为,属性因制造商而异,并取决于硬盘的设计。
由于ATA硬盘和SCSI硬盘对数据特性具有不同的要求,因此当SFF-8035(1995年5月12日,Compaq公司向Small Form Factor委员会提交了专为ATA/IDE 开发的IntelliSafe,也称为SFF-8035)进入公共领域时,用于ATA/IDE环境的S.M.A.R.T.开始出现。SCSI硬盘采用了一个不同的行业标准,如ANSI-SCSI Informational Exception Control (IEC)中定义的X3T10/94-190。适用ATA/IDE和SCSI环境的S.M.A.R.T.系统技术的属性和门限值相似,但在信息的报告上却不相同。
在ATA/IDE环境下,由主机上的软件对S.M.A.R.T“报告状态”命令生成的、来自硬盘的告警信号进行解读。主机定期对硬盘进行查询,以检查这一命令的状态,如果显示马上要发生故障,就将告警信号送至最终用户或系统管理员。系统管理员就安排关机时间,以备份数据和更换硬盘。这一结构还可以进一步改进,即能够报告除硬盘以外的其它信息,如温度告警、CD-ROM、磁带,或其它I/O报告等。主系统除对来自硬盘的“报告状态”命令进行评估外,还可对属性和告警报告进行评估。
一般来说,具有可靠性预测功能的SCSI 硬盘只报告状况完好或出现故障。在SCSI 环境中,由硬盘进行故障判断,然后由主机通知用户采取措施。在SCSI 标准中有一个检测位,当硬盘确定可靠性出现问题时,检测位就打上标记。系统便通知最终用户或系统管理员。
硬盘数据保护技术之MaxSafe增强版
除了大家耳熟能详的S.M.A.R.T.技术外,各家硬盘厂商现在均竞相推出了各自的硬盘数据保护技术,例如原IBM硬盘公司就有DFT技术,原昆腾硬盘公司有DPS(数据保护系统),迈拓公司有MaxSafe技术,西部数据公司有数据卫士(Data Lifeguard)技术,希捷公司有3DS系统。笔者这里再对Maxtor的MaxSafe技术和希捷的3DS系统进行简要介绍。
MaxSafe(增强版)
高性能高容量硬盘很重要,但可靠性也是一个不能忽视的因素,MaxSafe是Maxtor硬盘专有的数据安全系统。从硬盘原理我们可以知道,硬盘内部是一个非常非常清洁的空间,比医院的隔离病房还要干净得多,一个极小的微粒也会造成数据错误。尽管厂商们不断追求更为干净的制造环境,但是无论采用如何高级的过滤措施,仍然不能完全防止灰尘的入侵,MaxSafe系统的设计本意就是为了在数据丢失之前,发现和修正这些错误。 |