找回密码
 注册
快捷导航
查看: 2833|回复: 1

【转帖】RAID技术详解(2)

[复制链接] |自动提醒
阅读字号:

54

回帖

0

积分

239

资产值

入门会员 Rank: 1

注册时间
2012-9-6
发表于 2012-9-25 14:28:42| 字数 5,892| - 中国–上海–上海 电信 | 显示全部楼层 |阅读模式
1.3
RAID-1技术详解
RAID-1通过磁盘数据镜像实现数据的冗余,在两块磁盘上产生互为备份的数据,当其中一块成员盘出现故障时,系统还可以从另外一块成员盘中读取数据,因此RAID-1可以提供更好的冗余性。
1.3.1
RAID-1数据组织原理RAID-1又被称为磁盘镜像,需要两个物理盘共同构建,使用磁盘镜像(Disk Mirroring)技术,方法是在工作磁盘(Working Disk)之外再加一额外的备份磁盘(Backup Disk),两个磁盘所储存的数据完全一样,数据写入工作磁盘的同时亦写入备份磁盘,也就是将一块物理盘的内容完全复制到另一块物理盘上,所以两块物理盘所构成的RAID-1阵列,其容量仅等于一块硬盘的容量,其数据分布情况见图1-19所示。


图1-19
RAID-1数据分布图

RAID-1是磁盘阵列中单位成本最高的,但提供了很高的数据安全性和可用性。当一个物理盘失效时,系统可以自动切换到镜像磁盘上读写,而不需要重组失效的数据。
虽然RAID-0可以提供更多的空间和更好的读写性能,但是整个系统是非常不可靠的,如果出现故障,无法进行任何补救。所以,RAID-0一般只是在那些对数据安全性要求不高的情况下才被人们使用。而RAID-1和RAID-0截然不同,其技术重点全部放在如何能够在不影响性能的情况下最大限度的保证系统的可靠性和可修复性上。
RAID-1是所有RAID等级中实现成本最高的一种,尽管如此,人们还是选择RAID-1来保存那些关键性的重要数据。
1.3.2
RAID-1故障原因分析这里说的RAID-1故障,是指RAID-1逻辑盘丢失或不可访问。导致RAID-1故障的原因主要有以下几种:
(1)RAID控制器出现物理故障
RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对RAID-1中各个物理成员盘的控制,在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。
(2)RAID信息出错
对于硬RAID-1来说,RAID控制器将物理盘配置为RAID-1后,会记录有关该RAID-1的相关信息,包括组成该RAID-1的物理盘数目、物理盘的容量大小、哪块物理盘为工作磁盘、哪块物理盘为镜像磁盘、RAID-1在每块物理盘中的起始地址等,所有这些信息被称为RAID信息,也称为RAID元数据,它们会被保存到RAID控制器中,有时候也会保存到RAID-1的成员盘中。
对于软RAID-1来说,同样具有上面提到的RAID信息,这些信息一般都存放在RAID-1的成员盘中。
RAID信息出错就是指该RAID-1的配置信息出现错误,导致RAID程序不能正确地组织管理RAID-1中的成员盘,从而导致RAID-1逻辑盘丢失或不能访问。
(3)RAID-1成员盘出现物理故障
RAID-1可以允许其中一块成员盘离线,如果RAID-1中的某一块成员盘出现物理故障,比如电路损坏、磁头损坏、固件损坏、出现坏扇区等,该成员盘就不能正常使用,但剩下的一块成员盘中的数据完好无损,RAID-1还不会崩溃。
如果系统管理员没有及时替换出现故障的成员盘,当另一块成员盘再出现故障离线后,RAID-1将彻底崩溃。
(4)人为误操作
如果误将RAID-1中的两块成员盘都拔出、或者不小心删除了RAID-1的配置信息等,都会造成RAID-1崩溃。
1.3.3
RAID-1数据恢复思路RAID-1是所有RAID中最简单的一种,以图1-20中的RAID-1结构为例,从图中可以看出,RAID-1中两块硬盘互为镜像,所有数据都是完全一样的,如果是RAID控制器故障或RAID信息出错导致RAID-1的数据无法访问,只要将两块物理盘中的一块从服务器上拆下来,作为单独的硬盘接在一台计算机上,就很容易将数据恢复出来。



图1-20
RAID-1结构图


如果RAID-1中一块硬盘出现故障,不会影响服务器的运行,只要把故障硬盘更换为一块好的硬盘就可以了。如果没有及时更换,导致第二块硬盘也出现故障,这时RAID-1就会失效,因为先出现故障的硬盘中的数据已经不完整,所以不能以第一块硬盘为基准进行数据恢复,而应该用后出现故障的硬盘进行数据恢复,一般情况下都能够完全恢复出所有的数据。
1.4
RAID-10
技术详解

RAID-10这种结构是两个镜像结构加一个带区结构,也是为了把RAID-0RAID-1的优缺点相互补充,达到既安全又高速的目的。
1.4.1
RAID-10数据组织原理RAID 1+0也被称为RAID-10标准,实际是将RAID-1RAID-0结合的产物,其数据分布情况见图1-21所示。



图1-21
RAID-10数据分布图

RAID-10至少需要四块硬盘才能构建,它的优点是同时拥有RAID-0的超凡速度和RAID-1的高数据可靠性,但是磁盘的利用率比较低。
RAID-10主要用于容量不大,但要求速度和差错控制的数据库中。
1.4.2
RAID-10故障原因分析这里说的RAID-10故障,是指RAID-10逻辑盘丢失或不可访问。导致RAID-10故障的原因主要有以下几种:
(1)RAID控制器出现物理故障
RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对RAID-10中各个物理成员盘的控制,在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。
(2)RAID信息出错
RAID控制器将物理盘配置为RAID-10后,会生成一些参数,包括该RAID-10的盘序、条带大小、RAID-10在每块物理盘中的起始地址等,还会记录有关该RAID-10的相关信息,包括组成该RAID-10的物理盘数目、物理盘的容量大小等,所有这些信息和参数就被称为RAID信息,也称为RAID元数据,它们会被保存到RAID控制器中,有时候也会保存到RAID-10的成员盘中。
RAID信息出错就是指该RAID-10的配置信息和参数出现错误,导致RAID程序不能正确地组织管理RAID-10中的成员盘,从而导致RAID-10逻辑盘丢失或不能访问。
(3)RAID-10成员盘出现物理故障
RAID-10其实是由多组RAID-1构成RAID-0,它可以允许每组RAID-1中的一块成员盘离线,如果某组RAID-1中的某一块成员盘出现物理故障,比如电路损坏、磁头损坏、固件损坏、出现坏扇区等,该成员盘就不能正常使用,但该组RAID-1剩下的一块成员盘中的数据完好无损,RAID-10还不会崩溃。
如果系统管理员没有及时替换出现故障的成员盘,当同一组RAID-1中另一块成员盘再出现故障离线后,也就是一组RAID-1中的两块成员盘都出现故障,RAID-10将彻底崩溃。
(4)人为误操作
如果误将RAID-10中同一组RAID-1的两块成员盘都拔出、或者给RAID-10除尘时将成员盘拔出后忘了原来的顺序、以及不小心删除了RAID-10的配置信息等,都会造成RAID-10崩溃。
1.4.3
RAID-10数据恢复思路RAID-10是由多组RAID-1构成RAID-0,以图1-22中的RAID-10结构为例,从图中可以看出,该RAID-10由两组RAID-1构成RAID-0,其中硬盘0与硬盘1是一组RAID-1,硬盘2与硬盘3是另一组RAID-1,这两组RAID-1又组成了RAID-0,整体就成为RAID-10。



图1-22
RAID-10结构图

如果是RAID控制器故障或RAID信息出错导致RAID-10的数据无法访问,只需从两组RAID-1中各拿出一块物理盘,用这两块物理盘按照前文讲解过的RAID-0恢复的思路进行恢复,就很容易将数据恢复出来。

如果RAID-10中某一组RAID-1的一块物理盘出现故障,理论上不会影响服务器的运行,只要把故障硬盘更换为一块好的硬盘就可以保证RAID-10的完整性。如果没有及时更换,导致该组RAID-1的第二块物理盘也出现故障,这时改组RAID-1就会失效,RAID-10也就崩溃了。因为先出现故障的硬盘中的数据已经不完整,所以不能以这一块硬盘为基准进行数据恢复,而应该用后出现故障的硬盘加上另一组RAID-1中的一块物理盘进行数据恢复,一般情况下都能够完全恢复出所有的数据。



1.5
RAID-1E
技术详解

RAID-1EIBM公司推出的一种私有级别的RAID形式,它的数据组织结构在RAID-1的基础上做了改进,这一节将具体分析RAID-1E存储及恢复技术。
1.5.1
RAID-1E数据组织原理RAID-1ERAID-1的增强版本,但它并不是通常所说的RAID 0+1的组合。RAID-1E的工作原理与RAID-1基本上是一样的,只是RAID-1E的数据恢复能力更强,但由于RAID-1E写一个条带的数据至少要两次,因此,RAID控制器的负载会增大很多,从而造成磁盘读写能力的下降。

RAID-1E至少需要3块物理盘才能实现,其数据分布情况见图1-23所示。





图1-23
RAID-1E数据分布图

从图1-23可以看出,RAID-1E的各个物理盘中,以两个条带组为一个单元,在一个单元中,上一个条带组内是连续排列的数据,下一个条带组则是上一个条带组的错位镜像,即将上一个条带组中每个成员盘内的数据向右移动一块盘的位置,写入下一个条带组的各个成员盘中,最后一个成员盘的数据则写入第一个成员盘中。

RAID-1E在一块成员盘离线的情况下不会影响数据的完整性,如果RAID-1E由四块或者四块以上成员盘构成,则能够支持在两块成员盘离线的情况下不会影响数据的完整性,只是有两个前提:一是离线的两块成员盘不能是相邻的两块盘;二是第一块成员盘和最后一块成员盘不能同时离线。

1.5.2
RAID-1E故障原因分析这里说的RAID-1E故障,是指RAID-1E逻辑盘丢失或不可访问。导致RAID-1E故障的原因主要有以下几种:
1RAID控制器出现物理故障

RAID控制器如果出现物理故障,将不能被计算机识别,也就无法完成对RAID-1E中各个物理成员盘的控制,在这种情况下,通过RAID控制器虚拟出来的逻辑盘自然就不存在了。

2RAID信息出错

RAID控制器将物理盘配置为RAID-1E后,会生成一些参数,包括该RAID-1E的盘序、条带大小、RAID-1E在每块物理盘中的起始地址等,还会记录有关该RAID-1E的相关信息,包括组成该RAID-1E的物理盘数目、物理盘的容量大小等,所有这些信息和参数就被称为RAID信息,也称为RAID元数据,它们会被保存到RAID控制器中,有时候也会保存到RAID-1E的成员盘中。

RAID信息出错就是指该RAID-1E的配置信息和参数出现错误,导致RAID程序不能正确地组织管理RAID-1E中的成员盘,从而导致RAID-1E逻辑盘丢失或不能访问。

3RAID-1E成员盘出现物理故障

由三块成员盘组建的RAID-1E可以允许一块成员盘离线而不影响RAID-1E逻辑盘数据的完整性,如果RAID-1E中的两块成员盘出现物理故障,比如电路损坏、磁头损坏、固件损坏、出现坏扇区等,RAID-1E将会崩溃。

由四块及四块以上成员盘组建的RAID-1E可以允许不相邻的两块成员盘离线而不影响RAID-1E逻辑盘数据的完整性,如果RAID-1E中相邻的两块成员盘出现物理故障、或者不相邻的三块成员盘出现物理故障,比如电路损坏、磁头损坏、固件损坏、出现坏扇区等,RAID-1E将会彻底崩溃。

4)人为误操作

如果误将RAID-1E中两块以上成员盘同时拔出、或者给RAID-1E除尘时将成员盘拔出后忘了原来的顺序、以及不小心删除了RAID-1E的配置信息等,都会造成RAID-1E崩溃。

5RAID控制器的稳定性
RAID-1E的数据分布结构比其他级别的RAID要复杂一些,尤其是当RAID-1E中有成员盘离线时,算法将变得更加复杂,RAID控制器将会工作在一个比较吃力的状态。而RAID控制器的负载太重便会极大地增加数据读写时出现I/O滞留的可能性,从而导致更多成员盘离线,或者导致RAID信息出错
1.5.3
RAID-1E数据恢复思路RAID-1E是所有RAID中比较安全的一种级别,冗余性很好,对于RAID-1E出现故障后数据恢复的方法,下面分情况介绍。
这里以三块成员盘的RAID-1E为例,如图1-24所示。




图1-24
RAID-1E结构图

情况一:不缺失成员盘

如果是RAID控制器故障或RAID信息出错导致RAID-1E的逻辑盘无法访问,各成员盘没有物理故障,先把物理盘从RAID控制器中取出来,即“去RAID化”,作为单盘进行分析。

对于RAID-1E有两个因素需要分析,一个是RAID-1E中每个条带的大小,也就是“A”、“B”等这些数据块所占用的扇区数;另一个因素是RAID-1E中物理盘的排列顺序,也就是说哪块物理盘是RAID-1E中的第一块盘,哪块物理盘是RAID-1E中的第二块盘等等。

分析出RAID-1E的条带大小和盘序后,将各个物理盘的0号条带、2号条带、4号条带等所有编号为偶数的条带按照盘序衔接到一起,就拼凑成为了完整的RAID-1E逻辑盘。

以图1-24中的RAID-1E为例,假设条带的大小为16个扇区,成员盘的盘序就按照图中的排列顺序,那么只要到硬盘0中取0-15扇区的数据,再到硬盘1中取0-15扇区的数据,再到硬盘2中取0-15扇区的数据,即把每块成员盘的0号条带按照盘序取出,接下来跳过1号条带,进入2号条带,按照盘序读取每块成员盘的32-47扇区的数据,就这样依次按顺序取下去,把所有取出来的数据按照顺序衔接成一个镜像文件,或者是镜像盘,这就成为完整的原RAID-1E逻辑盘的结构了,直接访问这个重组出来的镜像文件或镜像盘,就得到了原RAID-1E逻辑盘中的数据。

情况二:缺失一块成员盘

假设RAID-1E的三块成员盘中有一块出现无法修复的物理故障,那么只能用剩下的两块成员盘恢复数据,如图1-25所示,加阴影的
“硬盘2”表示故障盘,无法读取,我们用硬盘0和硬盘1进行数据恢复。





图1-25
RAID-1E“硬盘2”为故障盘

对于这种情况的RAID-1E,也需要先分析出条带大小和剩下两块成员盘的盘序,然后将024等偶数条带的数据按照盘序读取出来,对于135等奇数条带只读取0号盘的数据,把所有取出来的数据按照顺序衔接成一个镜像文件,或者是镜像盘,这就成为完整的原RAID-1E逻辑盘的结构了,直接访问这个重组出来的镜像文件或镜像盘,就得到了原RAID-1E逻辑盘中的数据。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?注册

x

1098

回帖

89

积分

7万

资产值

至尊会员I Rank: 4Rank: 4Rank: 4Rank: 4

注册时间
2012-7-26
月全勤勋章铜牌荣誉勋章(注册8年以上会员)银牌荣誉勋章(注册10年以上会员)年全勤勋章2022年全勤勋章2023
发表于 2012-9-27 07:06:41| 字数 6| - 中国–广东 电信 | 显示全部楼层
不错,学习了
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

Powered by Discuz! X3.5 © 2001-2023 Comsenz Inc

GMT+8, 2024-12-1 07:47 , Processed in 0.139028 second(s), 28 queries , Gzip On, OPcache On.

手机版|小黑屋|安卓客户端|iOS客户端|Archiver|备用网址1|备用网址2|联系我们|专门网

返回顶部