HSCSA-Storage认证网课 三章 磁盘阵列和RAID_1.0

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章磁盘阵列和RAID_v1.0幻灯片1幻灯片2幻灯片3幻灯片4幻灯片5磁介质盘片存储是通过在旋转的电机设备中安装磁介质盘片以及读写头电路而实现的。磁盘由涂着磁性材料的圆形盘片组成,读写电路使用二进制数据对磁介质进行编码,从而实现了读写功能。磁头中可以配有数据缓冲区,以弥补数据读写中产生的延迟。盘片的存储结构以磁道的形式组织,磁道指的是覆盖了盘片上所有读写区域的同心圆。磁道进一步被划分成磁盘上更小的读写单元,即扇区。随着磁盘的旋转,当读写头移动到特定的磁道上时,磁道中相应扇区的数据就可以被读写头所处理。驱动器由多个盘片组成,盘片的两面都可以存放数据,每个盘片上都配有各自的读写头,各个盘片上位置相同的磁道都可以在同样的位置上读写。这些位置相同的磁道的集合称为柱面。利用这样的组织方式,磁盘驱动器中的每个扇区都可以根据其柱面、磁头和扇区号得到一个惟一的地址。扇区是衡量磁盘上所存储数据大小的基本单位。一个扇区中所能存储的字节数与磁盘格式化后的容量有关。扇区必须在头部的数据域中存放地址信息,以及对HDA(Headdiskassembly,头盘组件)纠错进行同步所需的信息。由于头部区域以及相应的同步缝隙都不能用于数据的存储,所以格式化以后的容量总是会小一些。与磁盘相关的技术指标包括容量、传输速率和平均访问时间。在考虑实际应用的时候,这几个指标都比较重要。在着重考虑容量问题时,从磁盘上读取数据的事务量则可能会导致数据查找速度的降低。而如果着重考虑大量数据的传输(如数据仓库)时,可以在容量和传输速率方面实现高度的优化,但这时往往需要以牺牲平均访问时间作为代价。所以,在实际的不同应用中,需要对上述参数进行适当的衡量,以部署最佳配置方案。幻灯片6将控制器集成到磁盘设备中,就初步形成了完整的存储系统。实现这一集成配置方式的产品虽然很多,但是其基本模式都是用控制器将一组磁盘驱动器连接起来。由于磁盘驱动器被连接到了一起,他们就构成了一个阵列(Array)。这种方式是提高存储容量和性能的基本手段。用这种形式配置起来的磁盘组,既可以单独使用,也可以用集成的模式将整个阵列中的容量组合起来,形成一个虚拟的“大容量磁盘”使用。这种虚拟的“大容量磁盘”可以使用整个阵列的容量,在实际应用时,应用系统的I/O部件将此磁盘阵列视为一个磁盘来进行操作,而数据究竟放在该阵列中的那一个磁盘上,则由控制器去负责管理。这就是廉价磁盘冗余阵列(RedundantArraysofInexpensiveDisks,RAID)等高级存储系统功能的基础,同时也说明了存储虚拟化的概念。幻灯片7最初级的存储阵列配置方式是JBOD(JustaBunchofDisks,不过是一堆磁盘,存储行业戏语)。JBOD如同它的名称,是将一组磁盘驱动器连接在一起构成一个阵列,其中的每个驱动器都是一个可寻址的单元。这种方式可以提供更高的容量,但是当阵列中的某个驱动器出现故障的时候,这种配置方式不能提供任何的容错能力。RAID:RedundantArrayofIndependentDisks,中文为独立磁盘冗余阵列,或简称磁盘阵列。它是一种把多块独立的硬盘(物理硬盘)按不同方式组合起来形成一个硬盘组(逻辑硬盘),从而提供比单个硬盘更高的存储性能和提供数据冗余的技术。RAID与JBOD阵列的主要不同之处在于它在整个阵列中对数据进行分区,并提供数据恢复功能。数据恢复功能主要是通过磁盘奇偶校验信息实现的。当一个驱动器发生故障时,奇偶校验信息可以从阵列中其它驱动器上的数据中计算出所丢失的数据,数据按照最合适于恢复和保护策略的方式分布在阵列上。RAID有若干个级别,分别可以实现不同等级的恢复和保护策略。幻灯片8JBOD(JustaBunchofDisks,简单磁盘捆绑),通常又称为Span,其实JBOD并不是真正意义上的RAID模式,只是在近几年才被一些厂家提出,并被广泛采用,也有人把它归为串联式的RAID0,其目的纯粹是为了增加磁盘的容量。Span是在逻辑上把几个物理磁盘一个接一个的串联起来,从而提供一个大的逻辑磁盘。Span上的数据简单地从第一个磁盘开始存储,当第一个磁盘的存储空间用完后,再依次从后面的磁盘开始存储数据,但Span并不提供数据安全保障。幻灯片9RAID技术的主要功能:1、通过对磁盘上的数据进行条带化,实现对数据成块存取,减少磁盘的机械寻道时间,提高了数据存取速度2、通过对一阵列中的几块磁盘同时读取,减少了磁盘的机械寻道时间,提高了数据存取速度3、通过镜像或者存储奇偶校验信息的方式,实现了对数据的冗余保护。幻灯片10幻灯片11在学习RAID的知识之前,一些预备的术语和RAID的基础概念是需要了解清楚的。RAID的基本概念包括了RAID的数据组织方式、数据的存取方式、数据冗余的方式以及阵列中某个磁盘驱动器故障后的后续数据可用性保证方式等知识。下边将就这几个问题进行更为深入的探讨。幻灯片12在RAID的数据存储中,数据不是被连续的存储到某一个磁盘驱动器上的,而是将数据分做若干段,将每一段数据分布存储在各个磁盘驱动器上。在这个过程中,每个磁盘驱动器上用来存储数据段的空间就叫做分块(strip)。而在同一磁盘阵列中的多个磁盘驱动器上的相同“位置”(或者说是相同编号)的分块,就构成了条带(stripe)。通过这样的构建方式,形成一个虚拟的磁盘。当主机端发送的I/O操作被传送到磁盘阵列时,阵列管理软件就会同时产生多个内部的I/O操作确定在每个成员磁盘上相应的地址。阵列中的分条被映射为虚拟磁盘中逻辑上连续的块,当主机向阵列也就是虚拟磁盘写数据的时候,阵列管理软件将输入的I/O请求转换为阵列中的分条,逐块向磁盘成员写入数据。幻灯片13并行存取模式是把所有磁盘驱动器的主轴马达作精密的控制,使每个磁盘的位置都彼此同步,然后对每一个磁盘驱动器作一个很短的I/O数据传送,如此一来,从主机来的每一个I/O指令,都平均分布到每一个磁盘驱动器。为了达到并行存取的功能,RAID中的每一个磁盘驱动器,都必须具备几乎完全相同的规格:转速必须一样;磁头搜寻速度﹝AccessTime﹞必须相同;Buffer或Cache的容量和存取速度要一致;CPU处理指令的速度要相同;I/OChannel的速度也要一样。实际上,要利用并行存取模式,RAID中所有的成员磁盘驱动器,应该使用同一厂商相同型号的磁盘驱动器。并行存取RAID之架构,以其精细的马达控制和分布之数据传输,将数组中每一个磁盘驱动器的性能发挥到最大,同时充分利用存储总线的带宽,因此特别适合应用在大型、数据连续的档案存取应用,例如:影像、视讯档案服务器数据仓储系统多媒体数据库电子图书馆印前或底片输出档案服务器其它大型且连续性档案服务器由于并行存取RAID架构之特性,RAID控制器一次只能处理一个I/O要求,无法执行Overlapping的多任务,因此非常不适合应用在I/O次数频繁、数据随机存取、每笔数据传输量小的环境。同时,因为并行存取无法执行Overlapping的多任务,因此无法避免磁盘驱动器的寻道时间,而且在每一个I/O的第一笔数据传输,都要等待第一个磁盘驱动器旋转延迟(平均为磁盘旋转半圈的时间)。所以磁盘驱动器的机械延迟时间,是并行存取架构的最大问题。相对于并行存取模式,独立存取模式并不对成员磁盘驱动器作同步转动控制,其对每个磁盘驱动器的存取,都是独立且没有顺序和时间间隔的限制。因此,独立存取模式可以尽量地利用overlapping多任务、TaggedCommandQueuing等等高阶功能,来避免磁盘驱动器的机械时间延迟(寻道时间和机械延迟)。由于独立存取模式可以做overlapping多任务,而且可以同时处理来自多个主机不同的I/ORequests,在多主机环境﹝如Clustering﹞,更可发挥最大的性能。由于独立存取模式可以同时接受多个I/ORequests,因此特别适合应用在数据存取频繁、每笔数据量较小的系统。例如:在线交易系统或电子商务应用多使用者数据库ERM及MRP系统小文件之文件服务器幻灯片14所谓的镜像冗余方式就是指使用磁盘镜像技术来实现冗余,以提高数据的可靠性和可用性。镜像冗余的实质就是将保存在磁盘驱动器中的数据做一份另外的完整拷贝,然后存储在另外一个磁盘驱动器中。当其中一个磁盘驱动器发生故障以后,数据仍然能从另一个磁盘驱动器中被读出,由此,数据的安全性和可靠性得到极大的保证。镜像冗余方式可以得到最好的数据冗余保护,并且由于每个磁盘上都保存有完整的数据,所以当有数据读操作的时候,多个读操作可以被分散到各个磁盘以分担工作负荷,使得数据读取速度得到提高,但是镜像冗余方式的磁盘空间利用率就相对比较低,只有50%。幻灯片15校验冗余是通过计算保存在阵列中成员磁盘驱动器上数据的校验值,并将计算出来的校验值保存在另外的磁盘资源上。当数据出错或者是某个阵列成员磁盘故障以后,通过剩余数据和校验信息计算出丢失的数据来提供数据的安全性和可靠性。目前比较常用的算法有XOR异或校验算法。在某个时间新的磁盘将要替代阵列中的失效磁盘,这时会要运行一个校验恢复进程。校验恢复进程读出所有其他磁盘上的数据(包括校验数据),然后在新加入的磁盘上使用XOR算法恢复数据。校验冗余相较于镜像冗余而言,为保证数据可用性而占用的磁盘资源远远少于镜像冗余方式。但是,对于磁盘故障或者数据出错的恢复而言,校验冗余需要占用CPU或者需要专用硬件来对剩余数据和校验信息一起做计算来计算出丢失的数据,而镜像冗余方式只需要读取备份盘中的信息即可。同时,对于数据的写入操作,镜像冗余方式可以同时将数据写入主用盘和备用盘,冗余备份对数据写入效率基本没有影响。但是如果使用校验冗余,对任何一个阵列成员磁盘进行写操作都会导致校验信息的重新计算,所以会对存储系统的效率有一定影响。幻灯片16设有数据A,B,则校验数据为P:如果A为1,B为0,则校验P为1:A(1)⊕B(0)=P(1)则有B(0)⊕P(1)=A(1);A(1)⊕P(1)=B(0);如果A为0,B为0,则校验数据P为0:A(0)⊕B(0)=P(0)则有A(0)⊕P(0)=B(0),B(0)⊕P(0)=A(0)如果A为1,B为1,则校验数据P为0:A(1)⊕B(1)=P(0)则有,A(1)⊕P(0)=B(1),B(1)⊕P(0)=A(1)结论:无论ABP如何取值,只要知道其中任意两个就可以通过运算得到另外一个述职。所以,对于XOR运算而言,具备一下两个特性:A)结果与运算顺序无关。也就是(A⊕B)⊕C=A⊕(B⊕C)。B)各个参与运算的数字与结果循环对称。即:如果A⊕B⊕C=P,那么A=B⊕C⊕P;B=A⊕C⊕P;C=A⊕B⊕P。幻灯片17热备(HotSpare):当冗余的RAID阵列中某个磁盘失效时,在不干扰当前RAID系统正常使用的情况下,用RAID系统中另外一个正常的备用磁盘顶替失效磁盘,及时保持RAID系统的冗余性。热备通过配置热备盘实现,热备盘分为全局热备盘和局部热备盘。全局热备盘是指为整个系统中多个阵列分配的、作为备用盘的磁盘。当系统中任意一个具有冗余功能的RAID阵列中单个成员磁盘失效时,全局热备会顶替该磁盘。局部热备盘是为系统中某一个指定的RAID阵列提供备件的磁盘,其他的RAID阵列中的磁盘失效时是不能够使用该热备盘的。局部热备又可以分为专用热备盘和分布式热备盘热换(HotSwap):指在不影响系统正常运转的情况下,用正常的磁盘替换RAID系统中的失效磁盘。无论是否使用热备盘,都需要一种方法撤离RAID阵列中失效的组件,并用正常组件替代它。假如这个过程中没有干扰RAID阵列的操作就可以称做热换。大多数情况下,热备和热换技术是结合使用的。尽管热换使事情变得简单但一旦错误地拆下一个磁盘,将会导致灾难性的后果。幻灯片18重构:镜像阵列或者RAID阵列中发生故障的磁盘上的所有用户数据和校验数据的重构(rebuild)过程,或者将这些数据写到一个或者多个备用磁盘上的过程。在大多数的阵列中,在应用程序访问阵列的虚拟磁盘上的数据时就会引发重构过程。系统中需设置

1 / 85
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功