1RAID技术基础知识1计算机和网络技术的高速发展对存储性能和数据可靠性的要求不断的提高。使用RAID技术是很好的解决途径。引入1了解RAID的定义与特点理解RAID数据组织方式和冗余原理熟练掌握各RAID级别的原理及特性了解RAID的实现方式课程目标学习完本课程,您应该能够:1RAID的基本概念RAID级别RAID的实现方式和运行状态目录1RAID的定义•RAID的全称–廉价磁盘冗余阵列(RedundantArrayofInexpensiveDisks)•RAID的定义–多个独立的物理硬盘按照不同的方式组合起来,形成一个虚拟的硬盘1RAID的优势•RAID在容量和管理上的优势–易于灵活的进行容量扩展–“虚拟化”使可管理性极大的增强•RAID在性能上的优势–“磁盘分块”技术带来性能的提高•RAID在可靠性和可用性上的优势–通过冗余技术和热备、热换提升了可靠性1RAID组织数据的基本方式分块分块分块分块条带1磁盘2磁盘3磁盘1磁盘4分区0分区1分区0分区0分区1分区0分区1分块分块分块分块分块分块分块分块条带2条带31RAID存取数据的基本方式•并行存取方式–适用于大型的、以长时间顺序访问数据为特征的应用•独立存取方式–适用于数据存取频繁,每笔存取数据量较小的应用1镜像冗余的概念•镜像冗余使用了磁盘镜像技术•磁盘镜像是一个简单的设备虚拟化技术,每个I/O操作都会在两个磁盘上执行,两个磁盘看起来就像一个磁盘一样•镜像冗余可以提高磁盘的读性能1镜像冗余的实现方式卷管理器系统总线I/O总线子系统主机I/O控制器设备设备驱动程序文件系统I/O请求镜像器镜像I/O路径主磁盘镜像磁盘1校验冗余的概念•根据冗余算法计算阵列中成员磁盘上数据的校验信息,将校验信息保存在其他的磁盘资源上•保证数据可靠性•和镜像冗余相比较,校验冗余的开销更小1XOR算法•相同为假,不同为真•XOR的逆操作是XOR操作数1操作数2XOR结果假假假假真真真假真真真假1热备和热换•热备是指在不干扰当前系统的正常使用的情况下,用系统中另外一个正常的备用磁盘顶替失效磁盘•热换是指在不影响系统正常运转的情况下,用正常的磁盘物理替换RAID阵列中的失效磁盘1RAID的基本概念RAID级别RAID的实现方式和运行状态目录1RAID级别•组成RAID阵列的不同方式称为RAID级别•不同的RAID级别–不同的存储性能–不同的数据可靠性–不同的存储成本1RAID0的工作原理•RAID0是以条带的形式将数据均匀分布在阵列的各个磁盘上D0D1D2D3D4D5D6D7D8D9D10D11物理磁盘0物理磁盘1物理磁盘2物理磁盘3条带0条带1条带2D8D4D0D11D7D3D10D6D2D9D5D1D0…..1RAID0的特性所需成员磁盘数2个或更多,最低为2个优点极高的磁盘读写效率不存在校验,不会占用太多CPU资源设计、使用和配置比较简单缺点无冗余,不能用于对数据安全性要求高的环境适用领域视频生成和编辑、图像编辑其他需要大的传输带宽的操作1RAID1的工作原理•RAID1以镜像为冗余方式,对虚拟磁盘上的数据做多份拷贝,放在成员磁盘上物理磁盘05物理磁盘1D3D2D0D1D3D2D0D1D0D1D2D3D0….1RAID1的特性所需成员磁盘数2N个,(N≥1),最低为2个优点具有100%数据冗余,提供最高的数据安全保障理论上可以实现2倍的读取效率设计和使用比较简单缺点开销大,空间利用率只有50%在写性能方面提升不大适用领域财务、金融等高可用、高安全的数据存储环境1RAID2•采用校验冗余–把数据分散为位或块,加入汉明码,间隔写入到磁盘阵列的每个磁盘中–在成员磁盘上的地址都一样•采用了并行存取方式•花费大,成本昂贵1RAID3的工作原理•在RAID3中,数据块被分为更小的块并行传输到各个成员磁盘上,同时计算XOR校验数据存放到专用的校验磁盘上D0D1D2D3D0….物理磁盘0物理磁盘1物理磁盘2校验磁盘3D30D20D10D00P3P2P1P0D32D22D12D02D31D21D11D011RAID3的特性所需成员磁盘数3个或更多,最低为3个优点读写性能都比较好当有磁盘损坏时,对整体吞吐量影响较小减少了开销缺点控制器设计复杂采用并行存取方式,主轴同步时吞吐量没有提高校验磁盘的写性能有瓶颈适用领域视频生成和图像、视频编辑等需要高吞吐量的应用环境1RAID4的工作原理•在RAID4中,数据被分为更大的块并行传输到各个成员磁盘上,同时计算XOR校验数据存放到专用的校验磁盘上物理磁盘0物理磁盘1物理磁盘2校验磁盘3D9D6D3D0P3P2P1P0D11D8D5D2D10D7D4D1D0D1D2D3D4D5D6D7D8D9D10D11条带0条带1条带2D0…..条带31RAID4•RAID4采用独立存取方式,将条带由RAID3的小数据块改为更大的数据块,这是RAID4和RAID3最大的不同•RAID4的校验较为迅速,可以获得相对于RAID3更高的读取速度,但写入速度极差,控制器的设计更加复杂1RAID5的工作原理•RAID5采用独立存取的阵列方式,校验信息被均匀的分散到阵列的各个磁盘上D0D1D2D3D4D5D6D7D8D9D10D11物理磁盘0物理磁盘1物理磁盘2物理磁盘3条带0条带1条带2P3D6D3D05D11D8D5P0D10D7P1D2D9P2D4D1D0…..条带31RAID5的特性所需成员磁盘数3个或更多,最低为3个优点读性能比较高中等的写性能校验信息的分布式存取,避免出现写操作的瓶颈缺点控制器设计复杂磁盘重建的过程比较复杂适用领域文件服务器、Email服务器、Web服务器等环境数据库应用1RAID6•RAID6是指带有两种分布存储的检验信息的磁盘阵列,它是对RAID5的扩展,主要是用于要求数据绝对不能出错的场合,使用了二种奇偶校验方法,需要N+2个磁盘•常用的RAID6技术:–RAID6P+Q–RAID6DP1RAID6P+Q•RAID6P+Q会根据公式计算出P和Q的值,当有两个数据同时丢失时,仍可以计算出原数据磁盘1磁盘2磁盘3磁盘4磁盘5条带1数据1a数据1b数据1cP1Q1条带2数据2d数据2eP2Q2数据2f条带3数据3gP3Q3数据3h数据3i条带4P4Q4数据4j数据4k数据4l条带5Q5数据5m数据5n数据5oP51RAID6DP•RAID6DP中的DP指DoubleParity,它在RAID4的基础上不仅有行的校验,还增加了一个用来存放斜向校验信息的磁盘数据磁盘1数据磁盘2数据磁盘3数据磁盘4横向校验磁盘斜向校验磁盘数据a数据b数据c数据dP1DP1数据e数据f数据g数据hP2DP2数据i数据j数据k数据lP3DP3数据m数据n数据o数据pP4DP4DP51RAID7•RAID7是一种新的RAID标准,它与以前见到的RAID级别有明显的区别,可以理解成一个独立的“存储计算机”•RAID7自身带有智能化实时操作系统和用于存储管理的软件工具,可以完全独立与主机运行,不占用主机CPU资源1组合不同级别的RAID•组合不同级别RAID的目的–从RAID0到RAID6,不同级别的RAID在性能、冗余、价格等方面做了不同程度的折中–组合不同级别的RAID,目的是扬长避短,产生具有优势特性的混合RAID级别•重点介绍–RAID10–RAID501RAID10的工作原理•RAID10结合RAID1和RAID0,先镜像,再条带化D0D1D2D3D4D5D6D7D8D9D10D11物理磁盘0物理磁盘1物理磁盘2物理磁盘3条带0条带1条带2D6D4D2D0D7D5D3D1D7D5D3D1D6D4D2D0D0…..条带31RAID10的特性所需成员磁盘数2N个,(N≥2),最低为4个优点读性能很高写性能比较好数据安全性好,允许同时有N个磁盘失效缺点空间利用率只有50%开销大适用领域多用于要求高可用性和高安全性的数据库应用1RAID50的工作原理•RAID50是RAID5和RAID0的结合,先实现RAID5,再条带化D0D1D2D3D4D5D6D7D8D9D10D11D0…..D12D13磁盘0磁盘1磁盘3磁盘4D12P20D4D0P31D11D7P01D14P21D6D2P30D9D5P00条带0条带1条带2条带3D13D8P10D1D15D10P11D3磁盘2磁盘51RAID50的特性所需成员磁盘数6个或更多,最低为6个优点比RAID5有更好的读性能比相同容量的RAID5重建时间更短可以容许N个磁盘同时失效缺点设计复杂,比较难实现同一个RAID5组内的两个磁盘失效会导致整个阵列的失效适用领域大型数据库服务器、应用服务器、文件服务器等应用1常用RAID级别的比较RAID级别RAID0RAID1RAID3RAID5RAID10别名条带镜像专用奇偶位条带分布奇偶位条带镜像阵列条带容错性无有有有有冗余类型无镜像奇偶校验奇偶校验镜像备盘无有有有有读性能高低高高中间随机写性能高低最低低中间连续写性能高低低低中间需要的磁盘数2个或更多2个或2N个3个或更多3个或更多4个或2N(N≥2)可用容量总的磁盘容量磁盘容量的50%磁盘容量的(N-1)/N磁盘容量的(N-1)/N磁盘容量的50%1思考题•常用RAID级别中:–哪种RAID级别性能最好?–哪种RAID级别冗余程度最高?–相同可用容量下,哪种RAID级别开销最高?1解答•常用RAID级别中:–RAID0的性能最好;–RAID1的冗余程度最高;–相同可用容量下,RAID1和RAID10的开销最高。1RAID的基本概念RAID级别RAID的实现方式和运行状态目录1软件RAID和硬件RAID•软件RAID–功能都依赖于主机CPU完成,没有第三方的控制处理器和I/O芯片•硬件RAID–有专门的RAID控制处理器和I/O处理芯片来处理RAID任务,不需占用主机CPU资源1RAID的运行状态•建立(Create)•正常(Normal)•降级/临界(Degrade/Critical)•重建(Rebuild/Recover)•重构(Reconstruct)•失效(Failed)1思考题•若RAID5的一块磁盘失效,则:–目前该RAID阵列运行在什么状态之下?–若又有一块磁盘发生故障,会进入什么状态?1解答•若RAID5的一块磁盘失效,则–目前处在降级/临界状态下–再有一块磁盘发生故障,将进入失效状态1分块、分区、分条是RAID组织数据的重要概念RAID的冗余方式有镜像冗余和校验冗余常用RAID级别有RAID1、RAID5和RAID10等本章总结