InvoiceDateInvoice#BillTo:ShipTo:P.O.NumberTermsRepShipViaF.O.B.ProjectQuantityItemCodeDescriptionPriceEachAmountTotal2007年12月3Tech¡我爱技术在过去的10年里,CPU的运算速度提高了近40倍。但作为数据存储重要设备的磁盘.其存取速度却没能与微处理器的性能同步发展发展。虽然磁盘的容量/价格比再不断改善,但磁盘速度却之提高了3、4倍,如何才能进一步提升服务器磁盘性能呢,本期I-Tech为您揭晓。本篇主要讲解的RAID技术起初主要应用于服务器高端市场,但是随着个人用户市场的成熟和发展,正不断向低端市场靠拢,从而为用户提供了一种既可以提升硬盘速度,又能够确保数据安全性的良好的解决方案。目录CATALOG〉〉〉磁盘阵列(RAID)技术一、磁盘阵列(RAID)入门基础二、磁盘阵列(RAID)LEVEL概述三、常用磁盘阵列(RAID)比较四、磁盘阵列(RAID)原理五、细说磁盘阵列(RAID)磁盘阵列(RAID)饮水机六、磁盘阵列(RAID)术语七、磁盘阵列(RAID)FAQ负债均衡技术RAID是英文RedundantArrayofInexpensiveDisks的缩写,中文简称为磁盘阵列。其实,从RAID的英文原意中,我们已经能够多少知道RAID就是一种由多块廉价磁盘构成的冗余阵列。虽然RAID包含多块磁盘,但是在操作系统下是作为一个独立的大型存储设备出现。RAID技术分为几种不同的等级,分别可以提供不同的速度,安全性和性价比。人们在开发RAID时主要是基于以下设想,即几块小容量硬盘的价格总和要低于一块大容量的硬盘。虽然目前这一设想还没有成为现实,RAID在节省成本方面的作用还不是很明显,但是RAID可以充分发挥出多块硬盘的优势,实现远远超出任何一块单独硬盘的速度和吞吐量。除了性能上的提高之外,RAID还可以提供良好的容错能力,在任何一块硬盘出现问题的情况下都可以继续工作,不会受到损坏硬盘的影响。RAID系统究竟有什么好处呢?1.扩大了存贮能力可由多个硬盘组成容量巨大的存贮空间。2.降低了单位容量的成本市场上最大容量的硬盘每兆容量的价格要大大高于普及型硬盘,因此采用多个普及型硬盘组成的阵列其单位价格要低得多。3.提高了存贮速度单个硬盘速度的提高均受到各个时期的技术条件限制,要更进一步往往是很因难的,而使用RAID,则可以让多个硬盘同时分摊数据的读或写操作,因此整体速度有成倍地提高。4.可靠性RAID系统可以使用两组硬盘同步完成镜像存贮,这种安全措施对于网络服务器来说是最重要不过的了。RAID入门基础BeyondChina5.容错性RAID控制器的一个关键功能就是容错处理。容错阵列中如有单块硬盘出错,不会影响到整体的继续使用,高级RAID控制器还具有拯救功能。6.对于IDERAID来说,目前还有一个功能就是支持ATA/66/100。RAID也分为SCSIRAID和IDERAID两类,当然IDERAID要廉价得多。如果主机主板不支持ATA/66/100硬盘,通过RAID卡,则能够使用上新硬盘的ATA/66/100功能。1.RAID技术主要包含RAID0~RAID7等数个规范,它们的侧重点各不相同,常见的规范有如下几种:RAID0:RAID0连续以位或字节为单位分割数据,并行读/写于多个磁盘上,因此具有很高的数据传输率,但它没有数据冗余,因此并不能算是真正的RAID结构。RAID0只是单纯地提高性能,并没有为数据的可靠性提供保证,而且其中的一个磁盘失效将影响到所有数据。因此,RAID0不能应用于数据安全性要求高的场合。RAID1:它是通过磁盘数据镜像实现数据冗余,在成对的独立磁盘上产生互为备份的数据。当原始数据繁忙时,可直接从镜像拷贝中读取数据,因此RAID1可以提高读取性能。RAID1是磁盘阵列中单位成本最高的,但提供了很高的数据安全性和可用性。当一个磁盘失效时,系统可以自动切换到镜像磁盘上读写,而不需要重组失效的数据。RAIDLevel概述BeyondChinaRAID0+1:也被称为RAID10标准,实际是将RAID0和RAID1标准结合的产物,在连续地以位或字节为单位分割数据并且并行读/写多个磁盘的同时,为每一块磁盘作磁盘镜像进行冗余。它的优点是同时拥有RAID0的超凡速度和RAID1的数据高可靠性,但是CPU占用率同样也更高,而且磁盘的利用率比较低。RAID2:将数据条块化地分布于不同的硬盘上,条块单位为位或字节,并使用称为“加重平均纠错码(海明码)”的编码技术来提供错误检查及恢复。这种编码技术需要多个磁盘存放检查及恢复信息,使得RAID2技术实施更复杂,因此在商业环境中很少使用。RAID3:它同RAID2非常类似,都是将数据条块化分布于不同的硬盘上,区别在于RAID3使用简单的奇偶校验,并用单块磁盘存放奇偶校验信息。如果一块磁盘失效,奇偶盘及其他数据盘可以重新产生数据;如果奇偶盘失效则不影响数据使用。RAID3对于大量的连续数据可提供很好的传输率,但对于随机数据来说,奇偶盘会成为写操作的瓶颈。RAID4:RAID4同样也将数据条块化并分布于不同的磁盘上,但条块单位为块或记录。RAID4使用一块磁盘作为奇偶校验盘,每次写操作都需要访问奇偶盘,这时奇偶校验盘会成为写操作的瓶颈,因此RAID4在商业环境中也很少使用。RAID5:RAID5不单独指定的奇偶盘,而是在所有磁盘上交叉地存取数据及奇偶校验信息。在RAID5上,读/写指针可同时对阵列设备进行操作,提供了更高的数据流量。RAID5更适合于小数据块和随机读写的数据。BeyondChinaRAID3与RAID5相比,最主要的区别在于RAID3每进行一次数据传输就需涉及到所有的阵列盘;而对于RAID5来说,大部分数据传输只对一块磁盘操作,并可进行并行操作。在RAID5中有“写损失”,即每一次写操作将产生四个实际的读/写操作,其中两次读旧的数据及奇偶信息,两次写新的数据及奇偶信息。RAID6:与RAID5相比,RAID6增加了第二个独立的奇偶校验信息块。两个独立的奇偶系统使用不同的算法,数据的可靠性非常高,即使两块磁盘同时失效也不会影响数据的使用。但RAID6需要分配给奇偶校验信息更大的磁盘空间,相对于RAID5有更大的“写损失”,因此“写性能”非常差。较差的性能和复杂的实施方式使得RAID6很少得到实际应用。RAID7:这是一种新的RAID标准,其自身带有智能化实时操作系统和用于存储管理的软件工具,可完全独立于主机运行,不占用主机CPU资源。RAID7可以看作是一种存储计算机(StorageComputer),它与其他RAID标准有明显区别。除了以上的各种标准,我们可以如RAID0+1那样结合多种RAID规范来构筑所需的RAID阵列,例如RAID5+3(RAID53)就是一种应用较为广泛的阵列形式。用户一般可以通过灵活配置磁盘阵列来获得更加符合其要求的磁盘存储系统。RAID级别的选择有三个主要因素:可用性(数据冗余)、性能和成本。如果不要求可用性,选择RAID0以获得最佳性能。如果可用性和性能是重要的而成本不是一个主要因素,则根据硬盘数量选择RAID1。如果可用性、成本和性能都同样重要,则根据一般的数据传输和硬盘的数量选择RAID3、RAID5。BeyondChina常用RAID比较BeyondChina磁盘阵列中针对不同的应用使用的不同技术,称为RAIDlevel,而每一level代表一种技术,目前业界公认的标准是RAID0~RAID5。这个level并不代表技术的高低,level5并不高于level3,level1也不低过level4,至于要选择那一种RAIDlevel的产品,纯视用户的操作环境(operatingenvironment)及应用(application)而定,与level的高低没有必然的关系。RAID0及RAID1适用于PC及PC相关的系统如小型的网络服务器(networkserver)及需要高磁盘容量与快速磁盘存取的工作站等,因为比较便宜,但因一般人对磁盘阵列不了解,没有看到磁盘阵列对他们价值,市场尚未打开;RAID2及RAID3适用于大型电脑及影像、CAD/CAM等处理;RAID5多用于OLTP,因有金融机构及大型数据处理中心的迫切需要,故使用较多而较有名气,但也因此形成很多人对磁盘阵列的误解,以为磁盘阵列非要RAID5不可;RAID4较少使用,因为两者有其共同之处,而RAID4有其先天的限制。其他如RAID6,RAID7,乃至RAID10等,都是厂商各做各的,并无一致的标准,在此不作说明。介绍各个RAIDlevel之前,先看看形成磁盘阵列的两个基本技术:磁盘延伸(DiskSpanning):译为磁盘延伸,能确切的表示diskspanning这种技术的含义。四个磁盘形成一个阵列(array),而磁盘阵列的控制器(RAIDcontroller)是将此四个磁盘视为单一的磁盘,如DOS环境下的C:盘。这是diskspanning的意义,因为把小容量的磁盘延伸为大容量的单一磁盘,用户不必规划数据在各磁盘的分布,而且提高了磁盘空间的使用率。DFTraidRAID原理BeyondChina的SCSI磁盘阵列更可连接几十个磁盘,形成数百GB到数TB的阵列,使磁盘容量几乎可作无限的延伸;而各个磁盘一起作取存的动作,比单一磁盘更为快捷。很明显的,有此阵列的形成而产生RAID的各种技术。我们也可从上图看出inexpensive(便宜)的意义,因为四个250MBbytes的磁盘比一个1GBytes的磁盘要便宜,尤其以前大磁盘的价格非常昴贵,但在磁盘越来越便宜的今天,inexpensive已非磁盘阵列的重点,虽然对于需要大磁盘容量的系统,仍是考虑的要点。磁盘或数据分段(DiskStripingorDataStriping):因为磁盘阵列是将同一阵列的多个磁盘视为单一的虚拟磁盘(virtualdisk),所以其数据是以分段(blockorsegment)的方式顺序存放在磁盘阵列中。我们在前文中已经提到RAID分为几种不同的等级,其中,RAID0是最简单的一种形式。RAID0可以把多块硬盘连接在一起形成一个容量更大的存储设备。最简单的RAID0技术只是提供更多的磁盘空间,不过我们也可以通过设置,使用RAID0来提高磁盘的性能和吞吐量。RAID0没有冗余或错误修复能力,但是实现成本是最低的。RAID0最简单的实现方式就是把几块硬盘串联在一起创建一个大的卷集。磁盘之间的连接既可以使用硬件的形式通过智能磁盘控制器实现,也可以使用操作系统中的磁盘驱动程序以软件的方式实现。我们可以把3块磁盘组合在一起形成一个独立的逻辑驱动器,容量相细说RAIDRAID0BeyondChina当于任何任何一块单独硬盘的3倍。如图中彩色区域所示,数据被依次写入到各磁盘中。当一块磁盘的空间用尽时,数据就会被自动写入到下一块磁盘中。这种设置方式只有一个好处,那就是可以增加磁盘的容量。至于速度,则与其中任何一块磁盘的速度相同,这是因为同一时间内只能对一块磁盘进行I/O操作。如果其中的任何一块磁盘出现故障,整个系统将会受到破坏,无法继续使用。从这种意义上说,使用纯RAID0方式的可靠性仅相当于单独使用一块硬盘的1/3(因为本例中RAID0使用了3块硬盘)。虽然我们无法改变RAID0的可靠性问题,但是我们可以通过改变配置方式,提供系统的性能。与前文所述的顺序写入数据不同,我们可以通过创建带区集,在同一时间内向多块磁盘写入数据。系统向逻辑设备发出的I/O指令被转化为3项操作,其中的每一项操作都对应于一块硬盘。我们可以通过建立带区集,将原先顺序写入的数据BeyondChina被分散到所有的四块硬盘中同时进行读写。四块硬盘的并行操作使同一时间内磁盘读写的速度提升了3倍。在创建带区集时,合理的选择带区的大小非常重要。如果带区过大,可能一块磁盘上的带区空间就可以满足大部分的I/O操作,使数据的读写