存储优先,面临三个主要问题:1、基础架构简单:合并、虚拟化、自动化管理,可简化存储基础架构。2、信息生命周期:以一定的方式管理商业数据,渡过其从产生到消亡的生命周期,可以最低的成本优化存储和对数据的访问。3、商业的连续性:维护数据随时可访问,保护关键的商业资产,根据商业风险和信息价值调整数据的恢复成本。存储是不能后悔的。有很多的问题:数据卷不断扩展,如何有效地管理?数据需要整个公司都能访问到?大量的存储设备和巨大的数据量,增加了管理的复杂性,这就把存储推向了网络,存储局域网络(SAN)应运而生。SAN是一种领先的存储基础架构,SAN提供简化的存储管理,易扩展,灵活性,可用性,改良的数据访问,移动和备份。file://D:\我的文档\学习教程\主机\ibm\红宝书-存储\IntroductiontoStorageAreaNetworks.pdf前言2008年11月21日17:54分区前言的第1页计算基于信息,信息是所有计算处理所基于的根本资源,就是公司的资产。信息保存在存储介质上,被服务器上运行的应用程序所访问。通常信息是一种独一无二的公司资产,信息每天每一秒钟都在产生。在确保所有的商业能达到预期的结果,必须毫无延迟地访问精确的信息。对商业信息的管理和保护成为商业处理有效性的关键。C/S计算模式的出现带来了很多问题,比如管理成本的激增,还有一些存储管理的新问题,比如安全地维护和保护信息的法规遵从。从前集中在主机环境中的信息现在被打散到网络之中,这就带来了管理不善的潜在可能性。这就要求一种新的基础架构模式,即支持数据在地理上的散布,又可满足信息即时访问的需求。导言2008年11月21日17:45分区第一章的第2页存储网络工业协会(SNIA)把SAN定义为一种网络,其主要目的在于计算机系统与存储元件之间的数据传输。通讯基础架构,提供物理连接;○管理层,组织连接、存储元件、和计算机系统,以使数据传输是安全和健壮的。○SAN的组成包括:术语SAN通常(但非必要)被认为是块(block)I/O服务,而不是文件访问服务。SAN也可是一个存储系统,由存储元件、存储设备、计算机系统、及(或)附件、加上所有的控制软件、网络之上的通讯等要素组成。注意:SNIA的定义特别地不把术语SAN和光纤通道技术看作是一样的。当术语SAN用于光纤通道技术连接时,规范的用词应该是FCSAN。根据该定义,一个基于以太网的网络,其主要目的是提供对存储元件的访问,也应看作是一个SAN。SAN有时也用于群集中的系统互联。SAN是一个连接服务器和存储设备的专用高速网络。有时被称为“服务器背后的网络”。可使用路由器、网关、集线器、交换机、以及导向器等互联设备进行连接。它消除了传统的服务器和存储之间专用的连接,和服务器拥有并管理存储设备的概念。它也消除了一台服务器可访问数据量的限制,现在受到了可连接到单台服务器存储设备数量的限制。取而代之的,SAN引入了网络的灵活性,可使一台服务器或很多不同类型的服务器共享一个通用的存储设施,该设施可由包括磁盘、磁带、和光存储在内的许多存储设备组成。并且,存储设备可放置在距离使用它的服务器很远的地方。SAN可被看作是存储总线定义的延伸,使得存储和服务器可使用类似LAN和WAN的要素,如路由器、集线器、交换机、导向器、以及网关,来进行互联。SAN既可在服务器之间共享,也可专属一台服务器。既可是本地的,也可在地理距离上散布。下图是一个连接多台服务器和多台存储系统的SAN的概观:SAN开创了把存储连接到服务器的新方法。这些新方法使得可用性和性能都得到了极大的提升。今天的SAN被用来把共享的存储阵列和磁带库连接到多台服务器,也被用于集群服务器进行故障切换。将大型磁盘阵列或磁带库与大型服务器进行互联,SAN提供开放操作系统的混合使用和大量的通讯量。服务器到存储:这是与存储设备传统的交互模式。优点在于,同一台存储设备可被多台服务器顺次或并发访问。○服务器到服务器:SAN可用于服务器之间高速、高数据量的通讯。SAN可用来回避传统的网络瓶颈。通过如下三种途径,推动服务器和存储设备之间直接、高速的数据传输:1、什么是SAN?2008年11月21日17:48分区第一章的第3页服务器到服务器:SAN可用于服务器之间高速、高数据量的通讯。○存储到存储:这种外端数据移动的能力使得数据的移动无需服务器的干预,因此释放了服务器处理器用于其他应用活动的处理。这样的例子包括,磁盘设备无需服务器干预将它的数据备份到磁带设备,或者通过SAN进行远程设备镜像。○SAN可使应用程序更好地执行数据移动,例如,以最小的服务器干预,直接把数据从源设备发送到目标设备。SAN这种新型的网络架构使得多台主机服务器可访问接入同一网络中的多台存储设备。应用可性性的改善:存储与应用程序无关,并且可通过多条数据路径访问,提供更好的可靠性,可用性,和可服务性。○更高的应用性能:存储的处理从服务器卸下,移到独立的网络。○集中统一的存储:简化管理,可扩缩,灵活,可用性。○数据传输和远程站点的保险库:数据的远程副本可作灾难保护,并预防恶意攻击。○简化的集中式管理:存储介质的单映像简化了管理。○使用SAN可提供如下好处:分区第一章的第4页如前所述,光纤通道是大多SAN的主要架构,FICON是用z/OS系统的标准协议,FCP是用于开放系统的标准协议。下面介绍基于光纤通道的SAN部件,如下图所示:2.1SAN互联在任何SAN的部署中,必须考虑的第一要素就是使用光纤通道连接存储和服务器部件。下面列出的部件典型地用于LAN和WAN的部署。就象LAN一样,SAN把存储接口连接在一起,组成许多网络结构,并能跨越很远的距离。很多用在SAN中的术语,在IP网络术语中都能找到它的起源。某些情况下,我们使用不同的术语表达同样的东西;而在某些情况下,又代表着不同的东西。下面的章节,我们介绍经常遇到的服务器、存储设备和互联。2.2SAN存储存储基础架构是信息所依赖的基础,因此,必须支持企业的商业目标和商业模式。在这种环境下,简单地部署更多更快的存储设备是远远不够的。SAN基础架构提供增强的网络可用性,数据可访问性,和系统可管理性。记住“一个良好的SAN起源于一个良好的设计”是非常重要的。这不只是一句格言,但一定是我们设计和部署一个SAN时原则。SAN解放了存储设备,它不是在一个特定的服务器总线上,而是直接把它连接到网络上。换句话说,存储被形象化了,可跨组织按机能分布。SAN也使存储设备和群集服务器能够集中化,潜在地导致更简单更低成本的集中化管理,降低了总体拥有成本(TCO)。2.3SAN服务器服务器基础架构是所有SAN解决方案的根本原因。该基础架构包括各种服务器平台的混合,如Windows,UNIX(各种不同的版本),和z/OS。随着服务器合并和电子商务的发起,对SAN的需求将增加,使得存储在网络中的重要性更大。2、SAN部件2008年11月21日17:51分区第一章的第5页标准是不同厂家的设备和软件协同工作的基础。SNIA定义并批准了今天SAN的标准,并继续定义以后的标准。SAN工业的所有参与者都使用这些标准,这是SAN得以广泛接受的基础。广泛接受的标准允许SAN解决方案中异构、跨平台、多厂家的部署。由于所有的厂家都接受这些标准,那么,在同一个SAN网络中连接不同厂家的产品应该是没有问题的。然而,几乎每一个厂家都有一个协同工作实验室,在其中测试这些产品与其他厂家产品各种类型的组合。这些测试中最重要的一些方面有,可靠性,错误校正,和性能。如果一种组合通过了测试,厂家就会认证或支持这种组合。3、标准的重要性2008年11月21日17:56分区第一章的第6页SAN会自动进化吗?他们可能消失吗?SAN消亡的确切报告太过夸张了。对SAN进行的太多投资悄然放弃,重走了恐龙的道路。然而,有一个趋势已经开始在SAN的世界起步。正在发生的进化之一是多样性。我们看到越来越多技术上的领先应用到了SAN。正在迅速发生的是,SAN已经具备了多协议的能力。工业组织不再接受创建SAN孤岛,或大量杂乱线缆、支持、电源、和管理的解决方案。甚至,SAN基础架构简化的趋势突然转向更好的方向。曾经竞争的很多技术,现在都坐到了一起。如今,看到FCIP,iFCP,和iSCSI在一起,不再感觉难得了,他们在一起很好地协作。SAN已经悄然地成为一个许多技术和协议共享同一舞台的授予者,而非无聊地争辩哪一个“最好”。4、SAN将走向何方?2008年11月21日17:56分区第一章的第7页章上章,通过SAN的标准定义,介绍了SAN的基本情况,并对进行一个SAN部署背后的基本技术和概念做了一个简要的描述。本章,我们将通过现实的议题,继续讨论在SAN的部署当中常用的技术和平台。也要讨论几个促进SAN演变的趋势,以及他们将如何影响存储技术的将来。节本节,描述促进SAN部署的主要因素,和这些技术可能为数据依赖型商业带来的好处。1、为什么使用SAN?2008年11月22日11:07分区第二章的第8页20世纪90年代,传统的主机架构进行了一次巨大的变革,由以主机为中心的计算模式转向C/S模式。现在,很多公司都有成百甚至上千台分布式的服务器和客户机,遍布整个企业的各个角落。并且很多系统都很强劲,处理能力甚至超过了仅仅几年前的大型计算机。作为其中很大的一部分,存储通过专用的通道直接连接在它所支持的服务器上。一般地,服务器通过LAN或WAN互联,进行通讯和数据交换。连接在这些系统上的磁盘存储容量的数量在近几年里成指数级增长。现在,即使对于桌面级的个人电脑,拥有数十GB的存储也是很普通的。于是,数据开始向由多个磁盘组成的磁盘阵列转移。磁盘阵列的容量可达到数百个GB,但I/O带宽却跟不上处理器速度和存储容量的迅速增长。分布式的服务器和客户机通常要满足特定应用的要求。因此,他们可能运行着不同的操作系统,不同的数据库软件,文件系统和数据格式也不相同。管理这样的多平台,多厂家,网络环境变得非常复杂,成本也很高。要在企业里各种不同的系统上处理数据和进行存储资源管理,必须维护多个厂家的软件工具,适当的熟练的人力资源。有调查显示,维护这样分布式存储的管理成本,比维护集中化的存储的管理成本,要高上10倍还要多。其中包括,备份成本,恢复成本,空间管理成本,性能管理成本,灾难恢复计划等。磁盘存储通常作为一个整体特性从处理器厂家购买,如果价格相比市场更加昂贵的话,就使人难以接受。磁盘和磁带机直接连接在一个服务器或客户机上,其他系统不能使用,这就使得硬件资源的使用效率低下。有时即使有很多空闲的存储容量可用,还是需要购买新的存储设备。另外,存储的容量和性能也很难满足快速变化的需求,比如电子商务应用的爆炸式增长,并且,还需要对信息数据在从诞生到消亡的整个生命周期过程中进行管理。存储在一个系统上的信息数据很难供其他用户使用,除非创建成倍的副本,并把副本移动到连接在其他系统的存储上。大量数据文件的移动明显降低了网络的性能,导致与关键业务应用的冲突。同一份数据的多个副本可能导致各副本之间的矛盾。散布在多个小型系统上的数据也很难供企业级应用的协同和共享,比如象电子商务,ERP,数据仓库,以及商业智能等。通过局域网进行备份和恢复操作也可能导致正常应用的严重中断,即使使用快速的千兆以太网进行传输,每小时从服务器写到带库的的吞吐量是25GB,那么全备份一个300GB的中等规模部门级数据库大约需要花费12个小时。这可能远远超过了完成这项任务所能预留的备份窗口时间,如果是一个跨多个时区的商业操作,那么这个解决方案根本就无法实行。IT管理者越来越清楚地知道,C/S计算模式的这些特性成本太高,效率太低下。而由分布式计算模式而导致的信息孤岛也不符合电子商业公司的需要。1.1面临的问题2008年11月22日10:17分区第二章的第9页特性成本太高,效率太低下。而由分布式计算模式而导致的信息孤岛也不符合电子商业公司的需要。必须寻找新的途径来控制成本,提高效率,简化存储的基础架构,以满足商业的需要。分区第二章的第10页存储基础架构需要支持商业目