1上海XX公司Riverbed广域网数据优化方案二〇〇八年九月21.什么是广域网数据服务-WANDataService众所周知,由于互联网的普及,TCP/IP已经成为一个被广泛采用的网络协议。越来越多的公司业务已经离不开基于TCP/IP网络而开发的应用。随着公司业务的发展和全球化的趋势,公司会在总部以外的地区和国家建立更多的远程办事机构。这样一来,公司的业务系统就必须运行在广域的TCP/IP网络之上。我们知道,相比局域网络,广域网络的带宽只有1/100或更少,而延迟却增加100倍或更多。在局域网络上运行的非常好的应用到广域网络上运行时,一定会碰到效率极其低下等问题,会严重影响企业的生产效率。在过去的时间里,好多网络厂商已经意识到该问题,提出了好多解决方案。比如采用压缩技术,流量管理技术,缓存技术等。所有这些技术只能在某一方面对广域网络进行加速,由于没有涉及TCP/IP的本质,使用效果不佳且带有相当大的局限性。由于广域网存在的传输性能问题,为了提高在分支机构工作的员工的应用响应速度,许多的大型客户往往在分支机构部署本地的文件服务器,打印服务器和邮件服务器。这样虽然暂时解决了远程客户的应用响应速度,但是也造成了远程机构IT基础架构的复杂性,大大增加了设备成本和人员维护成本。3广域数据服务(WANDataService)作为一个新兴的技术领域,为克服跨广域网应用性能瓶颈带来了一种创新的方法。它可以加速应用系统在广域网上的响应速度,提供高效的带宽利用率并且在广域网环境中实现数据大集中。广域数据服务解决方案“让广域网像局域网一样”实际上有两方面的意思:1)使广域网的性能具有质的飞跃,尤其针对那些在局域网上可以正常运行,但一到广域网就受到极大影响的应用和协议。2)能处理和对付横跨分布式企业网络的范围广泛的应用和协议。对广域网进行全方位改进的解决方案我们称之为广域数据服务(WDS)。广域二字不单单指的是广域网,它还意味着WDS所应用的范围非常广泛,以及WDS对各种各样瓶颈问题所进行的全方位改进。WDS不仅仅只是一个面向性能和效率的解决方案,它同时也是一个能帮助我们实现以下这些以前所无法实现的目标的途径:在不影响远程用户的前提下,将分布式的IT基础设施如文件服务器、邮件服务器、网络附加存储(NAS)和远程办公室备份系统等集中起来,整合到统一的数据中心。让企业位于世界各地的同事共享大型文件变得简单而高效,使他们感觉就好像在同一建筑里办公一样。通过长距离广域网链路进行备份与复制操作,而仅仅在一年前,想在备份窗口内完成这些操作都是不可能的任务。4在不升级带宽的前提下在现有的广域网上提供比以前丰富得多的应用服务。如果需要,企业完全可以除去各分支点众多杂乱的服务器和设备,而以网络服务和WDS取代。这种改变可以极大地降低企业的IT开销并使整个IT系统易于管理。另外,如果分支点没有本地服务器,那么通过增加部署WDS也可以极大地改进其工作效率。广域网性能受众多瓶颈限制:下面让我们更深入地探讨一下瓶颈问题。与局域网链路相比,广域网链路通常带宽更低而延迟更高。但在实际应用中这些限制是如何影响应用性能呢?瓶颈主要有四个,其中一个与带宽相关,而另外三个全都和延迟有关。带宽这个瓶颈显而易见:没有任何一个应用在发送数据时可以突破带宽容量的限制。而三个数据延迟方面的瓶颈则相对比较深奥一点,显得不是那么直观,而且一般只会在不存在带宽瓶颈的情况下才会被注意到。由于延迟瓶颈的存在,即使现有可用的带宽十分充裕,应用也有可能无法充分利用好这些带宽资源。第一号延迟瓶颈第一号延迟瓶颈是由TCP协议的端到端应答机制所造成的。在TCP协议中,从一端到一端(比如在服务器和客户机之间)所正在传输的数据量受数据报窗口大小的限制。当该窗口满5了以后,发送方就无法发送更多的数据,直到接收方确认已经接收了窗口中的部分数据。如果数据报窗口太小的话,势必会限制数据从一方传送到另一方并进行应答的速率,进而影响到整条链路的数据吞吐能力。从理论上说,这个瓶颈出现的几率很小,因为已经有很好的机制能允许TCP协议使用足够大的数据报窗口,而且现在流行的最新的操作系统也都实现了这些机制。然而,客户机和服务器上的缺省设置通常更适用于局域网而不是广域网,而且也很少有服务器和客户机上的TCP协议栈被设置成能与广域网数据延迟进行很好的配合。MaxThroughput(Mbps)-0.200.400.600.801.001.201.401.600.0100.0200.0300.0400.0500.0600.0700.0800.0900.1000.1100.1200.1300.1400.1500.1600.1700.1800.1900.200RTT(seconds)MaxThroughput(Mbps)图表1:上图表明了一条T1线路(1.544Mb/s)在最大64k字节窗口下进行TCP连接时其有效数据吞吐能力随延迟的变化情况。在低延迟的情况下,线路能达到其带宽允许的最高数据吞吐量,但是当数据延迟超过40ms时,第一号延迟瓶颈的影响就要超过带宽瓶颈的影响了。6TCPThroughput-T1vs.T3-10.0020.0030.0040.0050.000.0100.0200.0300.0400.0500.0600.0700.080RTT(seconds)MaxThroughput(Mbps)MaxThroughputT1(Mbps)MaxThroughputT3(Mbps)图表2:该图所要演示的情况和图表一类似,不过增加了一条T3线路(45Mb/s)以供比较。在该图的尺度下,T1线路的数据吞吐能力情况基本稳定,但要注意的是,随着延迟的增加,T3线路的吞吐能力很快就下降到与T1线路相差无几的水平上。在延迟大于等于40ms及TCP窗口较小的情况下,T3线路的数据传输能力并不比T1线路更具多少优势。第2号延迟瓶颈第二号延迟瓶颈是由TCP的慢启动和拥塞控制行为引起的。以上解释的第一号延迟瓶颈在于TCP的窗口大小有限,而第二号延迟瓶颈则在于TCP并不是总能利用最大窗口进行传输,也就是说,如果数据传送在一段时间内比较正常的话,TCP窗口大小会逐渐变大,但一旦传输失败的话其窗口大小会立即缩小。如果网络同时具有高带宽和高延迟特性,这种行为就会导致带宽的浪费从而延长数据的传输时间。不过,这种问题主要发生在长肥网络(LFN)中,上面T1线路的例子并不适用。第3号延迟瓶颈第三号延迟瓶颈是由TCP协议之上的所谓的应用协议引起的。回想一下上面提到的第一号延迟瓶颈,当TCP受到数据窗口大小和数据回应需要的限制时,实际带宽即使很充裕也是起不到什么帮助作用的,类似的,如果一个应用在应用层就受到应用消息大小和数据回应及确认需要的限制时,不管带宽有多充裕,也不管是否已经避免了第一、第二号延迟瓶颈,这些都起不到什么有效的帮助作用。如果应用协议最初即被设计用于广域环境–例如HTTP和FTP–那么一般不会碰到第三号延迟瓶颈,但是如果应用协议最初是被设计用于局7域网的–比如微软的Windows上通过CIFS协议进行文件共享–通常就会受到第三号延迟瓶颈非常严重的影响。TCPvs.CIFSThroughputonaT1(Mbps)-0.200.400.600.801.001.201.401.600.0100.0200.0300.0400.0500.0600.0700.0800.0900.1000.1100.1200.1300.1400.1500.1600.1700.1800.1900.200RTT(seconds)MaxThroughput(Mbps)CIFSTCP图表3:图表三显示了T1线路上CIFS协议和TCP协议数据吞吐能力受数据延迟影响时的变化情况。当然,随着延迟的增加,两者的吞吐能力都极速下降–但应该注意到在这时CIFS是主要瓶颈(因为它下降地更快)。对于在广域网上有更好表现的应用来说,TCP延迟可能是个主要问题,但对于CIFS协议之上的文件共享来说,不管TCP优化地有多好或带宽有多充裕,这些都不足以克服高延迟所带来的直接影响。广域82.Riverbed所倡导的WDS广域网优化服务技术原理Riverbed多层优化技术:Riverbed公司由2002开始针对WAN带宽不足、时延过长、TCP传输及应用层协议效率低等问题研究开发出顶尖的WDS技术产品。至今在数千大型企业用户网络运营中,将广域网应用性能提高达100倍之多,同时让广域网数据流量减少60%到95%。以下分别对WDS三大核心技术进行阐述。数据优化RiOS对传输中的TCP流和数据进行分段并为其建立索引。建立索引的数据将与磁盘上的数据进行比较。以前发送过的数据段不会通过WAN再次发送,而只发送与其对应的引用来代替它。这种过程将使得先前通过WAN发送过的重复数据被极小的引用代替。通过使用其获得专利的多层次引用结构(SDR),一个引用可表示多个字段至数兆字节的数据。数据引用数据RiOSSDR可表示极大数量的数据。因此,单个引用可表示以前通过WAN传送过的数兆字节的数据。如果RiOS从未见过该数据,则会使用基于Lempel-Ziv(LZ)的算法压缩这些数据段,并发送给WAN远端上对等的RiOS支持设备。对等设备或端点上也存储有这些数据段。最后,使用新的数据和对现有数据的引用重新构造原流量,然后传送给客户机。RiOS数据优化具有高可扩展性,峰值压缩率可达到100:1或更高。这些压缩率(是消除冗余数据传输的结果)远比普通TCP压缩设备所能提供的压缩率高。传输优化消除重复数据的传输进行跨应用的数据优化提升有效带宽,平均可达5-10倍根据网络状况自动调整TCP传输参数传输协议往返确认时延减少65%-98%在高带宽、高延迟网络连接的情况下实现高达95%的使用率通过支持SSL优化提供透明加速保密的应用程序9RiOS通过传输层优化克服了传输协议的确认延时。传输优化是一组功能,它通过动态适应网络状况,组合窗口扩展、有效载荷的智能化重新打包、连接管理和其他技术手段来实现TCP优化。从而降低WAN传输信息所导致的往返时延,同时维持了传输的可靠性和弹性。作为TCP代理,RiOS可以有效地将混合有数据和数据引用的TCP有效载荷重新打包。如数据优化一节中所述,被识别为已经传输过的数据会被引用取代,而这些引用可代表大量数据。采用这种方法,RiOS实质性地扩展了TCP帧,通常使容量比基本的TCP有效载荷大数百倍。无RiOS:TCP有效载荷仅包含数据典型TCP窗口:从16KB至64KB采用RiOS:TCP有效载荷包含数据和引用引用新数据TCP优化窗口:从100KB+至1MB+(有效)数据虚拟窗口扩展通过对TCP有效载荷执行智能化重新打包而极大增加了TCP有效载荷。SSL加速-很多企业都采用SSL作为加密机制以确保安全。在Steelhead设备中,RiOS提供了加速SSL加密的流量并保持企业首选信任模式的方法,该方法正在申请专利。使用RiOS实现SSL加密时,所有密钥仍存放在数据中心,分支机构无需假证书。Steelhead设备可自动发现其SSL对等设备并开始优化SSL流量,而RiOS也为企业提供了通过中央管理控制台(CMC)对SSL加速功能进行集中管理。其他加速SSL的方法要求分支机构的设备具有假证书或服务器密钥。这些方法要求在企业范围内分发密钥,使SSL会话更容易受到攻击,因而使企业基础架构的安全性受到影响。RiOS只为分支机构的设备分发临时会话密钥。通过这种方式,RiOS可将其世界领先的数据优化、传输优化和应用程序优化机制用于SSL加密流量,而不会影响企业首选的安全模式。应用程序优化RiOS应用程序优化功能对重要(但性能欠佳)的协议提供额外的第7层加速。应用程序优化模块可消除特定应用程序建立时所需的往返流量,大幅改善吞吐量,提供额外的性能改善。Riverbed是第一个提供第7层应用程序协议优化的供应商,支持企业常用的应用程序,如MicrosoftWindows文件系统(CIFS协议)、MicrosoftExchange邮件