千兆位报文网络技术一、概述尽管建立一个快速的报文网络比建立一个快速的信元网络要简单得多,但由于传统势力的影响,在过去的几年里,千兆位报文网络技术不如信元网络技术发展快。在较高带宽的网络上,我们可以较好地解决数据串行传输的延迟问题。如果传输速度为1Gb/s,那么,一个最大的以太网帧仅仅需要12μs的传输时间,这个时间对大多数实时应用来说是可以忽略的,因为人们能感觉到的延迟是10ms左右。在传统以太网上,当最大报文为158字节时,需要1ms以上的传输时间。千兆位报文网络有三个具体特征:·需要千兆位或接近千兆位的技术,这一问题已相当容易,且已有若干解决的途径。·报文交换网络提供传输一个报文的延迟限制,如果不提供延迟限制,则用户必须编写程序以获取延迟限制。·报文网络是否支持多路广播(Multicasting)技术,如支持多路电视会议等。二、千兆位局域网报文技术目前,建立一个局域网报文网络有许多途径。波分多路复用(WDM)是方法之一,下面介绍几种其它的方法。1.HIPPI严格地说,HIPPI(High-PerformanceParallelInterface)完全不是一个网络协议,它是一个点到点的连接技术。它以800/1600Mb/s的速率连接两个设备(典型连接为高性能计算机与外围设备的连接),连接电缆距离为25米。然而,HIPPI在千兆位数据通信实验上呈现出重要的一面,它是第一个以高数据传输率连接设备的标准,并能通过一个连接开关,提供千兆位的局域网服务。HIPPI标准由ANSIX3T9.3委员会提供。它基于类连接模式,定义了一个单工的报文帧协议。HIPPI不支持在一条线路上同时有多个连接的复用,一旦数据发送完成,就结束此次连接。一个连接建立时,如果目的端已连接到其它的系统,这时HIPPI将等待目的端设备空闲或通知一个连接冲突事件。很明显,正是由于这种设备间的点到点连接,HIPPI仅能用于建立单一的永久性连接。报文以一组序列发送,每组大小为1~256个32位字(800Mbs)或64位字(160Mbs),报文中只有第一组或最后一组可小于256个字。报文尺寸在2B~4GB。HIPPI的电缆数据位非常宽,所以,电缆上的频率为25MHz(每个字40毫微秒)。每个HIPPI报文包含高层协议标识和多达1016字节的控制信息,支持可变长报文的传送。HIPPI不支持多路广播功能。控制信息部分用于支持各种HIPPI方式。当前HIPPI定义了支持IEEE802.2协议数据单元、IPI-3磁盘和磁带命令方式。HIPPI作为千兆位连接技术,较广泛地用于点到点的连接。今后必将在设计者的不懈努力下成为千兆位报文网络的基础。2.光纤通道另一个被建议用于网络的开关互连技术是光纤通道(FibreChannel)。它有希望成为国际标准化组织(ISO)的国际标准。光纤通道进一步扩展了HIPPI支持的连接类型,在支持IPI3和802帧的基础上,还支持SCSI接口和IBM块多路通道协议(FIPS60),但光纤通道协议相对HPPI而言要复杂一些。3.Atomic局域网Atomic是由美国南加利福尼亚大学信息科学研究所建立的一个千兆位局域网,它基于一种被称为Mosaic的多处理器互连芯片技术。该芯片具有八个通道,每个通道速率为0.5Gb/s附带一个16位处理机芯片。典型的连接为4×4或8×8网状(Mesh)结构。Mosaic技术通过报文中的两个计数器(x计数器和y计数器)路由报文,将一个报文从一个芯片路由到另一个芯片。若用x表示两芯片间的X(水平)方向距离,y表示Y(垂直)方向距离,那么,首先在X方向上移动,每移一站,x计数器减1,直至为0。然后,再在Y方向上移动,直至y计数器值减为0。此时,所传递的报文就到达了目的地,被递交到它的主机中。然而,如果主机被连到网状结构的边缘,Mosaic路由就无法正常工作。为了克服这个问题,Atomic结构通过支持多源路由来增强Mosaic路由模式,它允许一个报文包含多个计数器,当第一个源路由完成后,接收点芯片的处理机简单地检查一下报文内是否还有另外的计数器对,若有就继续进行路由。Mosaic技术支持长度为偶数字节的可变长报文,该机制的工作过程为:当报文头到达Moaic芯片后,首先通过头信息决定下一站的位置,如果下一站空闲,就将此报文向前传递;如果同时有两个报文试图从相同的端口输出,那么,一个报文将被阻塞直至另一个报文使用完该端口为止。Mosaic芯片技术在两个芯片之间采用字节流控机制,报文的阻塞意味着拒绝接受上一站的下一个字节,依次下去直至阻塞到发送者。Atomic结构要求每个集中器至少有一个主机作为地址查询机。它通过询问,了解整个网络的拓扑结构,建立任意两节点间的路由表。当一主机希望发送数据到另一主机时,首先询问地址查询机如何路由。根据集中器的连接,任意两个主机间可能有多个路由途径,地址查询机在不同的时刻可能对相同的请求回答不同的路由,以实现有效的交通平衡。Atomic结构中的多路广播由Mosaic芯片中的处理器实现。在每个集中器中,有一个或多个处理器被指定复制报文工作,地址查询机告诉这些处理器如何送一个报文到一个具体的多路地址,同时也通知主机传输多路地址到指定的处理机。Atomic结构的主要优点是其拓扑结构的冗余,这一点使它非常坚固可靠,具有均衡的交通负载和支持多路功能。4.载波检测多路存取环网到目前为止,还没有一个经测试的千兆位报文环网络系统,这可能使人感到惊奇,因为千兆位报文环网有一定的存在意义。例如:像FDDI一样的令牌环网,它能控制令牌的轮询时间容易限制报文的延迟时间。随着带宽的增加,可以将令牌的轮询时间忽略不计,进而环网通过沿环路发送多路报文,以实现对多路功能的支持,每个环上的节点均可获取一个报文的拷贝。载波检测多路存取环网(CSMA/RN)是一个支持千兆位报文的环网,它是由OldDominio大学研究人员开发的实验模拟环网。从CSMA/RN新颖的访问协议可以获得一些千兆位环网的设计思想。基本的CSMA/RN设计见下图。数据从环的左端进入并放入低延迟的缓冲区内。信号则从旁路缓冲区直接到达控制器。控制器根据环上的进一步信息来管理数据流。如果环上的一个报文寻址到控制器上的主机,控制器就从延迟缓冲区中路由数据到主机的输入端,直至整个报文全部从网上取来。如果环活跃,意味着正在传输数据,这时环上的数据总是优先于新进入环的数据,控制器只是简单地将目的地不是本控制器主机的所有数据转发到环的输出线上。如果环空闲,控制器则被允许从主机向环上发送数据。然而,当控制器正在发送数据时,如果监听到有数据从环上来,那么,控制器必须进行冲突处理。在CSMA/RN环境下,控制器将发出一个截切标志,中止当前报文的传输。截切标志指明发送的包是不完整的,其余的部分之后发送。如果CSMA/RN使用信元,使缓冲区的延迟时间等于一个信元的传输时间,那么,控制器应知道,如果环空闲,它至少有时间发送一个信元,但是CSMA/RN的报文是可变长的,设计者就不得不解决冲突问题。一个解决办法是流产被发送的报文,控制器放一流产令牌在包的尾部,当接收站收到后就将此报文丢掉。这种办法必然引起带宽的浪费。另一种办法是合并延迟缓冲区和主机发送缓冲区。当冲突发生时,从环上来的新数据被放在发送缓冲区的发送报文后面,这种办法增加了环的大小,使绕环的传送时间可变。CSMA/RN方法试图消除这个平衡。如果一个完整的报文到了环上,它的传输时间是一个常量,它允许可变长报文的传送能最大限度地利用环的带宽。但是,在最坏的情况下,报文可能被分成许多小片,并且花费较长的时间传到网上。这些碎片由于头信息和截切标志会浪费一些带宽,然而通过大量的模拟证明,即使负载为1Gb/s,其冲突率也是相当低的,因而CSMA/RN似为一个好的设计,可为变长的报文提供统计延迟限额。另一个值得一提的CSMA/RN特征是在接收端可能丢弃报文。环的带宽被重新利用,因而平均来说加倍了有效的数据传输率,同时,通过保持报文在环上占用较少的时间,也减小了冲突发生的机会。三、千兆位广域报文网络技术广域报文网络通过一些设备互连而建立。一般使用两类模型,一类模型是路由器,路由器之间直接相互连接;另一类模型是由实现了某类介质访问协议的转发设备来建立虚拟网络,路由器通过转发设备连入网络。这两种结构今天都有广泛的应用,路由器互连的方法已广泛用于Internet,帧中继和X.25网络使用了转发设备方法。建立两种类型广域网的关键是:在千兆位的速率下,如何在路由器和转发设备中实现报文的路由。1.千兆位路由报文的基本要求路由报文设备由三部分组成:·连接各种网络和设备的一组网络接口;·决定向何处发送报文的一个或多个转发处理器;·连接网络接口与转发处理器的连接光纤。为了以千兆位速率转发报文,以上三部分都必须具有千兆位的速率。建立千兆位的网络接口是可能的。开发以千兆位速率突发送报文的转发处理器也不是一件困难的事。研究者们认为,只要经过精细的设计,使用相关的不太昂贵的处理器,以持续的千兆位速率转发报文是完全可能的。通常转发一个报文要做一些简单的报文头一致性检查,以决定将要到达的下一站点,同时可能对报文头作相互更改,报文头是唯一需要处理的部分。例如对IP数据报文的转发过程是首先检查报文类型,然后查询Cache并路由报文。在大多数情况下,路由信息在Cache内。假定Cache命中,那么IP头被更新,且数据报文被转发到接口。执行的代码行大约有20行C代码,约200条指令。在多数网络中,平均报文大小为128字节,这就要求每秒需近200百万条指令来维持千兆位的速率,像DECAlpha21064这样的处理器就能达到。报文增大对处理器的要求也能容易达到。例如Intel486处理器就可以以千兆位的速率转发1024字节大小的报文。所以,对转发设备而言,处理器的处理能力将不成问题。接口间的数据拷贝是一个棘手的问题。对于支持N个接口的路由器或交换机来说,如果每个接口的收发率为1Gb/s,在最坏的情况下,路由器应具有nGb/s的能力,而设计一个数据总线来实现这种速率是困难的。信元开关可通过并行移动数据来解决这个问题,但信元开关仅仅适合于定长信元。今天,研究者们既没有选择交换开关,也没有选择串行总线来实现接口间的数据移动。下面将讨论两种其它的方法。2.PlaNET——一个高速报文路由器PlaNET是由IBM开发的具有八个端口环状总线的千兆位开关,它支持多种路由模式。典型的是报文采用源路由模式传输,当适配器从链路上接收到一个报文时,它就将此报文放到总线上,由总线对报文进行适配器到适配器的中继。如果报文的源路由指示它已传送到了目的适配器,报文将被拷贝到接口的输出队列中。为了支持多点功能,多个适配器可以拷贝相同的报文。接收端的适配器不移去总线上的报文,它只将报文的拷贝传送到下一个适配器,由发送端的适配器负责移去总线上的报文。为避免访问总线的冲突,适配器采用轮询模式获得对总线的访问。PlaNET总线支持6Gb/s速率,开关被设计为支持800Mb/s连接速率,这样,总线的速率高于八个端口总体集成速率。PlaNET的一个有趣特征为它的总线是蛇型结构。这种交织的总线拓扑结构使所有适配器间的距离相对缩小,减小了数据路由时间。基于PlaNET连接,IBM开发了一个本地分布式网络——ORBIT。ORBIT使多个主机共享访问PlaNET适配器成为可能。PlaNET是最早研制的具有千兆位能力的开关之一,它说明了只要经过精细设计报文交换开关,获得千兆位的速率是可能的。3.贝尔实验室的IP路由器AT&T贝尔实验室的一个小组在1992年开发研制了千兆位IP路由器原型系统。该路由器使用多个专用的处理器转发报文。一个4处理器的测试原型系统具有3.5倍的加速比。每个处理器每秒可转发6万个报文,这样,4个处理器的系统就能以每秒21万个报文的速度转发。如果报文较大,则足以达到千兆位速率。当时处理器的主频为3MHz,设计者希望对其改进,将主频提高到20MHz,那么,转发报文的速率便可达到每秒140万个报文。接口与处理器之间的数据传