1UDP协议的简介UDP协议是UserDatagramProtocol的简称,中文名是用户数据包协议,是OSI参考模型中一种无连接的传输层协议,提供面向事务的简单不可靠信息传送服务。在网络中它与TCP协议一样用于处理UDP数据包。在OSI模型中,在第四层——传输层,处于IP协议的上一层。UDP有不提供数据包分组、组装和不能对数据包进行排序的缺点,也就是说,当报文发送之后,是无法得知其是否安全完整到达的。UDP用来支持那些需要在计算机之间传输数据的网络应用。包括网络视频会议系统在内的众多的客户/服务器模式的网络应用都需要使用UDP协议。UDP协议从问世至今已经被使用了很多年,虽然其最初的光彩已经被一些类似协议所掩盖,但是即使是在今天,UDP仍然不失为一项非常实用和可行的网络传输层协议。与所熟知的TCP(传输控制协议)协议一样,UDP协议直接位于IP(网际协议)协议的顶层。根据OSI(开放系统互连)参考模型,UDP和TCP都属于传输层协议。UDP协议的主要作用是将网络数据流量压缩成数据包的形式。一个典型的数据包就是一个二进制数据的传输单位。每一个数据包的前8个字节用来包含报头信息,剩余字节则用来包含具体的传输数据。2.传输层协议UDP2.1UDP协议报头UDP报头由4个域组成,其中每个域各占用2个字节,具体如下:UDP源端口号目标端口号数据报长度校验值UDP协议使用端口号为不同的应用保留其各自的数据传输通道。UDP和TCP协议正是采用这一机制实现对同一时刻内多项应用同时发送和接收数据的支持。数据发送一方(可以是客户端或服务器端)将UDP数据报通过源端口发送出去,而数据接收一方则通过目标端口接收数据。有的网络应用只能使用预先为其预留或注册的静态端口;而另外一些网络应用则可以使用未被注册的动态端口。因为UDP报头使用两个字节存放端口号,所以端口号的有效范围是从0到65535。一般来说,大于49151的端口号都代表动态端口。数据报的长度是指包括报头和数据部分在内的总字节数。因为报头的长度是固定的,所以该域主要被用来计算可变长度的数据部分(又称为数据负载)。数据报的最大长度根据操作环境的不同而各异。从理论上说,包含报头在内的数据报的最大长度为65535字节。不过,一些实际应用往往会限制数据报的大小,有时会降低到8192字节。UDP协议使用报头中的校验值来保证数据的安全。校验值首先在数据发送方通过特殊的算法计算得出,在传递到接收方之后,还需要再重新计算。如果某个数据报在传输过程中被第三方篡改或者由于线路噪音等原因受到损坏,发送和接收方的校验计算值将不会相符,由此UDP协议可以检测是否出错。这与TCP协议是不同的,后者要求必须具有校验值。许多链路层协议都提供错误检查,包括流行的以太网协议,也许想知道为什么UDP也要提供检查和。其原因是链路层以下的协议在源端和终端之间的某些通道可能不提供错误检测。虽然UDP提供有错误检测,但检测到错误时,UDP不做0781516232431源地址目的地址0|协议|UDP长度|错误校正,只是简单地把损坏的消息段扔掉,或者给应用程序提供警告信息。2.2用户数据报头格式域:源端口是可选域,当其有意义时,它指的是发送进程的端口,这也就假定了在没有其它信息的情况下,返回信息应该向什么地方发送。如果不使用它,则在此域中填0。目的端口在有特定的目的网络地址时有意义。长度指的是此用户数据报长度的八进制表示。(这表明最小的数据报长度是8。)校验码有16位,是对IP头,UDP头和数据中信息包头的数位取反之和再取反得到的。包头从概念上说是在UDP头信息之前的,它包括有源地址,目的地地址,所使用的协议和UDP长度。这些信息使信息不能被错误地接收。这个校验过程与TCP中使用的过程一致。如果计算出的校验码为零,它将被全零发送。全零的校验值意味着发送者未产生校验码。用户接口:用户接口应该允许创建新的接收端口,在接收端口的接收操作有:应该返回一个八进制数说明源端口和源地址,允许数据报传送,指定数据,源和目标端口和目的地地址。IP层接口:UDP模块必须能够决定源和目标的网络地址,而且必须能够从包头中得知所使用的协议。一个可能的接口方式是返回整个数据报,包括接收操作返回的包头。这样的接口还应该允许UDP向IP传送完整的带包头的数据报用于传送。由IP来确定一致性并计算校验码。协议应用:此协议的最主要的用途是网际名称服务器和小文件传输协议。协议号:在IP中使用它时,它的协议号是17(八进制中是21)。2.3UDP信息包UDP信息包由UDP标题和数据组成。UDP的标题结构如图所示,它由5个域组成:源端端口(SourcePort)、目的地端口(DestinationPort)、用户数据包的长度(Length)和检查和(Checksum)。其中,前4个域组成UDP标题(UDPheader),每个域由4个字节组成;检查和域占据2个字节,它用来检测传输过程中是否出现了错误;用户数据包的长度包括所有5个域的字节数。UDP信息包的标题结构检查和的详细计算可在RFC1071中找到,现举一例说明使用检查和检测错误的道理。例如,假设从源端A要发送下列3个16位的二进制数:word1,word2和word3到终端B,检查和计算如下:word1从发送端发出的4个(word1,2,3以及检查和)16位二进制数之和为1111111111111111,如果接收端收到的这4个16位二进制数之和也是全“1”,就认为传输过程中没有出差错。许多链路层协议都提供错误检查,包括流行的以32位07|815|1623|2431源端端口(SourcePort)检查和(Checksum)用户数据包的长度(Length)目的地端口(DestinationPort)数据(Date)……Word10110011001100110Word2Word3Sum=Word1+Word2+Word3检查和(sum的反码)0101010101010101000011110000111111001010110010100011010100110101太网协议,读者也许想知道为什么UDP也要提供检查和。其原因是链路层以下的协议在源端和终端之间的某些通道可能不提供错误检测。虽然UDP提供有错误检测,但检测到错误时,UDP不做错误校正,只是简单地把损坏的消息段扔掉,或者给应用程序提供警告信息。2.4UDP的伪首部UDP校验和覆盖的内容超出了UDP数据报本身的范围。为了计算校验和,UDP把伪首部引入数据报中,在伪首部中有一个值为0的填充八位组用于保证整个数据报的长度为16比特的整数倍,这样才好计算校验和。填充八位组和伪首部并不随着UDP数据报一起传输,也不计算在数据报长度之内。为了计算校验和,要先把校验和字段置为0,然后对整个对象,包括伪首部、UDP的首部和用户数据报,计算一个16比特的二进制反码和。使用伪首部的目的是检验UDP数据报已到达正确的目的地。理解伪首部的关键在于认识到:正确的目的地包括了特定的主机和机器上特定的协议端口。UDP报文的首部仅仅指定了使用的协议端口号。因此为了确保数据报能够正确到达目的地,发送UDP数据报的机器在计算校验和时把目的机的IP地址和应有的数据都包括在内。在最终的接收端,UDP协议软件对校验和进行检验时要用到携带UDP报文的IP数据报首部中的lP地址。如果校验和正确,说明UDP数据报到达了正确主机的正确端口。在UDP校验和的计算过程中用到的伪首部长度为12个八位组,其结构如下图所示。伪首部的源IP地址字段和目的IP地址字段记录了发送UDP报文时使用的源IP地址和目的IP地址。协议字段指明了所使用的协议类型代码(UDP是17),而长度字段是UDP数据报的长度。接收方进行正确性验证的时候,必须要把这些字段的信息从IP报文的首部中抽取出来,以伪首部的格式进行装配,然后再重新计算校验和。081631源IP地址目的IP地址0协议UDP长度2.5UDP的封装与协议的分层在交给IP层之前,UDP给用户要发送的数据加上一个首部。IP层又给从UDP接收到的数据报加上一个首部。最后,网络接口层把数据报封装到一个帧里,再进行机器之间的传送。如图所示。帧的结构根据底层的网络技术来确定。通常网络帧结构包括一个附加的首部。在接收端,最底层的网络软件接收到一个分组后把它提交给上一层模块。每一层都在向上送交数据之前剥去本层的首部,因此当最高层的协议软件把数据送到相应的接收进程的时候,所有附加的首部都被剥去了。也就是说,最外层的首部对应的是最底层的协议,而最内层的首部对应的是最高层的协议。研究首部的生成与剥除时,可从协议的分层原则得到启发。当把分层原则具体的应用于UDP协议时,可以清楚地知道目的机上的由IP层送交UDP层的数据报就等同于发送机上的UDP层交给IP层的数据报。同样,接收方的UDP层上交给用户进程的数掘也就是发送方的用户进程送到UDP层的数据。在多层协议之间,职责的划分是清楚而明确的,IP层只负责在互联网上的一对主机之间进行数据传输,而UDP层只负责区分一台主机上的多个源端口或目的端口。2.6层次的划分及UDP校验和的计算分层原则与UDP校验和的计算过程看来存在一定的冲突。UDP校验和覆盖了一个伪首部,而这个伪首部中包括了源IP地址和FI的IP地址。一般情况下,可以认为进行发送的用户必须知道目的IP地址,在发送数据时把目的IP地址告诉了UDP层,这样UDP层就可以直接得知目的IP地址,而不必到IP层寻找。但是,源IP地址要根据IP层对路由的选择而定,因为源IP地址会表示出数据报传输时所经过的网络接口。因此,如果不与IP层进行交互,UDP层是无法得知源IP地址的。假定UDP软件要求IP层提供源IP地址和目的IP地址,再用这些信启、去生成伪首部,计算校验和,丢弃伪首部,并将UDP数掘报交给IP层传UDP首部UDP数据区IP首部IP数据区帧首部帧的数据区输。一种可选的提高软件效率的方法是让UDP层把UDP数据报封装到一个IP数据报中,从IP层获取源地址,把源地址和目的地址填到数据报首部中的相应字段中,再计算UDP校验和,最后把这个IP数据报交给IP层,而IP层只需要填充IP报文首部中的其余字段。UDP和IP这样密切的交互操破坏了各层的功能独立性,明显是一种对严格的层次结构的折衷,完全是出于实际需要。之所以忽略违反分层结构的情况,是因为几乎不可能在不指定目的机的前提下识别目的应用程序,而且我们希望对UDP所使用的地址和IP所使用的地址进行有效的映射。2.7UDP的多路复用、多路分解和端口协议各层的软件都要对相邻层的多个对象进行多路复用和多路分解操作。UDP软件接收多个应用程序送来的数据报,把它们送给IP层进行传输,同时它接收从IP层送来的UDP数据报,并把它们送给适当的应用程序。UDP软件与应用程序之间所有的多路复用和多路分解都要通过端口机制来实现。实际上,每个应用程序在发送数据报之前必须与操作系统进行协商,以获得协议端口和相应的端口号。当指定了端口之后,凡是利用这个端口发送数据报的应用程序都要把端口号放入UDP报文的源端口字段中。在处理输入时,UDP从IP层软件接收了传入的数据报,根据UDP的目的端口号进行多路分解操作,如下图。理解UDP端的最简单的方式是把它看成是一个队列。在大多数实现中,当应用程序与操作系统协商,试图使用某个给定端口时,操作系统就创建一个内部队列来容纳收到的报文。通常应用程序可以指定和修改这个队列的长度。当UDP收到数据报时,先检查当前使用的端口是否就是该数据报的目的端口。如果不能匹配,则发送一个ICMP端口不可达报文并丢弃这个数据报。如果匹配,它就把这个数据报送到相应的队列中,等待应用程序的访问。当然,如果端口已满也会出错,UDP也要丢弃传入的这个数据报。2.8UDP协议端口号的分配如何分配协议端口号这个问题很重要,因为两台计算机之间在交互操作之前必须确认一个端口号,才能保证数据报在两个进程间正常传输。端13分配有两种基本方式。一种是使用中央管理机构。大家都同意让一个管理机构根据需