SMTP协议分析第1章SMTP概述1.1SMTP在邮件通信中的位置SMTP,即简单邮件传送协议,所对应RFC文档为RFC821。同http等多数应用层协议一样,它工作在C/S模式下,用来实现因特网上的邮件传送。SMTP在整个电子邮件通信中所处的位置如图1所示。图1电子邮件的通信过程可以看出,SMTP是用来将客户机上的邮件传送到服务器上。这里的客户机是指某次连接中的发送方,服务器是指相应的接收方。在讲解发送邮件的整个通信过程前,先解释一下面几个术语。1.2几个术语1.2.1.邮件邮件是一种消息的格式,由信封、首部和正文组成。信封上最重要的是收信人的地址。邮件服务器用这个地址将邮件发送到收信人所在的邮件服务器上。首部是由用户代理或邮件服务器添加的一些信息。包括Received、Message-ID、From、Data、Reply-To、X-Phone、X-Mailer、To和Subject等字段。正文是是发送用户发给接收用户报文的内容。RFC822规定正文为NVTASCII文字行。更为详细的说明,请参考RFC821和RFC822等协议。1.2.2.用户代理用户代理UA(UserAgent)是用户与电子邮件系统的交互接口,一般来说它就是我们PC机上的一个程序。Windows上常见的用户代理是Foxmail和OutlookExpress。用户代理提供一个好的用户界面,它提取用户在其界面填写的各项信息,生成一封符合SMTP等邮件标准的邮件,然后采用SMTP协议将邮件发送到发送端邮件服务器。1.2.3.邮件服务器邮件服务器是电子邮件系统的核心,它用来发送和接收邮件。邮件服务器不同于普通PC的是它几乎是全天工作的,所以它可以在任何时候为用户提供服务,后面将提到这正是为什么需要邮件服务器的一个重要原因。很多ISP都提供免费的邮件服务器,如126提供smtp.126.com邮件服务器。邮件服务器向其它邮件服务器转发邮件也是采用SMTP协议。1.3邮件的收发过程一般情况下,一封邮件的发送和接收过程如下。1)发信人在用户代理里编辑邮件,包括填写发信人邮箱、收信人邮箱和邮件标题等等。2)用户代理提取发信人编辑的信息,生成一封符合邮件格式标准(RFC822)的邮件。3)用户代理用SMTP将邮件发送到发送端邮件服务器(即发信人邮箱所对应的邮件服务器)。4)发送端邮件服务器用SMTP将邮件发送到接收端邮件服务器(即收信人邮箱所对应的邮件服务器)。5)收信人调用用户代理。用户代理用POP3协议从接收端邮件服务器取回邮件。6)用户代理解析收到的邮件,以适当的形式呈现在收信人面前。第2章.SMTP详解2.1.通信过程一个具体的SMTP通信(如发送端邮件服务器与接收端服务器的通信)的过程如下。1)发送端邮件服务器(以下简称客户端)与接收端邮件服务器(以下简称服务器)的25号端口建立TCP连接。2)客户端向服务器发送各种命令,来请求各种服务(如认证、指定发送人和接收人)。3)服务器解析用户的命令,做出相应动作并返回给客户端一个响应。4)2)和3)交替进行,直到所有邮件都发送完或两者的连接被意外中断。从这个过程看出,命令和响应是SMTP协议的重点,下面将予以重点讲述。2.2.命令和响应2.2.1.格式SMTP的命令不多(14个),它的一般形式是:COMMAND[Parameter]CRLF。其中COMMAND是ASCII形式的命令名,Parameter是相应的命令参数,CRLF是回车换行符(0DH,0AH)。SMTP的响应也不复杂,它的一般形式是:XXXReadableIllustration。XXX是三位十进制数;ReadableIllustration是可读的解释说明,用来表明命令是否成功等。XXX具有如下的规律:以2开头的表示成功,以4和5开头的表示失败,以3开头的表示未完成(进行中)。2.2.2.一个例子命令和响应的格式是语法,各命令和响应的意思则是语义,各命令和各响应在时间上的关系则是同步。下面将通过一个简单的SMTP通信过程来说明协议的这三个要素。C:telnetsmtp.126.com25/*以telnet方式连接126邮件服务器*/S:220126.comAnti-spamGTforCoremailSystem(126com[071018])/*220为响应数字,其后的为欢迎信息,会应服务器不同而不同*/C:HELOsmtp.126.com/*HELO后用来填写返回域名(具体含义请参阅RFC821),但该命令并不检查后面的参数*/S:250OKC:MAILFROM:bripengandre@126.com/*发送者邮箱*/S:250…./*“…”代表省略了一些可读信息*/C:RCPTTO:bripengandre@smail.hust.edu.cn/*接收者邮箱*/S:250…./*“…”代表省略了一些可读信息*/C:DATA/*请求发送数据*/S:354Entermail,endwith.onalinebyitselfC:EnjoyProtocolStudingC:.S:250MessagesentC:QUIT/*退出连接*/S:221Bye分析上面的过程可参考注释进行,这里要补充如下几点。1)“C:”开头的行(不包括C:)是客户端的输入,而以“S:”开头的行(不包括S:)则是服务器的输出。2)上述的命令并不一定会一次性成功,服务器会返回错误响应,客户端应该按照协议规定的时序,来输入后续的命令(或重复执行失败的命令,或重置会话,或退出会话等等)。2.2.3.常用命令SMTP命令不区分大小写,但参数区分大小写,有关这方面的详细说明请参考RFC821。常用的命令如下。HELOdomainCRLF。向服务器标识用户身份发送者能欺骗,说谎,但一般情况下服务器都能检测到。MAILFROM:reverse-pathCRLF。reverse-path为发送者地址,此命令用来初始化邮件传输,即用来对所有的状态和缓冲区进行初始化。RCPTTO:forward-pathCRLF。forward-path用来标志邮件接收者的地址,常用在MAILFROM后,可以有多个RCPTTO。DATACRLF。将之后的数据作为数据发送,以CRLF.CRLF标志数据的结尾。RESTCRLF。重置会话,当前传输被取消。NOOPCRLF。要求服务器返回OK应答,一般用作测试。QUITCRLF。结束会话。VRFYstringCRLF。验证指定的邮箱是否存在,由于安全方面的原因,服务器大多禁止此命令。EXPNstringCRLF。验证给定的邮箱列表是否存在,由于安全方面的原因,服务器大多禁止此命令。HELPCRLF。查询服务器支持什么命令。2.2.4.常用响应常用的响应如下所示,数字后的说明是从英文译过来的。更详细的说明请参考RFC821。501参数格式错误502命令不可实现503错误的命令序列504命令参数不可实现211系统状态或系统帮助响应214帮助信息220<domain>服务就绪221<domain>服务关闭421<domain>服务未就绪,关闭传输信道250要求的邮件操作完成251用户非本地,将转发向<forward-path>450要求的邮件操作未完成,邮箱不可用550要求的邮件操作未完成,邮箱不可用451放弃要求的操作;处理过程中出错551用户非本地,请尝试<forward-path>452系统存储不足,要求的操作未执行552过量的存储分配,要求的操作未执行553邮箱名不可用,要求的操作未执行354开始邮件输入,以.结束554操作失败第3章.SMTP的扩充3.1.SMTP的缺点从2.2.2的例子可以看出,SMTP至少还有如下缺点。1)命令过于简单,没提供认证等功能。2)只传送7位的ASCII码,不能传送二进制文件。针对缺点1),标准化组织制定了扩充的SMTP(即ESMTP),对应的RFC文档为RFC1425。针对缺点2),标准化组织在兼容SMTP的前提下,提出了传送非7位ASCII码的方法,对应的RFC文档有两个:邮件首部的扩充对应于RFC1522,邮件正文的扩充对应与RFC1521(即MIME)。3.2.ESMTPESMTP最显著的地方是添加了用户认证功能。如果用户想使用ESMTP提供的新命令,则在初次与服务器交互时,发送的命令应该是EHLO而不是HELO。先来看一个例子。C:telnetsmtp.126.com25/*以telnet方式连接126邮件服务器*/S:220126.comAnti-spamGTforCoremailSystem(126com[071018])/*220为响应数字,其后的为欢迎信息,会应服务器不同而不同*/C:EHLOsmtp.126.com/*除了HELO所具有的功能外,EHLO主要用来查询服务器支持的扩充功能*/S:250-mailS:250-AUTHLOGINPLAINS:250-AUTH=LOGINPLAINS:2508BITMIME/*最后一个响应数字应答码之后跟的是一个空格,而不是'-'*/C:AUTHLOGIN/*请求认证*/S:334dxNlcm5hbWU6/*服务器的响应——经过base64编码了的“Username”*/C:Y29zdGFAYW1heGl0Lm5ldA==/*发送经过BASE64编码了的用户名*/S:334UGFzc3dvcmQ6/*经过BASE64编码了的Password:*/C:MTk4MjIxNA==/*客户端发送的经过BASE64编码了的密码*/S:235authsuccessfully/*认证成功*/C:MAILFROM:bripengandre@126.com/*发送者邮箱*/S:250…./*“…”代表省略了一些可读信息*/C:RCPTTO:bripengandre@smail.hust.edu.cn/*接收者邮箱*/S:250…./*“…”代表省略了一些可读信息*/C:DATA/*请求发送数据*/S:354Entermail,endwith.onalinebyitselfC:EnjoyProtocolStudingC:.S:250MessagesentC:QUIT/*退出连接*/S:221Bye对于这个例子有如下几点说明。1)只是一个示意性的过程,再输入用户名、密码时需采用base64编码,这需要专门的计算,所以在telnet终端上模拟比较麻烦。2)认证过程有很多种,有基于明文的认证,也有基于MD5加密的认证,这里给出的只是一个示意性的过程。3)EHLO对于具体服务器,响应会不同,关键字“8BITMIME”用来说明服务器是否支持正文中传送8位ASCII码,而以“X”开头的关键字都是指服务器自定义的扩充(还没纳入RFC标准)更详细的说明,请参看RFC1425。3.3.邮件首部的扩充首部通过两种编码方式来支持传送非7位ASCII码。它首先通过一个如下格式的编码字来表明所用的编码方式。=?charset?encoding?encoded-text?textcharset是字符集规范。有效值是两个字符串us-ascii和iso-8859-x,其中x是一个单个数字,例如iso-8859-1中的数字为“1”。encoding是一个单个字符用来指定编码方法,支持两个值。Q代表quoted-printable(可打印)编码。任何要发送的字符若其第8比特置1则被作为3个字符发送:第1个是字符是“=”,后面的两个字符对应于字符的十六进制表示。例如对于二进制码11111111,其对应的十六进制表示为“FF”,所以对应的编码位“=FF”。为了能够传输“=”,“=”的编码方式与第8比特置1的字符相同,因为其二进制代码为00111101,所以对应的编码为“=3D”。可以看出这种编码方式的开销达200%,所以只适合传送只含有少量非7位ASCII码的文本。B代表base64编码。它的编码方法是先将二进制代码划分为一个24bit长的单