实验二利用Wireshark分析协议HTTP一、实验目的分析HTTP协议二、实验环境与因特网连接的计算机,操作系统为Windows,安装有Wireshark、IE等软件。三、实验步骤1、利用Wireshark俘获HTTP分组(1)在进行跟踪之前,我们首先清空Web浏览器的高速缓存来确保Web网页是从网络中获取的,而不是从高速缓冲中取得的。打开浏览器,找到Internet选项,点击后出现如图1所示的界面。以IE浏览器为例,步骤为:点击浏览器右上角的“工具”-“Internet选项”。图1Internet选项之后,还要在客户端清空DNS高速缓存,以确保Web服务器域名到IP地址的映射是从网络中请求的。在Windows系列的机器上,可在命令提示行输入ipconfig/flushdns完成操作(如图2所示);具体步骤及Linux、MAC等系统的清空方法请参见:。图2命令提示行输入ipconfig/flushdns完成操作(2)启动Wireshark分组俘获器。(3)在Web浏览器中输入:(重庆大学网站)。(4)停止分组俘获。图3利用Wireshark俘获的HTTP分组在URL中,服务器的主机名。最前面有两个DNS分组。第一个分组是将主机名地址的请求,第二个分组包含了转换的结果。这个转换是必要的,因为网络层协议——IP协议,是通过点分十进制来表示因特网主机的,而不是通过这样的主机名。当输入URL时,将要求Web服务器从主机上请求数据,但首先Web浏览器必须确定这个主机的IP地址。小提示--域名和主机关系举例:域名cnwg.cn下,有主机server1和server2,其主机全名就是server1.cnwg.cn和server2.cnwg.cn。随着转换的完成,Web浏览器与Web服务器建立一个TCP连接。最后,Web浏览器使用已建立好的TCP连接来发送请求“GET/HTTP/1.1”。这个分组描述了要求的行为(“GET”)及文件(只写“/”是因为我们没有指定额外的文件名),还有所用到的协议的版本(“HTTP/1.1”)。2、HTTPGET/response交互(1)在协议框中,选择“GET/HTTP/1.1”所在的分组会看到这个基本请求行后跟随着一系列额外的请求首部。在首部后的“\r\n”表示一个回车和换行,以此将该首部与下一个首部隔开。“Host”首部在HTTP1.1版本中是必须的,它描述了URL中机器的主机,本例中是。这就允许了一个Web服务器在同一时间支持许多不同的主机名。User-Agent首部描述了提出请求的Web浏览器及客户机器(有彩蛋哟,自己找)。接下来是一系列的Accept首部,包括Accept(接受)、Accept-Language(接受语言)、Accept-Encoding(接受编码)、Accept-Charset(接受字符集)。它们告诉Web服务器客户Web浏览器准备处理的数据类型。Web服务器可以将数据转变为不同的语言和格式。Keep-Alive及Connection首部描述了有关TCP连接的信息,通过此连接发送HTTP请求和响应。它表明在发送请求之后连接是否保持活动状态及保持多久。大多数HTTP1.1连接是持久的(persistent),意思是在每次请求后不关闭TCP连接,而是保持该连接以接受从同一台服务器发来的多个请求。(2)我们已经分析了由Web浏览器发送的请求,现在我们来观察Web服务器的回答。响应首先发送“HTTP/1.1200ok”,指明它开始使用HTTP1.1版本来发送网页。同样,在响应分组中,它后面也跟随着一些首部。最后,被请求的实际数据被发送。第一个Cache-control首部,用于描述是否将数据的副本存储或高速缓存起来,以便将来引用。一般个人的Web浏览器会高速缓存一些本机最近访问过的网页,随后对同一页面再次进行访问时,如果该网页仍存储于高速缓存中,则不再向服务器请求数据。类似地,在同一个网络中的计算机可以共享一些存在高速缓存中的页面,防止多个用户通过到其他网路的低速网路连接从网上获取相同的数据。这样的高速缓存被称为代理高速缓存(proxycache)。在我们所俘获的分组中我们看到“Cache-control”首部值是“private”的。这表明服务器已经对这个用户产生了一个个性化的响应,而且可以被存储在本地的高速缓存中,但不是共享的高速缓存代理。在HTTP请求中,Web服务器列出内容类型及可接受的内容编码。此例中Web服务器选择发送内容的类型是text/html且内容编码是gzip。这表明数据部分是压缩了的HTML。服务器描述了一些关于自身的信息。此例中响应分组还用Content-Length首部描述了数据的长度。最后,服务器还在Date首部中列出了数据发送的日期和时间。根据俘获窗口内容,回答“四、实验报告内容”中的1-6题。3、HTTP条件GET/response交互(1)启动浏览器,清空浏览器的缓存。(2)启动Wireshark分组俘获器,开始Wireshark分组俘获。(3)在浏览器地址栏中如下网址:你的浏览器中将显示一个的非常简单的HTML文件。(4)在你的浏览器中重新输入相同的URL或单击浏览器中的“刷新”按钮。(5)停止Wireshark分组俘获,在显示过滤筛选说明处输入“http”,分组列表子窗口中将只显示所俘获到的HTTP报文。根据操作回答“四、实验报告内容”中的7-10题。如果抓到的包太多,不好分析,可以在过滤处输入http.request.uricontainswireshark,“wireshark”可以换成想查的网址中的词,就可以把想要的内容过滤出来。Wireshark过滤语法总结附后。4、获取长文件(1)启动浏览器,将浏览器的缓存清空。(2)启动Wireshark分组俘获器,开始Wireshark分组俘获。(3)在浏览器地址栏中输入如下网址:(注:此抓包网址和第3部分不一样)浏览器将显示一个相当大的美国权力法案。(4)停止Wireshark分组俘获,在显示过滤筛选说明处输入“http”,分组列表子窗口中将只显示所俘获到的HTTP报文。根据操作回答“四、实验报告内容”中的11-14题。5、嵌有对象的HTML文档(1)启动浏览器,将浏览器的缓存清空。(2)启动Wireshark分组俘获器。开始Wireshark分组俘获。(3)在浏览器地址栏中输入如下网址:(注:此抓包网址和第4部分不一样)浏览器将显示一个具有两个图片的短HTTP文件。(4)停止Wireshark分组俘获,在显示过滤筛选说明处输入“http”,分组列表子窗口中将只显示所俘获到的HTTP报文。根据操作回答“四、实验报告内容”中的15-16题。6、HTTP认证(1)启动浏览器,将浏览器的缓存清空。(2)启动Wireshark分组俘获器。开始Wireshark分组俘获。(3)在浏览器地址栏中输入如下网址:浏览器将显示一个HTTP文件,输入所需要的用户名和密码(用户名:wireshark-students,密码:network)。(4)停止Wireshark分组俘获,在显示过滤筛选说明处输入“http”,分组列表子窗口中将只显示所俘获到的HTTP报文。根据操作回答“四、实验报告内容”中的17-18题。四、实验报告内容在实验的基础上,回答以下问题:(1)你的浏览器运行的是HTTP1.0,还是HTTP1.1?你所访问的服务器所运行的HTTP版本号是多少?参考答案:浏览器运行的是HTTP1.1访问的服务器运行的是HTTP1.1(2)你的浏览器向服务器指出它能接收何种语言版本的对象?参考答案:接收简体中文(3)你的计算机的IP地址是多少?服务器的IP地址是多少?参考答案:我的计算机IP:10.249.130.20//Source服务器的IP:202.202.1.13//Destination(4)从服务器向你的浏览器返回的状态代码是多少?参考答案:200OK(5)你从服务器上所获取的HTML文件的最后修改时间是多少?参考答案:2012年9月13日03:169:17GMT注意:大部分有Last-Modified,少量没有,可以找个有的进行截图。(6)返回到你的浏览器的内容一共多少字节?参考答案:3373字节(7)分析你的浏览器向服务器发出的第一个HTTPGET请求的内容,在该请求报文中,是否有一行是:IF-MODIFIED-SINCE?参考答案:没有(8)分析服务器响应报文的内容,服务器是否明确返回了文件的内容?如何获知?是的,在Line-basedtextdata中显示。(9)分析你的浏览器向服务器发出的第二个“HTTPGET”请求,在该请求报文中是否有一行是:IF-MODIFIED-SINCE?如果有,在该首部行后面跟着的信息是什么?(注意Last-Modified与If-Modified-Since的区别)有,该信息指的是页面的最后修改时间(10)服务器对第二个HTTPGET请求的响应中的HTTP状态代码是多少?服务器是否明确返回了文件的内容?请解释。状态码:304.服务器没有明确返回文件内容。因为返回304状态码,意思是不返回文件内容。具体原因:浏览器端缓存页面最后修改时间与服务器端时间一致,返回304状态码,客户端接到之后,就直接把本地缓存文件显示到浏览器中。(11)你的浏览器一共发出了多少个HTTPGET请求?参考答案:一个(12)承载这一个HTTP响应报文一共需要多少个data-containingTCP报文段?需要四个data-containingTCP报文段。(13)与这个HTTPGET请求相对应的响应报文的状态代码和状态短语是什么?参考答案:200OK(14)在被传送的数据中一共有多少个HTTP状态行与TCP-induced“continuation”有关?参考答案:一个,注意,虽然有四个data-containingTCP报文段,但只有这一个状态行与他们相关。(15)你的浏览器一共发出了多少个和打开的网址相关的HTTPGET请求?这些请求被发送到的目的地的IP地址是多少?参考答案:五个HTTPGET请求。目的地址分别是128.119.240.90、128.119.240.90、165.193.140.14、119.84.68.157、128.119.240.90(可能不同版本、不同情况下抓出来的不一样,根据实际情况分析)(16)浏览器在下载这两个图片时,是串行下载还是并行下载?请解释。参考答案:并行,因为两个图片是连续请求,不需要等第一个请求得到回复后才继续第二次请求。有时候不同网络环境下,可能抓到的包是在对应请求得到回应后才继续第二次的请求,有时候是不需要等第一个请求得到回复后才继续第二次请求。可以多抓几次试试。只有存在不需要等第一个请求得到回复后才继续第二次请求的情况,就说明是并行的。(17)对于浏览器发出的最初的HTTPGET请求,服务器的响应是什么(状态代码和状态短语