第5章网上信息浏览——服务,掌握服务的基本概念和基础理论,掌握服务器的配置方法。本章学习目标:l(WorldWideWeb,万维网)是由位于日内瓦的欧洲原子核研究委员会CERN(该组织的法文缩写)于1989年提出的,其最初的目的是使分散在不同国家的物理学家能方便地进行交换研究报告、图形、图片、资料等协同工作。1991年上出现即引起人们的强烈反响,并迅速获得推广应用。上最受欢迎的应用之一,同时,它的出现也极大地推动了Internet的推广。1.的特点可以归纳为:⑴Web是以超文本和多媒体形式存在的网络信息空间。⑵Web与平台无关。⑶Web提供图形化的和易于导航的(navigate)图形界面。⑷Web是分布式的。⑸Web是动态的、交互的。Web的本质是一个建立在Internet基础上的超文本信息传输系统。Web服务器、Web浏览器、服务器与浏览器之间的通信协议HTTP、Web文档语言HTML以及用来标识Web资源的URL这五大要素构成了Web的体系结构。2.超级链接和超文本所谓超文本是文本与检索项共存的一种文件表示,即在超文本中已实现了相关信息链接。超文本具有的链接能力可层层连接相关文件,所以把这种具有超级链接能力的操作称为超级链接(Hyperlink)。所谓超级链接就是一个多媒体文档中存在着指向相关文档的指针,通常是一些特殊的文字或图片、图形等,用鼠标单击这些文字和图形时,会从一个文本跳到另一个文本。这种具有超链接功能的多媒体文档称为“超媒体”。5.1.2Web服务器与浏览器1.Web服务器Web服务器是指驻留于Internet上某种类型计算机的程序。Web服务器不仅能够存储信息,还能在用户通过Web浏览器提供的信息的基础上运行脚本和程序。用于执行这些功能的程序或脚本称为网关脚本/程序,或称为CGI(通用网关界面)脚本。在Web上的大多数表单和搜索引擎上都使用了该技术。2.浏览器浏览器(Browser)是访问Web的客户端软件,它是一个交互程序,允许用户从上查看信息。浏览器把在互联网上找到的文本文档(和其它类型的文件)翻译成网页。浏览器是Internet用户与Web服务器进行通讯的软件,也是展示Internet丰富多彩的内容的窗口。比较典型的浏览器软件有Netscape的Navigator、NCSA的Mosaic、Microsoft的Explorer等。3.B/S模式B/S(Browser/Server)模式是一种特殊的C/S结构,它简化了客户机的管理和使用,方便了用户。以浏览器为客户端,客户端不再需要编程,将系统的业务逻辑完全封装在服务器上,大大减轻了软件的开发及维护费用,减少了由于系统升级而带来的客户端更新代价,解决了C/S模式发展的一大障碍。Web服务器的任务是等待客户机的连接,听取客户机的请求并为这些请求提供服务。图5.1描述了Web浏览器从Web服务器获得Web文档的过程。Web浏览器Web服务器浏览器与服务器连接Web浏览器Web服务器浏览器请求一个文档Web浏览器Web服务器服务器将请求的文档传回Web浏览器Web服务器浏览器关闭与服务器的连接Web浏览器Web服务器浏览器显示文档图5.1浏览器从Web服务器获得Web文档5.1.3统一资源定位符URL(UniformResourceLocator:统一资源定位器)是Web的基本工具之一,是HTML文件地址命名方法。URL是页的地址,Web上每个文档都有一个惟一的URL。浏览时,只需在浏览器的地址栏输入URL地址,就可以找到相应的网页。URL地址的格式为:协议://服务器主机名(可以是域名,也可以是IP地址)[:端口号]/目录名/…/html文件名它从左到右由下述部分组成:Internet信息资源协议:服务器地址(host):端口(port):路径(path):使用中,常以下列方式输入URL地址:⑴标准的地址:域名+目录+文件名称以标准的地址格式书写,例如输入。⑵只有“域名+目录”的地址如果浏览器要查询的是目录,则Web服务器会判断这个目录是否含有默认文件,如果有,会将默认文件传给浏览器,没有则把目录的文件列表传给浏览器。例如和,test的子目录下放置有默认文件index.html,uploads目录下未放置默认文件。在浏览器地址框里输入第一个网址,一旦连接成功,服务器便把默认文件传回到浏览器端,最后解释执行该文件(如图5.2所示);输入第二个网址,返回的则是该目录下的文件列表(如图5.3所示)。如果服务器端不允许浏览器访问文件目录,浏览器端将会显示提示信息“不允许访问文件列表”,表明服务器端的一些设置要求必须明确指定要下载的具体文件名,如果浏览器没有找到要找的文件,则不允许下载其他文件或子目录。图5.2test的子目录下放置有默认文件图5.3uploads目录下未放置默认文件(3)只有域名的地址有时用户输入如这样的地址信息,它等于,表示+目录“/”。服务器将服务器根目录下的默认下载文件传给回到浏览器端。(4)含有程序的地址如果浏览器要下载的是扩展名为ASP或CGI的脚本程序,那么Web服务器会自动启动解释程序,然后把程序执行的结果传回给浏览器。5.2.1网络信息特点随着网络技术、信息技术以及数据库技术的发展,Internet上的信息呈爆炸式发展。由于Internet的开放性,网络信息资源呈现出与传统信息资源不同的特性。1.动态性2.数字化3.无限性4.无序性5.自主性5.2网络信息检索5.2.2搜索引擎搜索引擎(searchengines)是对互联网上的信息资源进行搜集整理,然后供用户查询的系统。它是Internet上专门提供查询服务的一类网站,这些网站通过网络搜索软件(又称为网络搜索机器人)或网站登录等方式,将Internet上大量网站的页面收集到本地,经过加工处理而建库,从而能够对用户提出的各种查询做出响应,提供用户所需的信息。搜索引擎具有对网络资源进行采集、标引并提供检索的功能。其基本结构如图5.4所示。浏览器Gopher站点InternetFTP站点web服务器数据采集数据组织数据检索索引数据库搜索引擎图5.4搜索引擎基本结构1.常见中文搜索引擎其中比较有代表性的中文搜索引擎有:lGoogle搜索引擎()l百度(baidu)中文搜索引擎()l北大天网中英文搜索引擎()l新浪搜索引擎()l雅虎中国搜索引擎()l搜狐搜索引擎()l网易搜索引擎()l3721网络实名/智能搜索()1.任务一掌握Google搜索引擎的使用方法Google搜索引擎Google并非只使用关键词或代理搜索技术,它将自身建立在高级的PageRank™(网页级别)技术基础之上。这项技术可确保始终将最重要的搜索结果首先呈现给用户。⑴基本使用方法启动IE浏览器,在地址框中输入Google网址,按下回车键后,出现Google搜索引擎的主页。图5.5Google搜索引擎主页⑵Google搜索技巧①基本语法Google对通配符支持有限。它目前只可以用“*”来替代单个字符,而且包含“*”必须用引起来。Google对英文字符大小写不敏感。Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。②搜索结果不包含某些特定信息Google用减号“-”表示逻辑“非”操作。“A–B”表示搜索包含A但没有B的网页。③搜索结果至少包含多个关键字中的任意一个Google搜索引擎最基本的语法“与”“非”和“或”分别用“”(空格)、“-”和“OR”表示。用户缩小搜索范围,迅速找到目的资讯的一般方法是:目标信息一定含有的关键字(用“”连起来),目标信息不能含有的关键字(用“-”去掉),目标信息可能含有的关键字(用“OR”连起来),并行搜索。④相关检索输入一个简单词语搜索时,Google搜索引擎会提供“相关搜索”作为参考。单击任何一个相关搜索词,即可得到那个相关搜索词的搜索结果。当搜索“搜索引擎”时,搜索页面下方列出多个相关搜索主题,用户可以参考相关的主题进行二次搜索。⑤网页快照和类似网页Google在访问网站时,会将访问过的网页复制一份网页快照,以备在找不到原来的网页时使用。⑥对搜索的网站进行限制“site”表示搜索结果局限于某个具体网站或者网站频道,如搜索中文教育科研网站(edu.cn)上关于搜索引擎技巧的页面所输入的关键字为:“搜索引擎site:edu.cn”。⑦在某一类文件中查找信息“filetype:”是Google开发的非常强大实用的一个搜索语法。Google能对某些二进制文档进行检索,如搜索与实验报告相关的Word文档,输入的关键字为:“实验报告filetype:doc”。⑧搜索的关键字包含在网页标题中如搜索与Google相关的网页,输入的关键字为:“intitle:Google”⑨图片搜索Google首页点击“图片”链接就进入了Google的图片搜索界面“images.Google.com”。2.常见西文搜索引擎⑴AltaVista网址:⑵Excite网址:⑶Infoseek网址:()⑷Yahoo!网址:⑸AOL网址:⑹Lycos网址:⑺HotBot网址:服务器提供的目录列表以及向用户提供文件信息的查询服务。常见的FTP搜索引擎有:号称全球最大的FTP搜索引擎搜索引擎北大天网中英文FTP搜索引擎南京理工“一网打尽”搜索引擎南京理工“轻松搜之”搜索引擎百合谷搜索清华ZIXIA搜索幻想FTP搜索西安交大思源搜索5.2.3多元搜索引擎1.多元搜索引擎的概念多元搜索引擎,也叫元搜索引擎、集合式搜索引擎。它是将多个搜索引擎集成在一起,并提供一个统一的检索界面。可分为两种类型:⑴搜索引擎目录:⑵多元搜索引擎:2.常用多元搜索引擎介绍⑴搜索引擎目录All-in-