第9章网络检索概述.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第9章网络信息检索概述目录•9.1网络信息资源的分布•9.1.1特点(自学)•9.1.2类型•9.1.3分布(自学)•9.2网络信息检索原理与方法•9.2.1原理•9.2.2方法目录•9.3网络信息检索相关标准•9.3.1Z39.50协议•9.3.2其他检索标准•9.4网络信息检索发展趋势•9.4.1技术发展•9.4.2服务发展•9.4.3检索标准发展9.1.2类型•1.按照网络信息资源的媒体形式分•2.按照人类交流方式划分•3.按照信息加工程度分•4.按照网络信息的内容和用途分•5.按照信息的表现形式分•6.按传输协议划分9.2.1原理•9.2.1.1网络信息检索及其特点从网络信息中查找与用户提问相关的信息的过程。是计算机检索的发展和延伸。是基于互联网的新型的信息检索方式。9.2.1原理•9.2.1.1网络信息检索及其特点对象丰富盲目查准率低简单方便空间扩展特点方法不统一9.2.1原理•9.2.1.2网络信息检索的原理通信结构:客户端/服务器结构。通常用的客户端工具:网络浏览器。具体过程:参见图9-1。采用的检索模型:布尔逻辑模型和向量空间模型。9.2.1原理•9.2.1.1网络信息检索及其特点用户界面网络客户端网络服务器网络服务器数据库数据库数据库数据库……9.2.2方法•1.直接浏览——Browse•2.利用网络资源目录网络资源目录有网络检索工具的分类目录和信息机构整理的导航型门户网站两种。门户网站:是信息资源管理人员在广泛收集网络资源并进行加工整理的基础上,按照某种主题分类体系编制的一种可供浏览的等级结构式目录。在每个类目及子类下提供相应的网络资源地址,并给以简要的描述。门户网站实例:国家科学数字图书馆图书情报学科信息门户:国家科学数字图书馆资源环境学科信息门户:CALIS重点学科导航库:方法•3.利用以关键词检索为主的SE•4.查询网络数据库•5.查询网上图书馆最常规和普遍的方法。SE是该方法的主要工具。获取学术性信息的最有效方法。联机公共检索目录OPAC信息机构工作人员整理的学科信息资源导航信息机构购买的各种商业数据库9.3.1Z39.50协议Z39.50协议全称:AmericanNationalStandardInformationRetrieval:ApplicationServiceDefinitionandProtocolSpecificationforOpenSystemInterconnection,译为“信息检索:开放系统互联的应用服务定义与协议说明。一种基于C/S体系结构下描述客户端检索服务器端上数据以及获得检索结果的数据结构与交互规则的协议。是网络中的应用层协议。9.3.1Z39.50协议•9.3.1.1概况20世纪70年代起源于LC、OCLC、研究图书馆信息网络等的书目数据库系统互联项目。1988年以版本1成为美国国家标准;1992年出现版本2,基于ISO/OSI标准的网络协议框架;1995年出现版本3,支持TCP/IP;现在正在进行版本4的制定。国际标准化组织(ISO)接受Z39.50作为国际标准,定名ISOZ3950,并为了与原有标准ISO10612/10613保持统一,定名为IS010162/10613SRVersion2。9.3.1Z39.50协议•9.3.1.1概况维护机构:目前是NISO(美国国家信息标准委员会)=499.3.1Z39.50协议•9.3.1.2内容及特点内容:(1)信息检索服务的定义,定义了信息检索服务的11种机制,包括了该协议支持的服务功能说明和服务参数说明。(2)Z39.50协议的规范,包括协议控制信息定义、信息交换规则和实现协议的必备的条件。9.3.1Z39.50协议•9.3.1.2内容及特点特点:(1)它与HTTP、Gopher不同等面向传输层的协议不同,它是基于会话层的协议,是有状态的。(2)它是一种开放网络平台上的应用层协议,利用它可以使不同计算机系统之间实现协同工作。(3)它支持分布式的客户端/服务器模式,但客户端向服务器提交一个检索请求时,服务器在一个或多个数据库中进行检索,并将记录返回给客户端。(4)它既可以采用同步方式,也可以采用异步方式进行通信。9.3.1Z39.50协议•9.3.1.3运行机制及实现模型当命令、检索方法各不相同的双方不能直接检索对方数据库时,则需要通过Z39.50为双方提供服务。基于Z39.50的协议把互联的双方称为请求方(客户端、源端)和服务方(服务器端、目的端)。源端和目的端之间的交互是在一个会话里进行的,称为Z-连接。源端发起Z-连接并在Z-连接种发起操作,目的端接受Z-连接并结束相应的操作。在一个Z-连接中,可能有多个连续的、并行的操作。但源端和目的端的地位不能互换。9.3.1Z39.50协议•9.3.1.3运行机制及实现模型Z39.50建立抽象数据库概念,使每个执行Z39.50标准的系统将抽象模型映射成自己专用的模型,或者反向转换。也就是说当源端向目的端提出服务请求时,要把本系统的检索命令转换成Z39.50标准格式,即使用基本编码规则1(ASN-1)中的规定,把信息编成Z39.50的应用协议数据单元(APDU,ApplicationProtocolDataUnit),然后发往服务方。服务方则相反,对APDU解码,转成自身系统的检索命令,再执行该命令。检索完成后按上述相反顺序把数据发回请求方,从而实现系统间的互联互访。9.3.1Z39.50协议•9.3.1.3运行机制及实现模型APDU一般采用ASN.1(抽象语法标记语言,AbstractSyntaxNotationOne)进行编码。ASN.1是描述抽象类型和值的标记。是IT行业很多应用程序和设备所使用的一种数据标准,可以使用它来标准化和理解各种平台中的数据。ADPU通过BER完成转换,形成与机器无关的字节流。OSI说明抽象对象的方法叫做抽象语法标记,而用0、1字符来表示这样的对象的规则集合叫做基本编码规则(BER)。BER描述了如何将ASN.1类型表示和编码成八位字节串。9.3.1Z39.50协议•9.3.1.3运行机制及实现模型用户界面转换客户端Z-server转换数据库数据集搜索检索结果检索检索结果数据库记录搜索Z39.50的应用系统结构示意图用户接口ZServerZClient读者编目员OPAC网关用户界面层编目客户端用户应用处理逻辑处理层通信协议层数据逻辑处理数据库Z39.50客户端Z39.50服务器数据层(注)OPAC:OnlinePublicAccessCatalog联机公共检索目录9.3.1Z39.50协议•9.3.1.4主要功能及其应用(1)初始化(Initialization):允许源端提出初始化参数值以建立连接,目的端对源端提出的参数值可以不接受或提出其他参数值替代之,源端必须接受,否则终止连接。这些参数值包括识别号、功能选择、选用信息容量、最大信息容量、连接结果(拒绝连接或接受连接)等。(2)查询(Search):源端可提出查询请求,此请求主要包括查询句及查询结果是否要传回的参数等。查询可以根据共同的格式传送,不同的查询形式有不同的语法,标准定义了下列6种查询形式,如Type-1。(3)检索(Retrieval):包含提交服务(PresentService)和分段服务(SegmentService)。源端可以提出提交请求,要求传送选择的记录。9.3.1Z39.50协议•9.3.1.4主要功能及其应用(4)删除结果集(Result-SetDelete):指源端可要求删除在连接期间保留在目的端的所有或部分结果集。(5)浏览(Browse):包含扫描服务(ScanService),客户端可请求服务器列出可供检索的词汇,如人名、题名等。(6)分类(Sort):指客户端可请求服务器就某字段(如题名、年代)或某条件将查询结果分类。(7)存取控制(Access-control):目的端在执行初始化、查询、提交或删除服务时,可以对来源端的权限等提出质疑,例如用户身份、密码等确认,源端必须予以回应,否则目的端可终止连接。9.3.1Z39.50协议•9.3.1.4主要功能及其应用(8)资源控制(ResourceControl):包含3个服务:资源控制服务(ResourceControlService)、触发资源控制服务(Trigger-resource-ControlService)、资源报告服务(Resource-reportService),当实际使用或预测使用的资源超过协议的范围,目的端会通知来源端,并获得源端的同意,目的端才可继续进行。(9)解释(Explain):Z39.50提供一个解释数据库让客户端查询,以了解服务器的相关信息,包括可供查询的数据库、检索点及错误信息等。9.3.1Z39.50协议•9.3.1.4主要功能及其应用(10)扩展服务(ExtendedServices):Z39.50提供一些附加的服务,主要包括没有正式规范在Z39.50协议内的其它服务,如客户端可以设定在服务器上被持续执行或被周期性执行的查询命令;客户端也可以向服务器端要求传送某份文件,另外也提供了维护数据库的功能,如更新数据库、插入或删除等。(11)终止(Termination):终止服务允许源端或目的端作下列两种终止:·源端或目的端可在任何时间送出或接受信息检索放弃要求,并终止连接;·源端在受到开始、查询、提交或删除回应后,可提出检索解除要求,等收到目的端的检索解除回应后终止连接。9.3.1Z39.50协议•9.3.1.4主要功能及其应用应用:(1)自动化系统编目模块:编目客户端在底层实现了ZClient,服务器则实现了ZServer,如SIRSI、汇文、ILAS等系统。编目人员可以使用编目客户端访问外部的数据源并下载保存到本地编辑,本系统内的编目数据可以通过服务器端向外界提供标准的访问接口。9.3.1Z39.50协议•9.3.1.4主要功能及其应用应用:(1)自动化系统自动化系统的OPAC模块:实现了ZClient功能的OPAC模块把用户在Web上的请求转化为Z39.50的检索请求后,发送到自动化系统的ZServer,ZServer检索到相关记录后再返回给OPAC的ZClient,ZClient再返回给上层的用户界面。馆际互借模块:在发送馆际互借请求时,把Z39.50检索请求作为一个外部的扩展包一起发送,让馆际互借的资源提供方根据发送的检索请求查询,提供合适的数据。Z39.50在图书馆自动化系统中的应用本地编目模块ZClient上载数据下载数据Z39.50协议本地的ZServer本地数据上载数据下载数据Z39.50协议Z39.50协议Z39.50协议下载数据下载数据其他ZServer数据源其他ZClient本地的OPAC9.3.1Z39.50协议•9.3.1.4主要功能及其应用应用:(2)联机编目系统数据著录模块OPAC(OnlinePublicAccessCatalogue)模块馆际互借模块:联机系统担当资源提供者的角色成功的案例:美国的OCLC,日本大学图书馆联机编目系统NII(NationalInstituteofInformation),中国的CALIS等。Z39.50在联机编目系统中的应用(以CALIS联机编目系统为例)编目ClientZ39.50协议CALISZServerCALIS联机编目系统数据库下载数据Z39.50协议其他ZServer其他ZClientCALISZClientOPAC网关其他数据源读者编目员9.3.1Z39.50协议•9.3.1

1 / 64
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功