第十一章信息集成服务§11.1信息集成服务的组织形式§11.2信息集成服务的内容组织§11.3信息集成服务中的系统互操作§11.4信息集成服务的协同实现§11.1信息集成服务的组织形式一、以资源为中心的信息集成服务二、以技术为中心的信息集成服务三、以机构合作为中心的信息集成服务四、以用户为中心的信息集成服务一、以资源为中心的信息集成服务以资源为中心的信息集成服务,是一种面向信息资源的,并以信息资源的发现、采集、加工与集成作为服务工作中心的信息集成服务类型。二、以技术为中心的信息集成服务以技术为中心的信息集成服务,是一种面向信息集成技术应用的,以信息集成技术的研发为依据的信息集成服务类型。(如图11-2)三、以机构合作为中心的信息集成服务以机构合作为中心的信息集成服务,是以信息服务机构之间的多种形式的合作为基础,通过合作达到机构之间信息资源的集成与共享、服务技术的集成与共享、服务人员的集成与共享,从而增强各个服务机构的服务能力的一种服务(如图11-3)。四、以用户为中心的信息集成服务主要是个性化集成服务,是由用户个性化的需求为导向进行信息服务要素的动态集成的一种服务。强调用户的个性化体验,以提供用户满意的服务为目标,从用户角度进行服务的集成组织,因此,信息服务机构在提供信息集成服务时,一切从用户活动与行为出发,不仅强调信息用户现实信息需求的满足,同时也关注和挖掘用户的潜在信息需求(如图11-4)。§11.2信息集成服务的内容组织一、集成化信息动态发布二、集成化信息检索三、信息集成化推送服务四、基于神经网络集成技术的专家系统服务一、集成化信息动态发布集成化信息发布平台能够自动根据其动态库中信息的变化、网上相关信息源的变化和深层开发的结果适时发布相关信息并及时提供相关资源。图11-5以新闻动态发布为例,显示了集成化发布的过程。一、集成化信息动态发布Web信息资源发布通常使用两种简单模型:一是页面发布(如图11-6),二是数据库发布(如图11-7)。无论是哪种模型,其发布的对象都具有一致性:被发布的对象是Web上的信息资源;利用常规的Web技术实现信息发布,即将Web作为信息发布渠道;用户采用类似于通常信息浏览的方式即可浏览被发布的信息;受众不确定和不可控制性,即对Web用户访问发布的资源不做限制。一、集成化信息动态发布二、集成化信息检索集成化信息检索是以信息集成与服务集成为依据,以达到知识共享的最大化为目的,实现对互联网连接起来的数字资源库群的分布式存贮及跨平台、跨语种的网络化检索。集成化信息检索顺应用户的需求,本着截面无缝化、统一化的检索理念,为解决异构数据库的统一检索问题而提出。信息集成化检索的必要性表现在如下4个方面:①资源分散阻碍了知识共享。②用户面临检索困境。③现行检索方式的弊端。④数字图书馆服务的推动。二、集成化信息检索现代网络环境和技术条件从多个方面保证了集成化信息检索的实现,关键技术包括标准与协议支持、数据库技术的发展、网络化检索的实现等。①标准与协议支持:基于网络的集成化信息检索系统的开发和运行得益于通用的网络协议,更依赖于和信息处理、传输与检索等有关的标准与协议②数据库技术的发展:面向对象的技术与公共对象请求代理体系结构(CommonObjectRequestBrokerArchitecture,CORBA);动态数据库访问技术③网络检索工具的发展三、信息集成化推送服务与传统的信息服务形式和信息服务模式相比,针对用户对信息服务提出的全面、准确和深入的要求,集成化信息服务中必须开发自动预测需求、自动跟踪、主动发布信息等功能以适应用户,这正是信息推送服务的优势所在。在用户特征和需求特征库建立之后,系统便可以根据用户的特殊偏好或需要,定期通过网络搜索获取的相关信息,通过智能化的筛选、分类,然后提供给相关用户,这相当于为每位用户编制一部完全符合其需求、适应其特点、属于他个人的动态信息集。这样才能最大程度地提高用户获取信息的能力,做到按需推送,以使从被动变为主动,更好的服务于用户。三、信息集成化推送服务根据系统集成和扩充程度的不同,推送服务功能的实现可以分为三种形式(具体模型如图11-8所示):三、信息集成化推送服务①Web服务器扩展(CGI)方式。这种方式利用服务器扩展(CGI)来扩充原有Web服务器功能,实现信息推送。②客户智能代理(Agent)方式。这种方式使用“智能代理(Agent)”定期自动的对预定的Web站点进行搜集,以收集更新信息并发送给用户。③推(Push)服务器方式。这种方式对原有系统的改动最大,它提供包括推(Push)服务器、客户端及开发工具等一整套集成应用环境。还需要说明的是,信息推送服务是基于用户注册的服务,依据注册用户定制信息,按照其个性化需求,采用推送至终端或推送至邮箱的方式来实现。简要的流程是:未注册用户在注册过程中提供用户信息和需求特征信息,登录后自行设置定制信息,系统将服务器定期扫描用户定制信息之后的产品,定期提供给用户所需信息。四、基于神经网络集成技术的专家系统服务专家系统是一种智能的计算机程序,它运用知识和推理步骤来解决只有专家才能解决的复杂问题,它主要由知识库和推理机构成。基于神经网络集成的专家系统由基本部件和核心部件两大部分组成。基本部件即传统的专家系统的组件集成,主要包括用户界面、知识库、知识库管理系统、推理机、数据库、解释机等,核心部件包括神经网络集成知识自动获取模块(神经网络集成、规则抽取机构),其系统基本结构如图11-9所示。如图11-9所示,几个基本模块运行如下:用户界面:人机交互的平台,服务提供方、资源提供方和用户可以方便地交流。解释机:对给用户提供的答案进行包括采用事实依据、逻辑推理路线、系统分析方式以及答案的肯定程度等给予必要的集成说明。推理机:模拟领域专家的思维过程,控制并执行对问题的求解。。系统管理模块:系统管理员通过该模块对整个专家系统包括数据库和知识库行使存储、排序、检索、维护、更新等基本管理职能。数据库和知识库:数据库是用于存放从用户提问-问题分析-经验采纳-逻辑推理-初步结果-结果验证-最终结果-结果提交全过程的事实和数据,而知识库则存放着领域专家专门知识,库中还存储着从神经网络中抽取的规则,这也是基于神经网络集成的专家系统与普通专家系统的区别之一。四、基于神经网络集成技术的专家系统服务§11.3信息集成服务中的系统互操作一、系统异构与基于资源集成的系统互操作二、系统异构与互操作环境三、系统互操作的技术实现一、系统异构与基于资源集成的系统互操作目前关于信息系统互操作的研究主要集中在以下领域:电子政府领域的互操作研究英国政府UKe-GIF是第一个系统化的电子政务互操作框架,将相应的标准规范分为:系统互联(Interconnection)、数据整合(Dataintegration)和信息获取(Informationaccess)三个方面,包括了通信协议、安全机制、数据编码、数据标记、元数据、数据交换格式等层面的互操作.电子商务领域的互操作研究UN/CEFACT及OASIS共同推进的ebXML电子商务标准体系数字图书馆领域的互操作OCLC关于DSpaceHarvesting、DublinCoreMetadataInitiative、OpenArchivesInitiative、OpenURLActivities、RDFInteroperability、TerminologyServices、Z39.50互操作的研究等,推动世界范围内图书馆界的系统互操作和合作。多媒体出版领域的互操作规范信息用户在使用信息系统时出现两大鸿沟:信息获取鸿沟和信息理解鸿沟,客观上提出了系统互操作的要求。系统互操作是达到共享目标的系统和系统间的有效交互能力。互操作的主要特征包括:①自治性(Autonomy)。自治性是系统互操作的最重要的特征。其基本特征是,各个系统的每个构件本质上可独立于环境中其它构件进行操作,即具有一定程度的独立性和可局部管理性。②服务性(Service)。这里的服务是靠构件实现的,即构件或一组协同操作的构件,它代表用户执行的一个活动或一组活动。③物理分布性。④开放性(Openness)。开放性是指构件与服务可在任何阶段加入到系统,或从系统中撤去。一、系统异构与基于资源集成的系统互操作一个理想的信息系统操作应该满足:①支持丰富多样的资源和功能形式,能容纳各种各样的信息资源体系和服务体系。②支持分布的各个系统的自主性,能持续支持支持各个系统的自主建设与发展,能有效保证对知识产权资源使用的本地控制,能支持专门的本地客户端机制和服务,能支持专门的甚至本地化的元数据格式和系统协议。③保证整个分布式数字信息机制的低成本和进入该体制的低成本。保证在分布式数字信息机制中增加新的资源和服务系统的方便性和低成本;保证在分布式数字信息机制中使用任何一个资源和服务系统的方便性和低成本。④提供整个机制的可伸缩性,能容纳甚至动态组合任意数量和类型的资源或服务体系。一、系统异构与基于资源集成的系统互操作信息系统互操作的目标是向用户屏蔽分布的、异构的各个信息系统间的差别,实现用户对多个信息系统的交叉浏览和交叉检索,提供统一入口的多个信息系统间检索和浏览服务,实现信息共享。当前环境下,信息集成服务要解决互操作的以下主要问题:屏蔽分布的各信息系统之间的差别,通过统一界面为用户提供一致的服务;为信息资源和信息系统提供一种灵活的集成机制,即允许各个相对独立的信息系统能自由增加新的服务,或修改以前的服务;信息资源整合和集成服务协议的制定,包括元数据协议、数字对象存储协议、信息搜索协议、付费协议、信息资源服务的运行管理协议等等;开发信息资源整合与集成服务系统高层协议中间件,实现分布子系统间各项服务的互操作。一、系统异构与基于资源集成的系统互操作二、系统异构与互操作环境信息集成服务处于分布、异构数字化信息环境中,众多不同地域、不同技术平台、使用不同组织检索方式的系统并存,迫切需要建立有效的互操作机制来整合整个分布环境中的资源和服务。制约系统互操作的因素非常复杂,其中异构性是制约信息系统实现互操作的关键因素。信息系统异构主要可以概括为两个层面:信息资源层面、技术层面。①信息资源异构,资源是信息系统提供服务的基础,信息资源的异构问题主要表现为:命名问题格式问题描述体系的问题②技术层面的异构,指信息系统所依赖的应用系统、数据库管理系统乃至操作平台之间各不相同,形成异构的技术环境。二、系统异构与互操作环境信息集成服务的系统互操作环境从宏观环境而言,信息集成服务互操作处于异构、集成和动态环境中。从微观环境而言,信息集成服务要跨越分布异构的资源集合和集成服务体系,实现一致的服务。图11-11详细说明了信息集成服务互操作的微观环境。二、系统异构与互操作环境三、系统互操作的技术实现应用信息系统互操作的关键技术主要包括:应用层面的互操作技术:包括信息系统软件互操作技术、基于协议的互操作技术;资源层面互操作技术:主要包括元数据互操作技术和知识本体互操作技术。图11-13展示了一个信息系统互操作的技术框架。三、系统互操作的技术实现应用层面的信息系统软件互操作的技术实现软件互操作技术的核心是通过克服不同软件构件所采用的实现语言、运行环境和基本模式的差异,实现信息系统相互通信和协作,完成某一特定任务。①外部协调(mediator)或中间件(middleware)技术。②基于软件代理的互操作技术。③分布式对象请求技术。④基于描述得互操作技术。④基于描述的互操作技术三、系统互操作的技术实现应用层面的基于协议的互操作技术实现:协议是实现互操作的基础。在信息资源整合与服务中,信息系统互操作的实现需要相关协议的一致性应用,对信息系统集成与互操作影响较大的协议包括:Z39.50LDAPWHOIS++等。Z39.50Z39.50是信息检索应用服务定义和协议规范(InformationRetrievalApplicationServiceDefinitionandProtocolSpecification)的简称。Z39.50