OAI中网络信息传播模式的球体结构探索尚伟晔张秀兰辽宁师范大学管理学院辽宁大连116029[摘要]本文介绍OAI机制中网络信息传播模式的球体结构整体形式,并探讨了球体结构中OAI传播体系及其传播体系中各个要素之间的关系,提出建立基于DP/DS基础上的ADP/ADS,最后提出在OAI网络环境下对XML中DC元数据超链接的标准化并举例说明。[关键词]OAI球体结构标准化超链接DC元数据TheExplorationofSpheroidStructureinNetworkInformationDisseminationPatternOfOAIShangWeiye,ZhangXiulanSchoolofManagementLiaoningNormalUniversity,Dalian,Liaoning116029[Abstract]ThisarticleintroducesoverallformofthespheroidstructureinthenetworkinformationdisseminationpatternoftheOAImechanism,discussesthespheroidstructureoftheOAIdisseminationsystemandeachessentialfactorrelationsinthedisseminationsystem,establishesADP/ADSbasedonDP/DS,finallyproposestheunificationstandardizationoftheDCmetadataultralinkofXMLintheOAInetworkenvironment,andpointsouttheDCexampleofXMLtoexplain.[Keywords]OAI;Spheroidstructure;Standardizedultralink;DCmetadataOAI(OpenArchivesInitiative,即“开放文档先导”)主要是1999年由图书馆和信息资源委员会(CouncilonLibraryandInformationResource,CLIR)、数字图书馆联盟(DigitalLibraryFederation,DLF)提出的设想。由于各个数字图书馆数据库是不同时间,采用不同形式和不同软件平台构建的,使得分散的信息资源不能够相互分享。以往采用中间件(如CORBA)进行分布式异构数据库资源共享,这种分布式数据库的搜索对于较少的数据库较方便,可是应对今天网络中各个地方的众多数字图书馆的信息共享则效率较低;而OAI设想的提出,正是另一种解决数字图书馆互操作问题的方案,它是基于HTTP上简单的信息传播机制。同时,在OAI设想的启示下,进一步完善OAI的网络信息传播模式将有利于更好的实现网络环境下的资源共享。1OAI的网络信息传播模式球体结构探索1.1OAI中网络信息传播模式OAI中网络信息传播模式是指基于互联网的OAI的信息传播模型。OAI是指倡导电子文档的发展的过程,它提出了元数据的电子文献互操作框架,采用OAI-PMH(OAIProtocolForMetadataHarvesting)即OAI元数据获取协议,实现网络元数据信息的传播与共享。网络信息传播是指以互联网为传输通道,使全世界各地网络上的人们实现自由的信息传播,实现信息传播的全球化。因而,基于互联网的OAI的信息传播模式呈现出球体结构。1.2OAI的网络信息传播模式球体结构的整体形式(如图1)OAI立体结构信息传播模式是一个球状的,他同我们地球相似,有一个赤道,也有纬线和经线,在地球的中心就是OAI注册网站。DP(DataProvide)数据提供者分布在地球的表面,可以由纬度和经度确定其具体位置,DS(DataService)数据服务者分布在球面上,就如同地球表面分布的各个国家一样。这里将赤道与圆心(OAI网站)所在平面定为ADP高级数据提供者或者ADS高级数据服务者层,即α面,在ADP层分布少数几个ADP/ADS(ADP和ADS可以互换角色,都指的同一个数据库,当他提供数据时为数据提供者;当他向用户提供检索时就成为数据服务者),ADP有上下半球不同的DP向α面进行信息映射。信息映射,指ADP从不同的DP中收集某一专题信息,将其他库里的信息映射到自己的信息库中并建立标准化的数据库。ADP实际上也是OAI网站的延伸,将OAI网站中虚拟的分类列表具体化。OAI网站就如同地心一样具有地球引力,将球面上的各个DS和α面上的ADP/ADS联系在一起,组成了全球化的OAI网络传播系统。球体结构的整体形式包括两个阶段:低级阶段和高级阶段。DP/DSDP/DSADP/ADSOAI网站DP/DS图1OAI的网络信息传播模式球体结构图1.2.1初级阶段目前,大部分数据服务者DS,只搜集元数据并在当地建立元数据库,可原始的信息仍然存储在原始的数据库中,用户必须登陆数据提供者DP才能获得全文下载。DS不能用系统中的反馈、协调机制,改进各个数据库对信息的收集,不能促进信息的整合,数据库中的信息仅仅处于低的有序状态。这就是OAI机制的初级阶段。1.2.2高级阶段一些数据服务者DS,不但收集元数据,建立元数据库;而且为了满足用户,他们也将元数据超链接的全文下载到本地,并将这些全文数据添加到自己原有的数据库中。这时同在OAI网站上注册的数据提供者DP和数据服务者DS中,同一种源信息被多个DS所共有。虽然用户可以在本地数据库直接搜索到所需信息,但是各个DS的这种重复工作不利用数据库网络的发展,造成大量冗余信息,造成存储资源的极大浪费。因此,有必要建立立体的信息传播结构,即球体结构,并且在球体结构中提出了高级数据提供者(AdvancedDP)和高级数据服务者(AdvancedDS)。ADP/ADS:如同各个国家发展的不均衡一样,DP的数据库(包括全文数据库与元数据库)的建设水平也不一样,有些DP的信息更完整、更专业、更权威。同样,通过不断的收集利用,只有少数几个DS的数据库对某一特色专业的信息收藏较完整,而这少许的几个DS则可以构成高级数据服务者ADS。那些收录、收集全文数据库较完整的,可以称为高级数据提供者ADP;而那些元数据较完整的,可以称为高级数据服务者ADS。就目前的发展α面趋势来看,收集全文数据库较完整的ADP,其元数据库也较完整、较专业,可以说ADP等同于ADS。但是现在的OAI机制一般仅仅指元数据库的建设,DS所返回的XML中元素很少提供与全文的超链接,即使提供也没有标准化的固定在某一元素中,所以导致DS不能或很难下载DS的全文信息。ADP/ADS作用:ADP/ADS可以将各种信息整合化,并且在网站OAI进行专业化注册,使得其他DS直接向这些信息专业化的ADP/ADS获取即可。当ADP/ADS的信息重新整合后,ADP/ADS在OAI网站上分别注册所有分类数据库的元内容信息,促使ADP/ADS也相互进行协调,使得各类信息流向最完整、最专业的数据库。“系统可以定义为相互关联的元素的集”,而DP与DS之间的相互联系且动态相互作用,因此OAI的地球立体结构可以看成是一个信息传开放系统。“开放系统可以‘主动地’趋向高度有组织的状态,随系统条件可以从低的有序状态到达较高的有序状态。”OAI机制是1999年由SantaFe的UniversalPreprintService会议提出的,起发展也不过几年,由OAI中DP与DS组成的开放系统也正处于“低的有序状态”,通过DP/DS之间不断地趋向系统的稳定状态,信息不断的进行有序流动与组织,就会出现信息收录较全面的ADP/ADS,实现并达到系统较高的有序状态。通过ADP/ADS的反馈与协调,以及开放系统本身存在的反馈控制与“自动平衡”,使得ADP/ADS更加重要并且逐步扩大,根据系统的能量守恒,这种扩大会导致其他DS相对的变小。其他DS的变小使得他的工作更简单,系统中的信息更易于梳理,基于网络平台能更便捷的为用户服务。2球体结构中OAI的信息传播体系球体中由DP、DS、OAI网站和DP、DP、ADP组成了许多的扇形及三角形,这些图形联系表达了信息的传播体系有两种。(参见图1)2.1由DP、DS、OAI网站组成的传播体系(如图2)图2DP与DS信息传播体系图在OAI传播机制中主要的信息传播参与者是数据提供者DP和数据服务者DS。在OAI中,数据提供者与数据服务者工作分离。数据提供者只提供数据,而不必在乎服务工作(向用户提供);数据服务者只提供服务,而不必考虑数据。这种分工,使OAI机制运行高效而稳定,协调有序。同时,在OAI体系中数据提供者与数据服务者的角色是相互转化的。如,DSOAI网站DP元数据库全文数据库用户OAI采集器包装器全文采集器某一数字图书馆A向其他数字图书馆提供,传递元数据,此时A是数据提供者DP;同时A也向其他数字图书馆提取、收集元数据,将元数据向用户提供服务,此时A则作为数据服务者DS。在OAI机制中,所有的DP和DS都必须在OAI网站中进行注册。OAI协议是基于HTTP协议,使用GET/POST进行采集/上传。DP注册后,必须向OAI网站提交自己数据库的相关信息内容,DP使用POST请求向OAI网站进行上传信息。这样,在DS访问OAI网站就可以方便的查找需要的数据。DS注册后,主要使用HTTP协议的GET请求,通过OAI采集器向DP进行采集,而返回XML格式结果(XML文档是结构化的文档,反映元数据的信息明了),DS对返回的XML文档进行格式转化,并存储在元数据库中,供用户使用。2.2由DP、DP、ADP组成的传播体系由多个DP和ADP组成的OAI网络信息传播体系中,分为两部分:构建ADP和ADP的应用。OAI采集XML文档OAI采集构建ADPXMLOAI采集(标准化超链接)(元数据、全文采集)ADP应用图3DP、ADP组成的传播体系图构建ADP:ADP根据OAI网站上的注册的数据库的信息,再根据自身数据库的特点,将其他DP的信息映射到自身数据库上(ADP本身也是DP的高级形式)。通过OAI采集器向DP采集信息,ADP相当于DS。ADP不仅要收集元数据建立元数据库,而且还要利用全文采集器向DP采集全文并建立全文数据库。ADP的应用:其他DS根据需要,利用OAI网站上注册的ADP注册列表,也用OAI采集器向ADP采集信息元数据,ADP返回以XML文档中的DC元数据所采用的超链接字段经过标准化,可以直接链接全文共用户服务。DPDPADPDS/DP元数据库全文数据库3建立ADP/ADS的XML中DC元数据超链接的标准化OAI网站将各个DP注册的信息按照类别进行分类排列,形成数据列表。起初,不同的DP拥有不同的源数据库。但经过OAI的网络信息传播后,各个DS分别下载需要的全文,重新建立了全文数据库,使得不同的DS拥有了重复的信息资源。为了避免信息资源的重复,更为了合理重新对中信息资源的整合,提出高级数据提供者/高级数据服务者ADP/ADS。ADP/ADS出现后,OAI网站的数据列表中主要以ADP/ADS为中心,其余DP为其分部,并且通过ADP/ADS对OAI中注册的DP进行协调,其他DP之后不进行不载ADP中的全文,造成数据库负担,而ADP则统一标准的中的元素的超链接方式,使DS建立本地元数据并进一步检索全文使用。“通过对在OAI官方网站登记的330个OAI的DC发现,元数据与对应的全文之间的联系有5种方式:①在DC元数据的identifier字段提供全文的URL;②在DC元数据的format字段提供全文的URL;③在DC元数据的relation字段提供全文的URL;④用DC元数据的identifier字段指向一个中间网页,在中间网页的固定位置提供全文的链接;⑤不提供全文。”由不同字段提供的全文URL给数据库服务者DS的全文下载增加了复杂度,所以为了让DS能够方便快速的找到超链接,采用XML的标准化超链接格式。这里,可以由ADP下载全文并将全文下载的超链接都