数字图书馆现状与发展趋势

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

数字图书馆现状与发展趋势林芳2004年10月15日主要内容:数字图书馆的概念数字图书馆技术数字资源及其组织和管理几个中国数字图书馆项目简介其它内容数字图书馆的概念定义数字图书馆是一个环境,它将收藏、服务和人带到一起以支持数据、信息乃至知识的全部相关流程,包括从创造、传播、使用以及保存的全过程。——美国国家科学基金NSF1997年数字图书馆的概念定义1数字图书馆并非单一的实体2数字图书馆需要技术,以连接更多的数字图书馆和信息服务机构的信息资源3各种数字图书馆和信息服务机构之间的连接对终端用户是透明的4实现数字图书馆和信息服务机构全球查询是其目标5数字图书馆的馆藏并不局限于文献替代物:它们扩展成为数字产品,无法用印刷品格式取代或传播数字图书馆的概念定义另一种说法:数字图书馆是采用现代高新技术所支持的数字信息资源系统,是下一代因特网网上信息资源的管理模式,是没有时空限制的、便于使用的、超大规模的知识中心。数字图书馆的概念体系结构数字图书馆的概念功能(1)各种载体文献的数字化文献的载体(图书、资料、文献、杂志等)、各种印刷型文本(含古籍、珍本、善本)、地图、缩微资料、视听资料等都是数字化的内容。数字图书馆的概念功能(2)数据的存储和管理数字化图书馆大多采用客户机/服务器(C/S)管理模式,客户端、图书馆服务器和信息对象服务器构成信息传递的核心结构。图书馆服务器主要管理数据的目录、索引和查询,而对象服务器用于管理数字化的实体对象,当对象数据到达客户端时,就实现了图书馆对象数据的传送。在这一模式中,用户获取信息有两种方式:一是用户向图书馆服务器发出检索要求,检索信息服务对象,图书馆服务器将检索到的相关信息转送给信息对象服务器,信息对象服务器将信息对象发送给用户。二是用户向图书馆服务器发出检索要求,图书馆服务器将检索到的相关信息转送给客户机,客户机向服务对象服务器发出信息检索请求,信息对象服务器将信息对象发送给用户。数字图书馆的概念功能(3)组织有效的访问和查询随着Internet上万维网服务器的发展,已出现网上的全文检索软件,用户可按自然语言方式输入查询命令,系统将自动抽取关键词,进行概念匹配,进而与文件的索引信息进行相似性比较,按相似性的高低列出查询结果。对于图像与视频等多媒体信息可采用特征提取技术以及相关反馈等技术进行检索。数字图书馆的概念功能(4)数字化资料的传送多媒体信息网为数字化图书馆提供了良好传输环境,近年来,光缆的发展与普及,使传输率可达1Gbps–2Gbps,是数字化的多媒体信息的最理想的传输介质。数字图书馆的概念数字图书馆是一个环境,一种信息基础设施从大处说,是未来知识创造和传播的环境,是未来人们学习和生活的环境从小处讲,是面向未来的信息服务环境数字图书馆是一个不断发展的概念技术的发展会促进数字图书馆概念的发展数字图书馆建设是一长期、渐进的过程数字图书馆建设不是某个机构自己的事,为了尽可能地保护建设成果,充分利用全球资源,建设者必需联合起来,共同建设,协调发展。数字图书馆技术信息的捕获与创建技术数字图书馆技术信息的存贮与管理技术文本分析技术、分类与聚类技术、数据挖掘技术、多语言技术数字图书馆技术信息的搜索与访问技术搜索引擎技术、图像及视频检索技术、可视化信息检索技术数字图书馆技术所谓信息可视化就是利用计算机支撑的、交互的、对抽象数据的可视表示,来增强人们对这些抽象信息的认知。信息可视化技术将为人们发现规律、辅助决策、解释现象提供强有力的工具。信息可视化的基本内容:信息描述与存储的可视化信息检索的可视化()检索结果提供的可视化数字图书馆技术信息的传递技术压缩技术数字图书馆技术权限管理技术数字资源及其组织和管理数字资源的种类一、数字资源的定义凡图书馆引进(包括购买、租用和受赠)或自建(包括扫描、转换和录入)的,拥有磁、光介质或网络使用权的数字形态的文献资源,为图书馆的数字资源。二、数字资源的分类根据目前高校图书馆数字资源的现状分为四种类型:电子书(包括学位论文及其他类似书的出版物);电子刊(包括其他类似刊的出版物);二次文献数据库(包括题录、文摘、索引等);其他数据库。数字资源及其组织和管理数字资源的种类三、高校原生文献(bornelectronicdocument)的种类:电子论文(electronicthesesanddissertations)研究数据(researchdata)机构资料(Instructionalmaterials):教学大纲、讲座、样题等学术研究文章(scholarlyresearchpapers):fullypeer-reviewed,manuscriptsorpreprints灰色文献(greyliterature):workingpapers,whitepapers,policypapers,technicalreports数字资源及其组织和管理信息组织原理信息组织即信息序化或整序,也就是利用一定的科学规则和方法,通过对信息外在特征和内容特征的描述和序化,实现无序信息流向有序信息流的转换,从而保证用户对信息的有效获取和利用及信息的组合和流通.外在特征是信息的物质载体所直接反映的特征,内容特征是信息所包含和承载的具体内容.数字资源及其组织和管理信息组织的基本方法(1)语法信息组织方法:按形式特征组织信息,如字顺组织法,代码法,地序组织法,时序组织法.(2)语义信息组织方法:按内容特征组织信息,如分类组织法,主题组织法.(3)语用信息组织方法:按使用频度组织信息,如权重值组织法,概率组织法.数字资源及其组织和管理数字资源的组织方法(1)MARC(2)DC元数据(3)METS(4)FRBR数字资源及其组织和管理数字资源的组织方法(1)MARC数字资源及其组织和管理数字资源的组织方法(2)DC元数据元数据的定义•元数据是关于数据的数据(dataaboutdata)•元数据是关于数据的数据。此术语指任何用于帮助网络电子资源的识别、描述和定位的数据。•元数据是关于数据的结构化的数据(structureddataaboutdata)。•元数据是与对象相关的数据,此数据使其潜在的用户不必预先具备对这些对象的存在或特征的完整认识。•元数据是对信息包(Informationpackage)的编码描述,其目的在于提供一个中间级别的描述,使得人们据此就可以做出选择而无需检索大量不相关的全文文本。•元数据,即代表性的数据,通常被定义为数据之数据。它包含用于描述信息对象的内容和位置的数据元素集,促进了网络环境中信息对象的发展和检索。数字资源及其组织和管理数字资源的组织方法(2)DC元数据元数据在网络信息组织方面的作用描述(Description)对信息对象的内容和位置进行描述,从而为信息对象的存取与利用奠定必要的基础。定位(Location)元数据包含有关网络信息资源位置方面的信息,因而由此便可确定资源的位置之所在。此外,在信息对象的元数据确定以后,信息对象在数据库或其它集合体中的位置也就确定了。发现(Discovery)元数据提供搜寻的基础,在著录的过程中,将信息对象中的重要信息抽出并加以组织,赋予语意,并建立关系,从而有利于用户识别资源的价值,发现其真正需要的资源。评估(Evaluation)元数据提供有关信息对象的名称、内容、年代、格式、制作者等基本属性,使用户在无需浏览信息对象本身的情况下,就能够对信息对象具备基本了解和认识,参照有关标准,即可对其价值进行必要的评估选择(Selection)根据元数据所提供的描述信息,参照相应的评估标准,结合使用环境,用户便能够做出对信息对象取舍的决定,选择适合用户使用的资源。数字资源及其组织和管理数字资源的组织方法应用于不同领域的Metadata格式网络资源:DublicCore、ROADSTemplate、CDF(ChannelDefinitionFormat)、WebCollections文献资料:MARC(with856Field),DublicCore人文科学:TEIHeader(TextEncodingInitiativeHeader)社会科学数据集:ICPSRSGMLCodebook(Inter-universityConsortiumforPoliticalandSocialResearch)博物馆与艺术作品:CIMI(ComputerInterchangeofMuseumInformation)、CDWA(CategoriesfortheDescriptionofWorksofArts)、RLGREACHElementSet视觉资料:VRA(VisualResourcesAssociation)CoreCategoriesforVisualResources音乐资料:SMDL(StandardMusicDescriptionLanguage)政府信息:GILS(GovernmentInformationLocatorService)地理空间信息:FGDC/CSDGM(FederalGeographicDataCommittee/ContentStandardsforDigitalGeospatialMetadata)数字图像:MOA2metadata、CDLmetadata、OpenArchivesFormat、VRACore、NISO/CLIR/RLGTechnicalMetadataforImages档案库与资源集合:EAD(EncodingArchivalDescription)技术报告:RFC1807:AformatforBibliographicRecordsFTP文件和FTP文件库:IAFATemplates(InternetAnonymousFTPArchivesTemplates)连续图像:MPEG-7数字资源及其组织和管理数字资源的组织方法DC产生与发展届次举办时间主办国举办地主办组织DC-11995.3美国Dublin,OhioOCLC、NCSADC-21996.4英国WarwickOCLC、UKOLNDC-31996.9美国Dublin,OhioOCLC、CNIDC-41997.3澳大利亚CanberraOCLC、DSTC、NLADC-51997.10芬兰HelsinkiOCLC、NLFDC-61998.11美国WashingtonD.C.OCLC、TLCDC-71999.10德国FrankfurtOCLCDC-82000.10加拿大OttawaOCLC、CNI、IFLADC-92001.10日本TokyoOCLC、NII、JSTDC20022002.10意大利FlorenceOCLCDC20032003.9美国西雅图OCLC数字资源及其组织和管理数字资源的组织方法DC元数据的元素集内容知识产权外部属性资源名(title)主题(subject)说明(description)覆盖范围(coverage)来源(source)关联(relation)语种(language)创建者(creator)出版者(publisher)其他责任者(contributor)权限(rights)日期(date)格式(format)标识(identifier)资源类型(type)数字资源及其组织和管理数字资源的组织方法MARC与DC比较数字资源及其组织和管理数字资源的组织方法DC与图书馆编目数据的区别创建者不同DC元数据的制作者的范围比较广泛,包括内容提供者,即作者、出版发行者等,而且这些人员不需要经过专业培训。编目数据的制作者则是经过专门培训的图书馆编目人员。可靠程度不同编目数据使用受控词表和规范控制来增强用户发现资源的能力,对原始数据进行了增值处理。DC元数据没有建立规则和过程来控制数据元素的内容,且所有元素都是可选的。*DC元数据的可靠性低于编目数

1 / 88
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功