信息组织--信息描述(PPT-95页)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章信息描述本章提示1、信息描述的意义2、信息资源描述项目、标识和描述级次3、检索点和规范文档4、计算机编码一、信息描述的意义1、信息描述信息描述,亦称信息资源描述,是指根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。在传统文献检索系统的编制中,信息描述又称为文献著录或书目著录,是信息资源组织的重要内容。信息描述的结果,是获得描述记录,亦即元数据,用作信息资源的代替物组织检索工具。一、信息描述的意义2、信息描述的意义(1)识别(2)定位(3)检索(4)选择一、信息描述的意义检索、识别一、信息描述的意义定位一、信息描述的意义检索、选择一、信息描述的意义识别、定位、检索、选择一、信息描述的意义3、信息描述的规范为了一致、有效地对信息资源进行描述,便于不同机构之间的信息交换,信息描述通常应依据一定的描述规范进行。书目文献领域描述标准化的努力最为典型。文献描述标准,亦即文献著录标准。一、信息描述的意义3、信息描述的规范——传统文献的描述规范《普通图书著录规则》《连续出版物著录规则》《非书资料著录规则》《地图资料著录规则》《档案著录规则》《古籍著录规则》《检索期刊条目著录规则》《文后参考文献著录规则》为了实施编目标准化,各国根据国际编目标准,建立了相应的实施条例或标准。我国发表了全国文献著录标准系列中的《文献著录总则》,其后,出版了各个分则。包括:一、信息描述的意义3、信息描述的规范——网络信息资源的描述规范近年来,网络信息资源的描述问题成为广泛关注的热点之一。出版界、计算机界和书目文献界一起,结合电子环境和技术的发展,共同创建了一系列新的描述规范,包括:《文本编码倡议》(TextEncodedInitiative,简称TEl)《都柏林核心集》(DublinCore,简称DC)《政府信息定位服务》(GovernmentInformationLocatorService,简称GILS)《联合地理数据委员会的数字地球空间元数据》(ContentStandardDigitalGeospatialMetadata,简称CSDGM)《可视资源核心范畴》(CoreCategoriesforVisualResources,简称CCVR)《编码档案描述》(EncodedArchivalDescription,简称EDA)《博物馆信息的计算机交换》(ComputerInterchangeOfMuseumInformation,简称CIMl)二、信息资源描述项目、标识和描述级次(一)关于元数据和《都柏林核心集》的简要说明1、元数据(1)起源:元数据一词起源于网络,最早主要指对网络资源的描述。(2)概念:元数据是关于数据的数据。(现在这个概念已突破网络的局限,扩展为“各种类型信息资源的描述记录”。)二、信息资源描述项目、标识和描述级次(一)关于元数据和《都柏林核心集》的简要说明数据二、信息资源描述项目、标识和描述级次(一)关于元数据和《都柏林核心集》的简要说明关于数据的数据——元数据二、信息资源描述项目、标识和描述级次(一)关于元数据和《都柏林核心集》的简要说明图书在版编目(CIP)数据信息组织/马张华编著.—2版.—北京:清华大学出版社,2003.7(面向21世纪课程教材.信息管理与信息系统专业教材系列)ISBN7-302-06652-3Ⅰ.信…Ⅱ.马…Ⅲ.信息管理—高等学校—教材Ⅳ.G203出版者:清华大学出版社印装者:北京市国马印刷厂开本:185×230印张:21.5字数:454千字版次:2003年7月第2版书号:ISBN7-302-06652-3/F·533定价:35.00数据关于数据的数据,各种类型信息资源的描述记录——元数据二、信息资源描述项目、标识和描述级次(一)关于元数据和《都柏林核心集》的简要说明2、《都柏林核心集》(DC)(1)简介:都柏林核心集(DublinCore,简称DC)是一项研究活动:由OCLC(美国联机图书馆中心)发起并组织,吸引了全世界图书馆界、计算机网络、数字图书馆研究、目录学等众多学科领域的专家参与的跨国、跨学科的研究活动。其根本目的在于促进资源发现。DC是一项研究成果:此研究活动总结出了一套用来描述信息资源的元素集合,即元数据的元素集合。其DC1.1版于1999.7推出,已在应用。二、信息资源描述项目、标识和描述级次(一)关于元数据和《都柏林核心集》的简要说明(2)元数据与《都柏林核心集》的关系元数据是一个理论概念,《都柏林核心集》是元数据的一个具体解决方案,是一个具体操作准则。二、信息资源描述项目、标识和描述级次研讨会主办时间主办国主办地点主办组织DC-11995.3.1-3美俄亥俄州.都柏林OCLC/NCSADC-21996.4.1-3英华瑞克大学OCLC/UKOLINDC-31996.9.24-25美俄亥俄州.都柏林OCLC/CNIDC-41997.3.3-5澳堪培拉OCLC/DSTC,NLADC-51997.10.6-8芬赫尔辛基OCLC/NLFDC-61998.11.2-4美华盛顿特区OCLC/TLCDC-71999.10.25-27德法兰克福OCLC/DC-82000.10.4-6加渥太华OCLC/NLC/IFLADC20012001.10.22-26日本东京NII/DCMI/JSTDC20022002.10.13-17意大利佛罗伦萨DCMI/AIB/BNCFDC20032003.9.28-10.2美西雅图DCMI/UW/IIS/MSDC20042004.10.11-14中国上海(3)DC研究活动概况——DC会议概况二、信息资源描述项目、标识和描述级次组织机构一览表组织简称组织全称组织简称组织全称OCLC美国联机图书馆中心NLF芬兰国家图书馆UKOLIN英国图书馆情报网络TLC美国国会图书馆CNI网络信息联盟IFLA国际图书馆协会联合会DSTC分布式系统技术中心NII国家信息研究所(日本)NLA澳大利亚国家图书馆UW华盛顿大学NLC加拿大国家图书馆BNCF佛罗伦萨国家书目中心(意大利)JST日本科技公司IISSyracuse信息研究所DCMI都柏林核心元数据首列MS微软公司AIB意大利书目协会NCSA国家超级计算机应用中心(待续)二、信息资源描述项目、标识和描述级次(4)DC的内容——都柏林核心元素定义元素名字标识定义Title资源名Title赋予资源的名称Creator创建者Creator创建资源内容的主要责任者Subject主题和关键词Subject有关资源内容的主题描述Description说明Description对资源内容的说明Publisher出版者Publisher使资源成为可以取得和利用状态的责任者Contributor其他责任者Contributor对资源内容创建作出贡献的其他责任者Date日期Date与资源本身生命周期中的一个事件相关的日期Type类型Type有关资源内容的特征和类型DC的构成包括基本DC和限定DC两部分。二、信息资源描述项目、标识和描述级次元素名字标识定义Format形式Format资源的物理或数字化的表现形式Identifier资源标识符Identifier在一给定的文本环境中对资源的参照引用Source来源Source对一个资源的参照,而当前资源是源自这一参照资源Language语种Language描述资源知识内容的语种Relation关联Relation对相关资源的参照Coverage覆盖范围Coverage资源内容所涉及的外延与覆盖范围Rights权限管理Rights有关资源本身所有的或被赋予的权限信息(续表)(4)DC的内容——都柏林核心元素定义二、信息资源描述项目、标识和描述级次(5)DC的影响①已能较好地解决网络资源的发现、控制和管理问题,并对现在数字图书馆的研究也很有意义。②世界各地(美洲、欧洲、大洋州、亚洲等)许多领域(社会学、政治学、图书馆、教育、商业、科学研究等)的众多项目都在研究、采纳DC。③DC已被翻译成泰、日、德、法、葡、丹麦、挪威、芬兰、瑞典等国家的几十种语言。④一些国家,如芬兰、丹麦已选用DC作为官方电子资源的描述方式。⑤1998年9月,因特网工程任务组也正式接受了DC这一网络资源的描述方式,将其作为一个正式的标准予以发布(RFC2413)。总之,DC是一种很有前景的元数据格式。二、信息资源描述项目、标识和描述级次(二)信息描述项目信息描述项目是用以揭示文献内容和特征的记录事项,亦称著录项目。基本描述项目描述子项目二、信息资源描述项目、标识和描述级次我国国家标准《文献著录总则》规定的基本描述项目分为9个大项目,依次为:题名和责任者项版本项文献特殊细节项出版发行项载体形态项丛编项附注项文献标准编号及有关记载项提要项。基本描述项目这9项可以提供一传统文献类型完整的书目数据,是识别文献,分析比较文献的基本依据。此外,一个完整的记录一般还包括标识项。二、信息资源描述项目、标识和描述级次《都柏林核心集》将其描述项目分为22个大项:基本描述项目题名(Title)指由创作者或出版者赋予资源的名称。作者或创作者(AuthorOrCreator)指负责创作资源知识内容的个人或组织。例如:文献作者、视频资源的艺术家、摄影师、插图作者主题和关键词(SubjectandKeywords)即资源的主题。通常以描述资源主题或内容的关键词或短语表达。鼓励使用控制词表或正式的分类法。二、信息资源描述项目、标识和描述级次《都柏林核心集》将其描述项目分为22个大项:基本描述项目描述(Description)资源内容的文字描述,包括文献类对象的文摘或视频资源的内容描述。出版者(Publisher)负责使资源以现有形式提供的实体,诸如出版社、大学的部门、团体实体等。其他参与者(OtherContributor)对资源作出重要智力贡献,但其贡献小于创作者字段中注明的个人或组织,因而没有在创作字段中注明的个人或组织。二、信息资源描述项目、标识和描述级次《都柏林核心集》将其描述项目分为22个大项:基本描述项目日期(Date)资源创建或提供的日期。采用8位数字,按照年年年年和年年年年—月月—日日的形式表示。资源类型(ResourceType)资源类型指网页、小说、诗歌、工作报告、技术报告、散文、词典等。根据系统间相互可操作性的需要,资源类型应从系列研讨会仍在发展的规范中选择。格式(Format)指资源的数据格式,或大小、持续时间等,用以识别显示或操作资源的软件和可能需要的硬件。二、信息资源描述项目、标识和描述级次《都柏林核心集》将其描述项目分为22个大项:基本描述项目资源标识(ResourceIdentifier)用来识别资源的惟一的字符串或数字。其他全球性的具有惟一性的识别符如,国际标准书号ISBN,URL等。来源(Source)用来识别该资源派生出来的资源的信息。通常情况下,此项只包括关于当前资源的信息,当认为对发现当前资源重要时,本项也可以包括派生出来的资源的元数据。语言(Language)指资源内容中使用的语言。推荐遵循RFCl766所规定的号码。二、信息资源描述项目、标识和描述级次《都柏林核心集》将其描述项目分为22个大项:基本描述项目关联(Relation)指另一资源的标识符及与当前资源的关系。此成分用于揭示相关资源之间的联系。考虑到相互的可操作性,对关联的描述应从系列研讨会仍在发展的规范中选取。覆盖范围(Coverage)资源内容的空间和时间特征。空间范围指以地名或组配(例经度、纬度)表达的位置。时间范围指资源内容发生的时间,而不是指何时创建或提供的(后者属于日期项)。权限管理(RightManagement)权限管理说明是一个联结与权限管理说明的标志符,是一个提供资源权限管理信息的机构的标志符。……二、信息资源描述项目、标识和描述级次小结:基本描述项目异:《文献著录总则》项目是根据传统文献类型的描述需要和文献单位的操作要求,在长期实践的

1 / 96
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功