第6讲文化信息资源的组织时间:1月11日14:00~16:00地点:A306文化产业管理专业《文化信息资源开发规划》课程内容信息资源组织原理信息资源的描述与揭示网络信息资源的组织1.信息资源组织原理信息组织也称信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。1.信息资源组织原理信息的外部特征是指信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征,如信息载体的物理形态、题名、作者、出版或发表日期、流通或传播的标记等方面的特征。信息的内容特征就是信息包含的内容,它可以由关键词、主题词或者其他知识单元表达。信息组织的基本对象就是信息的外部特征和内容特征。1.信息资源组织原理(1).信息选择:从采集到的、处于无序状态的信息流中甄别出有用的信息,剔除无用的信息,是信息组织过程的第一步。(2).信息分析:按照一定的逻辑关系从语法、语义和语用上对选择过的信息内、外特征进行细化、挖掘、加工整理并归类的信息活动。(3)信息描述与揭示:也称为信息资源描述,根据信息组织和检索的需要,对信息资源的主题内容、形式特征、物质形态等进行分析、选择、记录的活动。(4).信息存贮:将经过加工整理序化后的信息按照一定的格式和顺序存贮在特定的载体中的一种信息活动。1.信息资源组织原理信息组织的类型:(1)按信息表现形式划分文字信息组织图像信息组织声音信息组织视频信息组织(2)按信息的加工程度划分一次信息组织二次信息组织三次信息组织1.信息资源组织原理(3)按信息的传播载体划分文献信息源非文献信息源在这里,非文献信息源特指网络环境下没有以传统文献载体形式出现的信息源,如程序代码、网页、超文本等。为了学习的方便,我们统称为网络信息源。1.信息资源组织原理1.元数据的概念:元数据(metadata)是关于数据的数据(dataaboutdata),是专门用来描述数据的特征和属性,描述和组织信息资源,发现信息资源的语言和工具。2.元数据的描述对象:早期:元数据主要指网络资源的描述数据后来:逐步扩大到各种以电子形式存在的信息资源的描述数据。现在:元数据适用于各种类型信息资源的描述记录。1.信息资源组织原理元数据的基本功能(1)识别。确认并对要进行组织的信息资源进行个别化描述,使用户能识别被组织的资源对象。(2)定位。提供信息资源位置的信息,以便用户访问时使用。(3)检索。通过在描述数据中提供检索点,便于用户对资源的检索和利用。(4)选择。通过记录信息资源的特征,诸如主题、作者、类型、物理形式、层次和日期等,供用户对信息资源的使用价值进行判断,决定是否使用该资源。2.信息资源的描述与揭示1.文献信息的著录(1)著录的基本概念:著录:是指在编制文献目录时,对文献内容和形式特征进行分析、选择和记录的过程。款目:著录的结果是款目,它是反映文献内容和形式特征的著录项目的组合。目录:将一批款目按照一定的次序编排而成的一种文献报道和检索工具。2.信息资源的描述与揭示(2)著录的标准化:在国家或国际范围内,对文献著录的原则、内容、格式等做出具有一定约束力的规范。国际:1971年,国际图书馆协会联合会(IFLA),单行著作国际标准书目著录ISBD(M);1976年,出版了国际标准数目著录总则ISBD(G)。中国:1983年7月,正式发表了全国文献著录标准系列中的《文献著录总则》(GB3792.1-83),其后,先后出版了各个分则。2.信息资源的描述与揭示文献信息的标引(1)标引的基本概念:信息标引:指分析信息的内容属性(特征)及相关外表属性,并用特定语言表达分析出的属性或特征,从而赋予信息检索标识的过程。标引语言:表达信息主题概念和检索需求主题概念的简明性、单义性和关联性的概念标识系统。2.信息资源的描述与揭示信息标引包括主题分析和转换标识两个环节。主题分析:在了解和确定信息的内容属性以及帮助揭示内容的某些外表属性之后,将这些属性概括为主题并用自然语言表述,同时分析主题概念之间或主题概念因素之间的结构关系。转换标识:用专门的主题概念或概念因素,构成一定形式的检索标识。2.信息资源的描述与揭示(2)标引的两种主要类型:分类标引:采用分类语言的标引。分类语言用分类号表达主题概念,依据知识分类将主题概念组织、排列成类目体系,主要以类目体系的自身结构显示概念之间的关系。主题标引:采用主题语言的标引。主题语言是一种由受控的自然语言语词直接表达主题概念,按语词字顺排列主题,主要用参照显示概念之间关系的标引语言。2.信息资源的描述与揭示20世纪80、90年代诞生的大量规范:《文本编码倡议》(TextEncodedInitiative,简称TEI)《都柏林核心集》(DublinCore,简称DC)《政府信息定位服务》(GovernmentInformationLocatorService,简称GILS)《多媒体内容描述接口》(MultimediaContentDescriptionInterface,简称MPEG-7)2.信息资源的描述与揭示1.MachineReadableCatalogue:MARC标准;起源:美国国会图书馆,1965年提出了“标准机器可读目录记录款式的建议”,即MARCⅠ。1967年MARCⅡ诞生。特点:共有001~999个字段,其中999字段为用户自定义字段;字段内容著录详尽,字段下又设子字段以及重复字段;字段作用强化,可检索的字段多每条MARC记录可分为头标区、目次区和数据区。2.信息资源的描述与揭示(1)USMARC(美国国会图书馆机读目录通信格式)在1995年,美国NDLP启动,对USMARC做了一些修改:增加了“电子资源地址与存取”字段即856字段。(2)UNIMARC(国际机读目录通信格式)(3)CNMARC(中国机读目录格式)2.信息资源的描述与揭示2.DublinCore(都柏林核心集)(1)起源于1995年在美国俄亥俄州都柏林市召开的元数据讲习班。目前,已得到广泛的承认和应用,成为国际RFC2413和美国Z39.85标准。()(2)作用:为描述网络资源提供了一种规范。(3)15个核心元素DC元数据有15个核心内容元素(element)。这15个元素组成了都柏林核心元数据元素集(DublinCoreElementSet)。2.信息资源的描述与揭示元素名称说明Title标题资源标题Subject主题资源内容的主题Description主题关于资源的简要描述Type资源类别资源的内容类别Source来源产生该资源的其他资源Relation关联关系与其他资源的关系Coverage覆盖范围资源地理、时间或管理的范围2.信息资源的描述与揭示元素名称说明Creator创作者资源内容的主要创作者Contributor其他贡献者对资源做出其他贡献的对象Publisher出版者资源的提供、发表、出版者Rights权限资源所属或管理的权限信息Date日期资源生命周期中的特定日期Format资源格式资源的格式Language语言资源所使用的语言Identifier标识符对资源进行标识的识别信息2.信息资源的描述与揭示(4)DC的主要优点:简单易懂:15个元素通俗易懂运用灵活:它即可以用于规范的资源描述,也可以用于非专业领域国际通用:目前已有10多种不同语言的版本可扩展性:不仅有15个核心标记元素,子元素和扩展元素,还可以与其他元数据连接使用3.网络信息资源的组织网络信息的特点:组织的对象从各种类型的数据发展到更加丰富多彩的信息、信息链甚至知识;②组织的范围从文献内、外特征深入到信息单元、知识单元;③组织的结果从静态的文本格式发展到动态的多模式的链接;④组织的形式从数据结构发展到知识表示。即要求信息组织的透明化、易用性;⑤组织的技术从手工单一发展到半自动化、自动化、智能化,即要求组织的标准化、兼容化。3.网络信息资源的组织文件方式优点:(1)简单方便;(2)是存贮非结构化信息的天然单元。缺点:(1)难以平衡网络负载与文件数量的关系;(2)不能充分地显示结构化信息之间的结构关系;(3)文件本身可看做信息单元,需要作为对象来管理。3.网络信息资源的组织数据库方式数据库组织方式:是将所有已获得的网络信息资源以固定的记录格式存贮,用户通过关键词及其组配查询,就可以找到所需要的信息线索(即相关站点链接),并通过信息线索直接链接到相应的网络信息资源。检索结果结构化查询检索结果输入检索式客户端服务器数据库3.网络信息资源的组织优点:(1)利用数据模型对信息进行了规范化处理,优化了数据的查询,提供一整套数据控制和操作的方法,利用信息项之间的联系进行信息的重组和查询,提高数据操作的灵活性;(2)数据的管理与应用程序完全分离,大大降低了网络传输的负载;(3)为多媒体信息、半结构化信息以及非结构化信息的组织提供良方。3.网络信息资源的组织缺点:(1)不能提供数据信息之间的知识关联;数据库组织方法是基于语用的组织,有严格的数据模型,单个数据项缺乏行为能力,所以难以显示信息单元的知识内容之间的语义关联。(2)对用户和服务器端都提出了较高的要求。3.网络信息资源的组织主题树组织方式:将信息资源按照某种事先确定的概念体系结构,分门别类地逐层加以组织,用户通过浏览的方式逐层加以选择,层层遍历,并通过信息线索直接找到相应的网络信息资源。3.网络信息资源的组织优点:(1)简单易用,屏蔽了网络链接技术和资源获取技术对用户的复杂性,提供了一种基于树型的浏览方式、简单易用的信息检索和利用界面;(2)信息检索按照一定的范畴分类体系,逐次查看,对用户而言,目的性强,查准率较高;(3)采用树型目录结构组织信息资源,具有良好的可扩充性和较严密的系统性。3.网络信息资源的组织缺点:(1)必须事先建立一套完整的范畴体系,用户对使用的范畴体系有一定的了解,增加用户的智力负担;(2)要保证主题树的结构清晰性和资源可用性,主题范畴体系的结构就不能过于复杂,每一类目下的信息检索条目不宜过多,这就降低了该方式所能容纳的信息资源的数量。3.网络信息资源的组织超媒体技术:是超文本技术与多媒体技术的结合,它将文字、图像、声音、视频等多媒体信息以超文本的方式组织起来,用户通过高度超级链接的网络结构在各种信息库中航行,从而找到所需要的信息。线性文本多媒体超文本超媒体加大表现力加大表现力引入网络结构引入网络结构3.网络信息资源的组织优点:(1)是网络信息组织未来的发展方向,是符合人们跳跃性思维习惯的非线性组织方式,具有良好的包容性和可扩充性;(2)超越媒体类型对信息组织与检索的限制,实现了链接浏览的搜寻方式;(3)避免了检索语言的复杂性。3.网络信息资源的组织缺点:(1)采用浏览的方式搜寻信息,当超媒体网络过于庞大时,很难迅速而准确地的定位;(2)很难保存浏览过程中的所有记录,难以避免“迷航”现象。教学总结笔记整理Q&A感谢您的关注!请您多多指导!