信息组织―第二章信息组织原理

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章信息组织原理本章知识点1、对信息组织的要求2、信息组织中的控制与规范3、规范控制的依据一、对信息组织的要求1、检全率(查全率)系统实施检索时检出的与某一检索提问相关的信息资源数与检索系统中与该提问相关的实有信息资源总数之比。检全率=检出相关信息资源量系统相关信息资源总量×100%表示系统检出相关信息资源的能力。一、对信息组织的要求2、检准率(查准率)系统实施检索时检出的与某一检索提问相关的信息资源数与检出的信息资源总数之比。检准率=检出相关信息资源量检出信息资源总量×100%表示检索系统排除与检索提问无关信息资源的能力。一、对信息组织的要求检全率与检准率的关系检全率与检准率之间呈互逆关系检全率%检准率%检索系统对检全率与检准率的权衡,应考虑检索系统的任务、服务对象的需求、信息资源集合的规模等多种因素,并根据使用需要提供选择的可能性。一、对信息组织的要求信息组织系统中有关于“市场营销成功案例”的文献220篇,某用户共检出文献200篇,其中有关的文献160篇,请计算查全率和查准率。查全率:160/220×100%查准率:160/200×100%思考一、对信息组织的要求3、检索速度和系统的及时性检索速度指用户实施检索时获得检索结果花费的时间。这一指标不仅与系统响应检索提问的速度有关,同时也涉及查全、查准等因素,与信息资源的组织是否合理直接相关。系统的及时性指检索工具能否在较短时间内将信息资源纳入系统,尽快提供使用。一、对信息组织的要求4、系统的易用性对标引者而言,指系统是否便于进行描述和标引操作,是否需要掌握复杂的专门技能才能使用,在处理过程中为减少处理差错能否得到各种提示和帮助等。对广大检索用户而言,则是指系统检索是否易于使用,操作是否复杂,是否需要预先学习才能实施检索;检索界面是否友好,是否配备有相应说明,并提供各种具有启发性的帮助等。一、对信息组织的要求5、检索的成本效益指检索系统的成本和效益之比。成本一般指检索系统设备费用、标引处理费用、检索运行费用。效益则是指检索系统的性能及因此产生的效益,包括获取信息能取得的经济效益和社会效益。二、信息组织中的控制与规范信息组织的控制对信息资源的描述控制标引和检索的词汇控制标引和检索的句法控制相关因素控制二、信息组织中的控制与规范描述控制描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。(1)描述项目的控制根据资源特点选择具有组织和揭示价值的资源特征作为描述的项目。描述项目应该充分反映信息资源的基本特征和数据。二、信息组织中的控制与规范描述控制描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。(2)描述文字的控制规定描述信息资源时所采用的文字,应当准确、精炼、统一、规范。二、信息组织中的控制与规范描述控制描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。(3)描述级别的控制规定对信息资源进行描述的详略程度。应根据不同的使用对象和需求、信息资源的特点、设备条件加以确定。二、信息组织中的控制与规范《文献著录总则》规定的三个级别二、信息组织中的控制与规范描述控制描述记录一般概要记录下一资源各种基本特征的数据,可以以浓缩的方式集中反映资源的特征和内容。(4)描述格式的控制包括各种描述项目的次序、描述的标识、描述项目的表达形式等。对此做统一规定的目的是方便不同类型信息系统之间的交流。二、信息组织中的控制与规范卡片著录格式正题名=并列题名:副题名及说明题名的文字/第一责任者;其他责任者.一版次及其他版本形式/与本版有关的责任者.一出版发行地:出版发行者,出版发行年.月(印刷地:印刷者,印刷年)页数或卷(册)数:图;尺寸或开本+附件.一(丛书名/编者,国际标准连续出版物编号;丛书编号)附注国际标准书号;中国标准书号(装订):获得方式提要Ⅰ.题名Ⅱ.责任者Ⅲ.主题Ⅳ.分类号二、信息组织中的控制与规范描述控制根据上述各项控制要求做具体的规定,就形成了各种信息描述规范。二、信息组织中的控制与规范词汇控制词汇控制是根据信息资源标引和检索的需要,对自然语言中的词汇进行选择、规范并揭示其相关性的过程。二、信息组织中的控制与规范词汇控制为什么要进行词汇控制?因为对信息的描述离不开自然语言。但是自然语言做为日常交流的语言,存在很多问题:(1)表达不够精确一致,语词与概念不是一一对应一词多义:e.g.疲劳一词,在医学和物理学领域各自有不同的含义一义多词:e.g.土豆&马铃薯;电脑&计算机词义含糊:e.g.笔记本(本子?便携式电脑?)二、信息组织中的控制与规范词汇控制为什么要进行词汇控制?(2)自然语言词汇没有明确地表达词间关系,很难适合检索系统显示概念间联系的要求。e.g.浮游生物,水生生物,水底生物的关系?水生生物与浮游生物是包含与被包含的关系;浮游生物与水底生物是并列关系等。二、信息组织中的控制与规范词汇控制为什么要进行词汇控制?(3)词汇量过大,给词汇的加工、管理增加困难,在描述信息的选词和检索时确定检索用词都造成困难。鉴于上述原因,一般必须根据检索系统的需要,对词汇进行必要的选择和处理。二、信息组织中的控制与规范词汇控制词汇控制包括下述内容:同义控制词义控制词间关系控制二、信息组织中的控制与规范词汇控制词汇控制包括下述内容:同义控制目的:克服一义多词现象,将同一内容、特征的资源集中在相同的标识下。方法:选定一个规范词,建立用代参照举例:电脑Y计算机计算机D电脑殊途同归二、信息组织中的控制与规范词汇控制词汇控制包括下述内容:词义控制目的:克服一词多义现象方法:加限义词、增设含义注释和范围注释举例:疲劳(生理);疲劳(物理)二、信息组织中的控制与规范词汇控制词汇控制包括下述内容:词间关系控制目的:用于扩检、缩检、改变检索方向方法:设置参照、倒置标题、使用副标题、通过类目体系揭示词间关系举例:害虫C杀虫剂无损检验C无损探伤仪血管F动脉血管动脉血管S血管二、信息组织中的控制与规范句法控制句法控制是指根据信息资源标引和检索的需要,所作出的组词造句的规则,是对检索语词的组合方式的规定。二、信息组织中的控制与规范句法控制为什么要进行句法控制?因为仅有规范的语词是不够的,语词只能表达简单的概念。语词的组合才能表达复杂的概念。特别是信息组织的一种重要方法——主题法,就是通过对相应语词的组配来实现对复杂概念的表达的。但是汉语非常灵活,语词之间的组合方式多种多样,如下例。计算机控制遥感系统对大地测量遥感系统在计算机控制下对大地测量大地测量在计算机控制下通过遥感系统进行遥感系统对大地测量在计算机控制下进行为了以明确、统一的方式对信息资源进行组织,需要对语词之间的组合方式,即句法进行控制。二、信息组织中的控制与规范句法控制句法控制的内容:引用次序辅助符号句式转换二、信息组织中的控制与规范句法控制引用次序亦称组配次序,指复合主题标引和检索时,各个主题因素的组合次序。分类法——指类目划分标准使用次序或组配时不同分面被引用的先后次序。主题法——指字顺标题检索系统中主标题与各级子标题使用的次序。在先组式手工检索工具中,引用次序决定复合主题的类聚方式和排检位置,是进行句法控制的重要手段。二、信息组织中的控制与规范引用次序在等级列举式分类法中——类目划分标准使用的先后次序“美国现代侦探小说集”如何标引?I712456I712.456二、信息组织中的控制与规范引用次序在分面组配式分类法中——组配时不同分面被引用的先后次序标引“中国现代花鸟水彩画作品集”:ME1D3C3B3二、信息组织中的控制与规范引用次序在主题法中——组配时主标题与各级子标题使用的次序主题分面公式:主体因素—通用因素—地区因素—时间因素—文献类型因素研究对象、材料、方法、过程、条件“20世纪90年代汽车工业规划研究文集”标引为:“汽车工业—规划—中国—1990-1999—文集”二、信息组织中的控制与规范句法控制辅助符号亦称组配符号,是检索语言揭示主题概念之间关系、意义,进行检索操作的标识手段。辅助符号是检索系统进行句法控制的重要句法手段,它根据系统的特点和使用需要设置,可分别用于先组式检索系统和后组式检索系统。二、信息组织中的控制与规范句法控制辅助符号关系符号——用于揭示语词组配中形成的关系类型的符号,常用于先组式检索系统。联系符号——用于揭示同一文献主题之间联系强度的专用符号,目的是防止主题词之间出现错误的组配关系,常用于后组式检索系统。职能符号——用以表明主题标识在组配中的句法职能的辅助符号,作用是明确主题标识的句法含义,防止出现错误的组配关系。逻辑组配符号——使用逻辑符号对组配关系实施控制,可以进行各种演算,实施精确查找,常用于后组式检索系统。二、信息组织中的控制与规范句法控制句式转换简单地说,就是转换语词的排列顺序。为什么需要句式转换?因为复杂的主题要提高其被查全率和查准率需要提供多个检索入口;引用次序的选择有可能导致文献的分散。这些问题的解决可以通过句式转换来实现。二、信息组织中的控制与规范句法控制句式转换句式转换的目的是通过对语句中语词位置的变动解决上述两个问题。句式转换的形式通常有三种:(1)轮排转换(2)链式转换(3)分析转换二、信息组织中的控制与规范句法控制句式转换链句式转换在实际使用中,按照基本引用次序确定一种主要款目,然后将不同的轮排形式以参见的方式指向主要款目。三、规范控制的依据信息资源的组织和检索一般是以概念逻辑为工具,以知识分类为基础,根据信息资源的特点和设备条件的状况进行的。因此,要有效地对信息组织进行规范控制必须依据如下三方面因素:逻辑知识体现于主题法的组配和分类法的部分类目确立及归类体现于分类法的类目确立及归类知识分类信息资源组织的特点三、规范控制的依据1、概念及其内涵和外延逻辑知识概念是表达事物对象的特有属性或本质属性的思维形式,是检索系统交流的内容。按照形式逻辑,一个概念一般包括内涵和外延两个方面。概念的内涵指概念的含义,即概念所反映对象的本质属性的总和。概念的外延则是指具有该属性的事物对象,即所包括的范围。三、规范控制的依据1、概念及其内涵和外延逻辑知识概念及其内涵、外延的知识是各种信息组织形式进行标引和检索的基本依据,同时也是检索语言编制时词汇控制的依据。检索语言中语词的选择一般应含义明确,对含义不明确的语词,通常需要通过明确内涵或指明其外延的方法加以限定。三、规范控制的依据2、概念之间的关系逻辑知识概念之间按照其是否存在共有的外延,可以分为相容关系与不相容关系两类并列关系矛盾关系三、规范控制的依据2、概念之间的关系逻辑知识相容关系:至少有一部分外延相同的概念之间的关系。同一关系:具有相同外延的概念之间的关系。包含关系:一个概念在另一个概念外延之中,并且是另一个概念的组成部分。交叉关系:部分外延重合的概念之间的关系。三、规范控制的依据2、概念之间的关系逻辑知识不相容关系:不存在共有外延的概念之间的关系。矛盾关系:外延之和等于上位概念的两个不相容概念之间的关系。反对关系:外延之和小于属概念的两个相互对立概念之间的关系。并列关系:一个属概念下几个不存在共有外延的并列种概念之间的关系。三、规范控制的依据2、概念之间的关系逻辑知识检索语言对词汇进行规范化处理和词间控制时,一般均以上述概念关系为基础进行,包括对等同关系,等级关系,相关关系的处理等。三、规范控制的依据3、概念的限制与概括、分析与综合逻辑知识概念的内涵与外延之间是一种反比关系。概念的概括:减少内涵、扩大外延的过程。概念的限制:加深内涵、缩小外延的过程。概念的综合:通过对子概念的组配,表达复合主题概念。概念的分析:将复合主题概念分解成若干个子概念。三、规范控制的依据3、概念的限制与概括、分析与综合逻辑知识概念范围可以通过对概念的限制和概括来进行调整,这是信息组织的原理;而概念的分析与综合则是实现概念范围的调整的具

1 / 54
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功