信息组织重点

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第一章1.信息组织的驱动力-信息检索工具的变化(AltaVista)混合型(例如:yahoo、intute等)专题型(例如:博客检索、专业检索)特殊型(图片、地图、ftp等)集合型检索工具(例如dogpile、)2.信息组织(1)概念:信息组织,也叫信息整序,是利用一定的规则、方法和技术对信息的外部特征和内容特征进行揭示和描述,并按给定的参数和序列公式排列,使信息从无序集合转换为有序集合的过程。(2)外部特征:信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征(题名、作者、出版社、日期等)内部特征:信息包含的内容,由主题词、关键词或其它知识单元表达(3)按信息表现形式划分:文字信息组织、图像信息组织、声音信息组织、视频信息组织按信息加工程度划分:一次信息组织、二次信息组织、三次信息组织按信息的传播载体划分:文献信息组织、非文献信息组织3.信息组织的两大思想(两种思想的内容及比较分析)(1)分类方法:根据信息的学科体系特征来序列信息的一种方法体系、类目关系。如《中国图书馆分类法》Yahoo分类目录门户网站分类频道——分类搜索浏览(2)主题方法:根据文献主题特征来组织排列信息的一种方法,由受控的自然语言语词直接表达主题概念。百度,Google——搜索引擎(3)比较分析:分类法系统性强,满足族性检索,符合人们的思维与检索习惯,分类目录浏览主题法直观,满足特性检索,提供了一种直接面向对象、事实或概念的信息组织方法第二章PPT11.分类:是指以事物的本质属性或非本质属性为根据,将属性相同的事物集合成类,将属性不同的事物区别开来的过程。是人们认识事物、区别事物,并在此基础上组织事物的一种科学方法2.分类法的类型(构成原理是重点)(1)体系分类法概念:它是主要依据概念划分与概括原理,将绝大多数表达信息内容及形式特征的概念列举为类目,通过概念的层层划分和隶属,构成一个类目等级体系,一般为每个类目配上相应号码(分类号)作标识的分类工具。特点:按学科、专业集中文献,并从知识分类角度揭示各类文献在内容上的区别和联系,提供从学科分类检索文献信息的途径。(使用最广的分类法类型)不足:体系分类法的类目是列举式的,而要详尽无遗地列举一切事物概念,在事实上是不可能的。体系分类法的类目体系是单线排列的,这也就限制了使一个复杂的文献主题概念得到多向成类的可能性。(2)组配分类法概念:是分类表中只收录简单类目概念,并按分面结构组织和排列类目;分类时,则针对信息内容及相关特征,从若干分面中找出相应的类目(类号)进行组配分类的工具。原理:是基于概念的可分析性和可综合性构成的。一个复杂的主题概念可以用若干个简单概念标识的组配来表达。体系分类法所采取的某些方法(复分表等)已经孕育着组配分类法的胚胎。组配分类法的基本方法,犹如整个分类表全由复分表组成。一篇文献的分类标识,就全由复分表中的号码按照一定的规则构成。组配分类号是分段的,如果将各段调换位置,也不会改变其含义,因此可以实行轮排,达到按任何一个特征集中文献和从多种角度检索文献的目的。(3)组配分类法与体系分类法的差异:组配分类法的分类标识是散组式的,组合的,可以分拆的,诸因素可以变换位置;体系分类法的分类标识是定组式的,固定的,不可分拆的,诸因素不可变换位置。3.分类语言的体系结构(1)宏观结构:即它的各个组成部分及其之间的组织方法、相互联系和作用的方式;微观结构:即类目的构成要素及其组织。PPT21.《中国图书馆分类法》其它:《杜威十进分类法》(DDC)《国际十进分类法》(UDC)《国会图书馆分类法》(LCC)《冒号分类法》(CC)(1)标记符号和标记制度:是采用汉语拼音字母(拉丁字母)与阿拉伯数字相结合的混合号码,采用的标记制度是基本上的层累制。层累制的两个缺点:一是类号位数随类目等级增加,类目愈细,类号愈长;二是类号的容纳性有限,同位类多于所用符号的基数时,需要有变通方法,而且同级号码的中间和前面难以扩充新号。(2)辅助符号(知道怎么回事就行了,看看PPT)推荐符号“a”:有“a”的类号排在不带“a”的相同类号之前总论复分号“-”:“-”排在“0”之前。G25-61,应排在G250之前。组配符号“:”:用于联结两个相关联的主类号,合成一个组配类号。识字教育:党员训练=党员识字教育(3)其他八分法(4)分段及“.”的使用PPT31.网络信息组织分类法(重点)目前,Internet主要以两种方式采用分类法进行信息组织:a)基本以人工标引方式采用现有的文献分类法;b)以人工标引或自动标引方式采用自编的分类系统。2.自编分类系统特点:重视以事物为中心设置类目类目收录范围宽泛多重列类、重复反映排列方式简便直接以语词组织信息更新迅速不足:类目设置缺乏规律性类目归属存在着不合理现象同位类排列不能揭示类间关系横向关系揭示上存在不一致部分类名不确切分类规则有待完善第三章1.(1)主题语言:是一种抽象概念,没有一种具体语言叫主题语言。它用语词来表达各种概念,将各种概念完全按字母顺序排列,而不管其相互关系。包括标题法、单元词法、叙词法和关键词法等。它们统称为主题法系统。(2)标题法、单元词法和叙词法都要对取自自然语言的语词加以规范化,而关键词法一般认为是直接使用自然语言不加规范(也要进行某种程度的规范化处理)。2.主题法的特征:直接以语词作为检索标识以字顺作为主要检索途径以主题为中心集中信息资源通过参照系统等方式揭示主题词之间的关系3.主题法与分类法的差异:主题概念表达的形式与效果不同(直观不通用,通用不直观)标识所揭示信息的角度不同(学科角度、事物角度)标引方法有所不同(分类号、受控词)作用范围有所不同(索引、排架)4.标题语言的特点(美国国会图书馆标题表)特点:(1)用受控的自然语言语词作标识,直观地表达主题概念,直接地标引文献。(2)以字顺序列组织标识,提供直接的主题检索途径,有利于进行特性检索。(3)主要用参照系统间接显示标题所表达的主题概念之间的关系,形成语义网络。它能为选用标题进行标引和检索提供一定方便。(4)按事物集中文献,而不是按学科、专业集中。因此,标题语言适合于从事物出发的检索,不适合于从学科出发的检索,不便族性检索。(如:关于“茶的贸易”、“茶的栽培”、“茶的焙制”的信息,分别用“茶-贸易”、“茶-栽培”、“茶-焙制”标引)。(5)提供先组式的主题标识,标识含义比较明确,选用标识比较容易。但是,多途径检索的可能性较小。(6)标引所用的标题不必都是标题表所列举的现成标题。允许必要时自拟标题表达新的或没有列出的主题概念,适应能力较强。标题的类型:(不用背,结合例子记)(1)单级标题:一个词或者一个词组。肝,肝硬变。(2)带说明语的单级标题。期刊,化学的(3)多级标题。肿瘤-治疗(4)倒置标题。低速飞机飞机,低速(5)带限定词的标题。“图书馆学(辞典)”、“橘(树)”括号内是限定词5.标题表的结构:主表的款目结构和副表区分标题表即标题词表,它是标题词的汇编,是一部标题词典。(1)标题。它位于标题词款目的起始处,决定款目在标题表中的排检位置。标题可以取正写的形式,也可以取逆写的形式(即倒置标题)。(2)标识。它往往是标题对应的分类号或标题词款目的编号(字顺序号)。(3)注释。(4)参照。它包括与标题等价的非标题以及有关的下位标题、上位标题、相关标题以及其他方法指示,用以揭示标题与标题之间的联系,以便用户查词、选词。(5)副标题。有些主标题后带有副标题,可以看成是对主标题含义的限定和对主标题下著录文献的划分。一是复分标题表或副标题表,它相当于分类语言的各种复分表,只供与主表中的主标题结合使用,也叫标题细分表、子标题表;二是复分标题索引,与复分标题表不同,它只是提供直接查找复分标题的字顺途径,没将复分标题从主表中抽出;三是标题分类(范畴)表,它是将主表中的标题按照某种分类体系予以排列,在各类目下列出相应的标题,便于从学科、专业角度出发查词、选词。一部标题表可以没有副表、也可以有一种或两种副表。6.单元词法(1)概念及特点:单元词法脱胎于标题法,它是作为对标题法先组式标识的改革而出现的。单元词语言是主题法系统中的一种后组式语言。同标题法一样,也是以取自自然语言并经过规范化处理的语词作为标识,来表达文献所论及或涉及的事物的。(2)基本原理:任何一个复合概念--完整的、具体的、复杂的概念,都可分解为若干单元概念--更为一般的、单纯的概念,而每个单元概念一般只需用一个单词(单纯词或合成词)来表达。标题法的词组(复词)标题、倒置标题、带子标题的标题、带说明语的标题、带限定词的标题等所表达的任何一个复杂的概念(文献主题),都可用一些单词--单元词的组合或组配来表达。(3)关联符号:(4)不足:由于单元词语言强调标识的单元性,因而对词组的分解实质上是字面分拆,单元词的组配基本上是字面组配。这样,单元词组配时会产生偏差,造成误检。为了解决这个问题固然可以使用联系符号和职能符号,但是,这会增加标引和检索的复杂性。7.叙词语言(1)基本原理:①保留了单元词法单词组配的基本原理。②采用了组配分类法的概念组配来代替单元词法的字面组配,以及适当采用标题法的预先组配方法(即采用词组),以克服某些词分拆后再组配时产生意义失真的缺点。③采用了标题法对语词进行严格规范化的方法,以保证词与概念的一一对应。这是标题法的基本方法之一。单元词法对单元词的规范方法也取自标题法。④采用并进一步完善了标题法的参照系统,采用了体系分类法的基本原理编制叙词分类索引(范畴索引)和等级索引(词族索引),采用了与关键词法类似的方法编制叙词轮排索引,从多方面显示叙词间的相关关系,以保证准确、全面地选用叙词进行标引和检索。概念组配是决定着它的特点和性能的基本原理。(2)叙词表的结构体系:一般是由一个主表和若干辅表构成的。主表是叙词表的主体,包括的内容最全,对每个叙词的著录也比较完备,所以可独立存在。辅表是为方便叙词表使用而编制的各种辅助索引,包括的内容不全,著录也比较简略,所以不能独立存在。(3)叙词表的款目款目叙词项,在汉语叙词表中除了款目叙词外,一般还有其汉语拼音和对应的外语(英语)译名;标注项,包括款目叙词所属范畴的范畴号、款目词的序号、族首词符号、部分款目词的含义注释、历史注释(事项注释)和用法注释等;参照项,最多的包括“代”参照项(非正式叙词)、“分”参照项(下位叙词)、“属”参照项(上位叙词)、“族”参照项(族首词)、“参”参照项(相关叙词),有的叙词只有其中的几项或一项,少数叙词没有参照项,称为“无关联词”。当“属”项参照词为族首词时,一般不重复“族”项参照。8.关键词语言的特点优点:(1)标引时无需主题分析和查看词表,简便易行,因而降低对标引人员的要求,节省了大量人力。(2)标引和索引编制易于实现自动化,从而显著节省时间,大大缩短检索系统信息组织和报导的时差,保证信息报导和传递的及时性。(3)关键词是文献中使用的自然语词,表达主题比较直观、专指,可以保证较高的查准率(查全率不高)。缺点:(1)由于关键词法直接采用文献中的自然语词作关键词,对自然语言中大量存在的等同关系词不加规范统一,也不显示等同关系,使相同主题文献常常因作者用词不同而被分排各处且无联系,导致漏检的可能性较大。(2)关键词法不显示关键词之间的等级关系和相关关系,难以进行族性检索,特性检索的查全率也不高。(3)为了加速和简化检索工具的编制过程,关键词多限于从文献标题中抽取。由于一些标题对文献内容的表达不充分或不准确,会使关键词检索有一定的漏检或误检。(4)在机编索引情况下,由于机械地抽词和轮排,其中有不少关键词款目是不起检索作用而徒增篇幅的。总结:主要掌握主题语言的概念,种类,特点及其3种语言的概念特点及宏微观结构。

1 / 6
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功