3信息资源组织的主题描述语言主题语言用语词来表达各种概念,将各种概念完全按字母顺序排列,而不管其相互关系。2标题词型主题语言(标题法)单元词型主题语言(单元词法)叙词型主题语言(叙词法)关键词型主题语言(关键词法)主题语言对取自自然语言的词语加以规范化检索标志是在编表时就固定组配好,先组式直接使用自然语言不加规范33.1主题描述语言的沿革第一部标准的标题表《美国国会图书馆标题表》1909年诞生。标题法——单元词法——叙词法、关键词法先组式语言——后组式语言列举式语言——组配式语言人工操作——自动处理受控语言——规范化语言与自然语言并用主题语言43.1.1标题词描述语言3.1.1.1标题语言的原理标题语言是最早产生的一种主题语言。标题是主题标目(subjectheading)的简称,是直接表达文献主题的标识,大多是对文献内容所论及事物名称及特征的规范表达。P66众多标题集合而成的主题标识系统——标题语言。5(1)标题的性质P67直接性——用事物的名称直接表达文献主题,直接指出文献内容所论述的事物直观性——采用自然语言受控性——标题只是选择那些可能成为文献主题的事物及较为通用、准确、专指、检索效果好的名称语义关联性——虽然直接表达事物的名称,其位置是由字母顺序决定,但尽可能利用字面成族的机会反映标题之间的语义关系先组性——一个标题可能只有一个部分,也可能是由几个部分组成。当由几个部分组成时,一般是预先组合好了的。示范性——大多数情况下直接从标题表中选择现成的标题,但现成的标题具有示范性,标引人员可以参考现有标题。6(2)标题语言的特点P67自然语言做标识,直观以子顺组织,提供直接的主题检索途径形成语义网络按事物集中文献,而不是按学科、专业集中,适合于从事物出发的检索,不便族性检索。先组式的主题标识,标识含义比较明确允许必要时自拟标题,适应性较强7(3)标题的类型单级标题。如(“肠”)。优点:比较简单缺点:专指性差,一个标题下集中资料太多带说明的单级标题。如:“液压传动,用于机床的”“期刊,化学的”。相当于一个复词标题。表达复杂概念比较自由,可以达到较高的专指度;比较冗长,排列次序不够明确。多级标题。如:“肿瘤-治疗”“-”后的标题称为子标题,子标题下还可有子标题,称为次子标题;次子标题还可以有子标题,再次子标题。一般说超过三级的标题形式很少用。8倒置标题。如:“低速飞机”——飞机,低速。一方面有集中资料的优点,另一面有在检索时难以判别从哪个词入手查找的缺点。带限定词的标题。如:“图书馆学(辞典)”、“橘(树)”、“橘(水果)”。限定词一般都置于括号中。混合标题系统。标题法实践中,常同时采用上述集中标题形式中的若干种。9(4)标题词的范围及选词原则P69标题词的职能是直接地、精确地表达文献所论及或涉及的事物,即主题。凡能成为研究对象者,其“名”在原则上都可以作为标题词。一些泛指性的一般名词术语(如“零部件”、“材料”、“设备”、“设计”、“制造”、“会议”、年代的概念)不能作为主题,而只能作为副标题使用。具有检索意义适当专指度通用性和准确性唯一性103.1.1.2标题表即标题词表,是标题词的汇编,一部标题词典(1)标题表的作用登录经过控制的标题,是标引和检索选用标题的依据。按子顺组织标题和非标题,还用参照系统显示标题之间以及非标题和标题之间的关系。注释和说明提供标引和检索使用标题的方法指示。体现标题控制的原则,提供标题控制的示范。11(2)标题表的结构编制和使用的说明主表副表(3)标题词款目的结构标题标识注释参照副标题123.1.2叙词描述语言叙词语言是种新型的标识语言,综合了在其之前产生和发展的各种语言的优点。133.1.2.1叙词语言的前身——单元词语言P72单元词法脱胎于标题法,它是作为对标题法先组式标识的改革而出现的。单元词法已经发展成叙词法,因而不存在了。单元词法同标题法一样,以取自自然语言并经过规范化处理的语词作为标识。基本原理:任何一个复杂概念都可分为若干单元概念,而每个单元概念一般只需要一个单词来表达,因此标题法的标题可以用一些单词——单元词的组合或组配来表达。14单元词是指一个最小、最基本的词汇单位,是能够用来描述文献所论及或涉及的事物——主题的那些单词。(“氧”、“逻辑”、“马克思”、“乌鲁木齐”,“文字”、“图书馆”、“车床”、“污染”)P72单元词特点:标题是组配构成的,而且是“后组式”的,即到检索时才将它们组配起来。P73后组式标识是单元词法的重要特点。153.1.2.2叙词语言的原理保留了单元词法单词组配的基本原理采用了组配分类法的概念组配来代替单元词法的字母组配采用标题词法对语词进行严格规范化的方法采用并进一步完善了标题法的参照系统。采用体系分类法的基本原理编制叙词分类法,采用与关键词法类似的方法编制叙词轮排索引。16概念组配决定叙词法特点和性能。概念组配与字面组配P74:字面用构词法对词进行分析,概念组配在概念分析的基础上进行概念综合。二者词汇单元不同(“橡胶工业”)如果是字面组配的话则为(“橡胶”和“工业”)因而会产生(“橡胶工业”和“工业橡胶”两种含义)173.1.2.3叙词表(1)叙词表的结构体系一个主表和若干个辅表构成。主表是叙词表的主题,可以独立存在。辅表是为方便叙词表使用而编制的各种辅助索引,包括的内容不全,不能独立存在。18各种排列表或索引:叙词字顺表叙词分类索引叙词等级索引叙词轮排索引叙词双语种对照索引专有叙词索引正式叙词索引和款目词索引叙词关系图叙词表一般以字顺表作为主表,但是也可以把分类表作为主表。19个别叙词表还有以下组成部分:入口词表。收录了大量非叙词,把非叙词单独编成一表,称为入口词表。每个非叙词引向正式叙词。附录。标引手册。20(2)字顺表的款目结构正式叙词:款目叙词项、标注项、参照项、非正式叙词:同上汉语叙词表的款目词一般按汉语拼音顺序排列音节-音调-字形顺序排列法音节-字形顺序排列法逐字母排列法,即字母本位排列法外文叙词表的款目词排列法逐字母排列法逐词排列法213.1.3关键词描述语言3.1.3.1关键词语言的原理是适应目录索引编制过程自动化的需要而产生的。它与标题法、单元词法和叙词法同属于主题法系统,他们都是以自然语言作为标识。但是标题法、单元词法和叙词法都是要对取自自然语言的语词加以严格的规范化处理的,而关键词法则基本不作处理。22所谓关键词,是指那些出现在文献的标题以至摘要、正文中,对描述文献主题内容具有实际意义的语词。P79概括的说,关键词法就是将文献原来所用的,能描述其主题概念的那些具有实际意义的词抽出,不加规范或只作极少量的规范化处理,按子顺排列,以提供检索途径的方法。23原理:P791.直接抽取文献中或题名中的词语作标识,对作为标识的词不加规范或只作极少量规范处理(为了便于计算机处理,对某些符号处理,如数学符号,化学符号)2.不编制受控词表来进行词汇控制,不显示词间关系,只编制禁用词表来控制抽词。(冠词、介词、连词、感叹词)3.每个关键词都是平等的,都按子顺轮流排至检索位置。243.1.3.2关键词索引的类型一般分为两大类:带上下文的关键词索引,包括题内关键词索引、题外关键词索引和双重关键词索引不带上下文的关键词索引,包括单纯词索引、词对式关键词索引和简单关键词索引25(1)题内关键词索引(keywordincontextindex)——又称上下文关键词索引,最早出现的关键词索引形式作为索引入口的关键词,居于中间作为修饰词的上下文,居于关键词前后作为文献地址的文摘号,位于最后26(2)题外关键词索引(keywordoutofcontextindex)是题内关键词索引的改良型索引,它是将检索入口位置放在题名之外,即将检索入口的关键词置于题名的左端或左上方,题名的词序不变,款目依检索入口位置的关键词子顺排序,款目的最后也是文献地址。27如:《论数字图书馆的模式》,若其编号为123,可编成如下3条题外关键词索引款目,依字顺排在相应位置:P81模式论数字图书馆的模式123数字论数字图书馆的模式123图书馆论数字图书馆的模式12328(3)双重关键词索引(doublekwicindex)是指一个款目有两个关键词作双重目标(一个主标目和一个副标目)的关键词索引。29模式模式/论数字图书馆的123图书馆的模式/论数字123数字模式/论数字图书馆的123图书馆的模式/论数字123图书馆模式/论数字图书馆的123图书馆的模式/论数字123篇幅庞大,实用性差30(4)单纯关键词索引款目不包含非关键词,纯粹由多个关键词及文献号构成款目并轮排的关键词索引模式数字图书馆123数字图书馆模式123图书馆模式数字123索引款目的含义明确性差31(5)词对式关键词索引每次只取文献多个关键词中的两个配对构成索引款目并轮排的关键词索引。模式数字图书馆数字123模式123模式123图书馆123图书馆123数字123如果一篇文章有N个关键词,进行全面配对轮排,就会生成N×(N-1)个索引款目,这种索引可以达到较深的标引而不显著增加篇幅。虽然款目的专指性较差,但必要时可进行组配检索。32(6)简单关键词索引只有一个关键词索引。一般每个关键词后有多个文摘号模式123124126129133数字123125126128131图书馆123124127130134333.1.3.3关键词语言的性能作为标引语言和检索语言来说,质量比较差P83直接采用文献中的自然语言作关键词,不统一关键词法不显示关键词之间的等级关系和相关关系,难以进行族性检索,特性检索的查全率也不高为加速和简化检索工具的编制过程,关键词多限于从文献标题中抽取在机编索引情况下,由于机械地抽词和轮排,其中有不少关键词是不起检索作用而徒增篇幅的34尽管有以上缺点,但还是得到了广泛的应用:P84标引时无需主题分析和查看词表,简单易行标引和索引编制易于实现自动化,从而显著节约时间关键词是文献中使用的自然语词,表达主题比较直观、专指,可以保证较高的查准率35当关键词直接用于计算机检索系统时,可以用一种后控制词表来提高查全率。所谓后控制词表是只提供检索的主导表,这种词表实际上是一种同义词、近义词和相关词的集合。检索者可从任一词出发,在后控词表中查到它的一批同义词、近义词的相关词。其是逐渐积累成的,是一种不短增长着的词表。关键词法只有于电子计算机结合起来才有使用意义。汉语一个汉字可以与许多汉字进行不同组合,自动抽词有一定困难。363.2国内外主题语言应用实例3.2.1《汉语主题词表》《汉语主题词表》是“汉字信息处理工程”(“748”工程)的配套项目,由原中国科技情报研究所和北京图书馆主持,1975年开始编制,1980年出版。3卷10册。第一卷社会科学部分2分册1主表2索引第二卷自然科学部分7分册1-4主表5词族索引6范畴索引7英汉对照索引第三卷附表部分只有一个分册37《汉语主题词表》是在专业词汇的基础上编制而成的综合性索引工具书。主要为电子计算机存储、检索文献之用,同时兼顾手工标引与检索的需要《汉语主题词表》标引与检索范围包括图书资料、期刊、论文集、会议录、技术标准登各种印刷型出版物及手稿、缩微复印制品、声象制品、机读磁带制品等非印刷型出版物中所论及的古今中外一切知识与信息资源。383.2.1.1.《汉语主题词表》的选词(1)选词原则主要从社会主意建设出发,贯彻为“四化”服务的原则各个学科领域内经常出现的、在实际检索工作中有一定的作用词义必须明确一般为科学上通用名词词组选定:单一词组,从学科专业角度出发,最小单位;复合词组,固定词组39(2)选词范围具体事物的名词“计算机”学科门类的名词“天文学”事物状态或某种现象的名词“强度”、“导电性”研究与工作方法的名词术语“调查”,“微量分析”