•特征:•1、直接以词语为检索标识•2、以字顺为主要检索途径。•3、以特定的事物、问题、现象,即以主题为中心集中信息资源。•4、往往通过详尽的参照系统等方式揭示主题词之间的关系。•5、主题法在信息资源组织中的作用,主要是用来处理信息资源、编制各种检索工具及检索系统。•字顺主题索引实例(3种方式)•⑴根据藏书类目的类名编制的,而不是根据该类目所收录的每种藏书做成的•《郭沫若文集》主题索引款目为•文学-作品综合集-中国-现代-别集I217.2•《矛盾文集》主题索引款目为•文学-作品综合集-中国-现代-别集I217.2•⑵根据每种藏书编制的,但著录的也是分类号,仍是指向整个类目•《郭沫若文集》主题索引款目为•郭沫若-文学-作品综合集I217.2•《矛盾文集》主题索引款目为•矛盾-文学-作品综合集I217.2•⑶根据每种藏书编制的,著录的是索书号,即指向类目中具体的藏书•《郭沫若文集》主题索引款目为•郭沫若-文学-作品综合集I217.2/G815•《矛盾文集》主题索引款目为•矛盾-文学-作品综合集I217.2/M378•(不是主题目录,没有每种藏书基本编目数据,花费人力和经费较少,与主题目录相比,其主题检索功能相差不少)二、主题法的类型•主题法的类型可以有许多不同的划分方法,按照主题法的选词方式,可分为:标题法、元词法、叙词法、关键词法;按照使用时组配的先后,可以分为先组式主题法和后组式主题法;按照使用时是否进行控制,可分为受控主题法和非受控主题法。•1、标题法•标题法是最早出现的主题法类型,标题是主题标题的简称(subjectheading),是直接表达文献主题的标识,大多是对文献内容所论述及事物名称及特征的规范表达。众多标题集合而成的主题标识系统,就是标题语言。标题语言或用标题语言进行标引的方法叫标题法。•目前使用最广泛的是美国的《国会图书馆标题表》(简称LCSH)⑴标题法的特点⑵标题的类型和结构单词标题:Economics(经济学)Cataloging(编目)词组标题:农业信贷;青少年汽车驾驶员;电视与儿童;图书馆学;加利福尼亚海狮;雪橇与滑雪;动画片中的儿童。复分标题:水果-病虫害;音乐-奥地利;参考书-书目。到置标题:美洲野猪,成化石的;化学,有机;化学,无机;地图,统计学的;知识,社会学的。自由浮动短语标题:[Personalname]infietion,drama,poetry,etc.小说、戏剧、诗歌中的某人[Topicorplace]inliterature文学作品中的某论题或某地[Topicorplace]inart艺术作品某论题或某地[Nameofriver]Watershed某河流分水界•如:Cultureinliterature•文学作品中的文化•Horsesinart•艺术作品中的马•2、元词法,也叫单元词法、元词语言•⑴元词法的后组使用方式主题0123456789030021033035007019055分类0123456789002064055076029标引0123456789010002024055007039040•⑵元词法的特点:•①词表体积小(没有先组词)②标引专指度高(通过灵活组配形式表达主题)③便于从不同主题角度检索(以每个元词作为检索入口)④适合对专指主题进行标引•⑶元词语言的不足•3、叙词法,也叫叙词语言,国内亦称主题词,是从自然语言中精选出来的、经过严格处理的语词作为文献主题标识,通过组配方式表达文献主题的主题法类型,通过规范化处理的,以基本概念为基础的表达文献主题的词或词组。是对单元词语言的直接继承,但克服了单元词语言的不足,吸收并综合了多种标引语言的原理和方法,是能结合计算机使用的后组式语言,是目前主要的受控语言。⑴叙词语言对元词语言的扬弃•对词组的分解是字面分解,组配也是字面组配,易导致语义失真及误检主题:美术学校元词法用:美术学校产生歧义:美术专科学校学校的美术课主题法直接用:美术学校进行标引字面组配概念组配香蕉苹果香蕉+苹果香蕉味食品+苹果胃溃疡出血胃+溃疡+出血胃溃疡+消化性溃疡出血•⑵叙词语言对其他检索语言原理方法的吸收•叙词语言在继承和发扬元词语言的积极因素基础上,还吸收并综合了多种检索语言的原理和方法,主要表现为:•①采用了分面组配分类语言的概念组配来取代单元词语言的字面组配•②适当采用标题语言的预先组配,选用必要的词组,放弃元词语言的标识单元性原则•③采用标题语言和单元语言对语词实行严格控制的方法,以保证概念表达的唯一性•④采用并进一步完善了标题语言的参照系统•⑤采用等级列举式分类语言的原理编制叙词分类索引(范畴索引)和等级索引(词族索引),甚至引入等级列举式分类表实现分类主题一体化•⑥采用关键词语言的轮排方法,编制轮排索引•教材上有表•⑶叙词的概念组配类型•①交叉组配•“心理学”和“教育学”组配表达“教育心理学”•“电视机”和“录像机”组配表达“电视录像机”•“水生动物”和“哺乳动物”组配表达“水生哺乳动物”•②方面组配•“汽车”和“发动机”组配表达“汽车发动机”•“汽车”和“操纵稳定性”组配表达“汽车操纵稳定性”•“图书馆学-关系-情报学”组配表达“图书馆学与情报学的关系”•“粤语-比较-普通话”组配表达“广东话与普通话的异同”•③特称组配•“平面磨床”和“卧式”组配表达“卧式平面机床”•属概念“种差”多出的特征待标引的种概念•“齿轮”和“不锈钢”组配表达“不锈钢齿轮”•⑷叙词组配的作用•三、主题法的特征第二节叙词语言的词汇控制•一、词汇选择•为了保证词汇的选择质量,叙词表对词汇选择原则以及词汇的类型、范围都有明确的规定•1、词汇选词原则(大的框框)•为了保证词汇选择的质量,汉语叙词的选择一般遵守下述原则•⑴叙词的选择,应依据标引和检索的实际需要,并考虑学科或专业领域的现状及发展。选定的词汇,应是在文献检索中有一定使用频率、并能汇集一定文献量的名词术语。对于表达新事物、新学科的语词,应根据其现实需要,结合其发展情况,加以选用。•⑵选择的语词应该念明确,一词一义,符合科学性、通用性的特点,适宜于准确地表达文献主题和检索提问。对于自然语言中的同形异义词、多义词一般不予选入,在确实需要时,应通过限定的方法加以使用。•⑶语词的选择应符合叙词概念组配的特点,要求既能发挥组配的优越性,又能兼顾词汇的专指性,在收入单词的同时也收入一定数量的具有造词功能的词和词组。•⑷选定的语词应符合汉语的构词特点,在词形上符合语词标识的要求,并尽量选用便于字面成族的词。•2、词汇类型•叙词表选词以名词为主,必要时也收入少量形容词。按照反映事物概念数量的不同,收入词表的语词可以分为普通名词和专有名词两种。普通名词是叙词表的基本构成成分,其选词范围包括:⑴表示具体事物的名词术语,如商品、信息资源、汽车、车床、电子计算机、细菌、水稻、原子、反应堆、图书馆、宇宙、海洋等•⑵表示事物材料的名词术语,如塑料、橡胶、人造纤维、感光材料等。•⑶表示事物性质、现象、状态、过程等方面的名词术语,如导电性、耐用性、失真、老化、土壤熟化、日冕、船舶过载、腐蚀等•⑷表示研究方法、工艺、加工技术、操作等方面的名词术语,如调查、总结、铸铁、热处理、爆炸成型、抽样调查、有限元法、质量管理、经济核算等。•⑸表示学科门类、技术部门、理论、定理等的名词术语,如哲学、伦理学、生物学、图书馆学、经济学、遥感技术、水利工程、对立统一规律、万有引力定律等。•⑹表示文献类型的名词术语,如词典、年鉴、百科全书、期刊、索引等•⑺某些具有构词功能的词,如台式、小型、多用途等•表示特定事物的专有名词•⑴地名,如广东省、中国、亚洲、泰山等•⑵民族名和语言名,如汉族、壮族、英语、俄语•⑶时代或年代名,如明代(1368-1644)、二十一世纪、1997等•⑷人名,如孙中山、李时珍•⑸机构、会议等名称,如北京大学、中央电视台、联合国、奥林匹克运动会•⑹产品名称,如F-16战斗机,南京长江大桥•⑺历史事件名称,如辛亥革命、海湾战争、第二次世界大战等•⑻法规、条约名称,如中华人民共和国教育法、中日和平友好条约(1978)等•⑼文献名称,如《资本论》《红楼梦》等•3、先组词的选择⑴应该选用词组(先组词)作叙词的规则①词表涉及领域中使用频率较高的常用词组,一般直接收入词表,如化学工业、高等教育,国际贸易政策、情报检索语言、数据处理等,均直接选入•②一组词分解后其单词的含义会发生变化,产生二义性时,直接选用词组,如燃料电池、全面战争二词分解后,燃料、全面二词的含义发生变化,应直接选入。•③凡有词组分解后其中的一方失去意义,没有实际检索价值,应直接选用词组。如回溯检索、台面二极管二词分解后,回溯、台面两词没有实际检索意义,应直接选入•④对一词组以组配表达产生二义性时,可适当选用词组,如:工业橡胶一词,以工业与橡胶组配,可以工业橡胶和橡胶工业两种意义,一般直接选用•⑤专有名词一般可直接选用,不与分解,例如广州图书馆,北京大学•⑵不选用词组作叙词的规则•①可分解为两个或多个交叉关系的语词的复合词,如:生物遗传学可分解为生物学和遗传学两个表示交叉关系的语词,喷气式垂直降落飞机可分解为喷气式飞机和垂直起落飞机两个表示交叉关系的语词,不应直接选用•②由事物与其方面,包括材料、属性、操作等的概念构成的复合词,一般应予以分解,如水电站设计,用水电站+设计;水稻生长习性,用水稻+生长习性•③由事物与其部分构成的复合词,一般用表示事物整体的词与表示部分的词表示。如:车床润滑系统,用车床+润滑系统,飞机座舱用飞机+座舱•④由专有名词如国家名、地区名、时代名、人名的与其他主题概念组成的复合词,如中国石油工业,李白诗歌创作。但是由专有名词与其他词组成的专门名词除外,如弗洛伊德误差、阿贝尔扩张等应直接选入。•⑤有科学术语与文献类型名称组成的复合词,如计算机词典、固体物理书目等•二、词形控制和词义控制•1、词形控制•自然语言中存在大量涵义相同或大致相同,但字面形式不同的语词。在叙词语言中,则要通过词形控制,消除这种现象。因为,这种现象的存在,会降低叙词检索系统的检全率,也会给叙词的字顺排检带来不便。所以,叙词语言对叙词形式必须进行严格控制。汉表词形控制的主要内容有:•⑴规定语词形体,当一个汉字存在几种形体,如繁简体、异体或未正式公布的简体时,一律以通行的字体为标准,如,储液池(正式叙词),贮液池(非正式叙词)•⑵规定外来语和数字的用法,外来名词术语一般应选用规范的汉译名,但在外文名词术语更为通行时,也可直接选用。例如:FORTRAN语言、BASIC语言、A射线、BCS理论,数字在汉表中视具体情况,有两种形式一是汉字形式,二是阿拉伯数字形式,但同一概念只能选用一种形式表达。四氧化三铁、铀235、135照相机等•⑶规定标点符号的用法,一般只在必要时使用括号、连线、小圆点等符号,其他标点符号除特殊情况外,概不使用。如:静态分析(经济学)、发射管(电子)、九.一八事变、气体—固体界面等均为正式主题词•⑷规定词序,收入词表的复合词一般均采用自然语序,不使用倒置形式。例如用院校图书馆不用图书馆,院校;用控制计算机不用计算机,控制。倒置形式在必要时可作为非叙词收入词表,用于指向相应叙词。•⑸规定外文的词形,主要规定一个外语词有几种拼写形式时,选用比较通行的的一种形式作正式叙词,例如:Catalogue和Catalog之间的选择。单复数形式,要依据所用语种的习惯用法予以选择。在英语中,一般可数名词多用复数,专有名词及表示学科领域、工艺过程,事物属性的词多用单数形式。例如:•Detectors探测仪Chemicallasers化学激光器•Chemistry化学Viscosity粘性•如果一个名词的单、复数分别表示不同的概念,则两者都要作为正式叙词。例如:•Paiting绘画Paitings图画•⑹规定词长,为了使入选的语词适合排检和计算机检索的需要,一般应对词长做出规定,如《汉表》规定词长不得超过14个汉字,过长的语词可用简称或所写等方法处理,使其保持在规定的长度以内。•2、同义控制•在语义