文献标引工作概念把自然语言(即文献的书名、篇名或正文中著者等所使用的语言)转化为可控的人为语言(即情报检索语言)。文献标引的目的及意义根据文献的内容特征和外部特征进行分析,确定检索标识,构成检索款目,提供较多的检索点。揭示文献的内容特征,要客观地、正确地、合理地、专指地揭示文献的学科内容,要注意实用性、针对性,保证标引结果的一致性。通过标引人员把文献和文献用户联系起来,使用户能在大量的文献中,全面、准确、迅速地查找到特定的文献。文献标引的方式1)分类标引——以文献内容的学科、专业属性为主要依据进行标引。(以分类表为依据——《中图法》)2)主题标引——以文献研究的对象为主要依据进行标引。(是说明文献主题构成因素之间关系。以主题词表为依据——《汉语主题词表》、《中国分类主题词表》)主题标引与分类标引的异同主题标引与分类标引一样,都是揭示文献主题内容的方法,所以它们有许多共同点。例如在标引过程中均需对文献进行主题分析,而且一般都要以预先编制好的、反映主题概念的工具——分类表或主题词表为依据。就这种意义来说,分类法也可视为广义的主题法。主题标引与分类标引之间也存在着明显的差异。例如分类法用的是号码标识,即分类号作为文献的主题标识。而主题法采用的却是语词标识,即经规范的自然语言——主题词,作为文献的主题标识。因此在主题概念的表达方面,主题法比分类法更直观。关于主题概念的组织,分类法依据的是学科体系或逻辑体系。其主题间的内在关系是通过上下位类、同位类、交替类目、参见类目以及类目注释来显示。分类法的系统性、等级性,使它具有便于族性检索、浏览检索,并可根据检索需求进行扩检与缩检的突出优点。主题法按照语词的字顺来组织主题概念,其主题间的内在关系主要是通过词间的用代、属分、相关关系等方式来显示。主题词的选词范围主要包括表示各种事物及其属性的普通名词和表示某一特定事物的专有名词。甚至可以对某个特定事物直呼其名,依名检索。因此主题语言要比分类语言更专指、更适合于特性检索。主题标引1.1.主题标引的定义根据文献具有检索意义的内容和其它特征,赋予相应语词标识的过程,称为主题标引。1.2.主题标引的作用主题标引的目的是建立主题检索系统。以主题标引为基础的主题检索是用户查找、检索文献的重要途径。主题检索以其直观、专指以及特性检索之特点必将在资源的发现与检索中发挥越来越大的作用。1.3.主题词法及其类型目前在国内外常见的主题法中依组配程序分,有先组式主题词法与后组式主题词法两种。在先组式主题词法中,又有定组式主题词法与散组式主题词法两种。依选词方法分,则有标题法、元词法、关键词法和叙词法。先组式主题词法,意指表达文献内容的主题词在查找文献前已经组配好的主题法。它有两个分支:其一是定组式主题词法,意指表达文献内容的主题词在编制主题词表时已经组配好的主题法:其二是散组式主题词法,意指表达文献内容的主题词在主题词表上不预先组配好,而只是在进行文献标引时才加以组配的主题词法。后组式主题词法,意指表达文献内容的主题词在查找文献时才进行组配的主题法。1.3.1.标题法是主题法中最早出现的一种,属于先组定组式主题词法。其文献的主题标识是经过严格规范的先组定组式标题,如美国《美国国会图书馆标题表》(LibraryofCongressSubjectHeadings,简称LCSH)。由于标题形式的先组定组,所以标题表在使用方面就显得复杂且缺乏灵活性,同时也不能摆脱企图列举一切标题的局限。1.3.2.元词法是以元词作为文献主题标识的主题词法。它以最小的字面单元——元词来标引文献,通过元词的组配来检索文献。所谓“最小的字面单元”,是指在字面上不能再分的词,如果再分,这个词就不能正确表达一个独立、完整的意义。例如:“雷达”,不能分成“雷”与“达”一样。元词法的基本原理是单词组配,但是元词法的字面组配的结果却容易造成“歧义性”。例如:“学校”与“体育”这两个元词,可以组配成“学校体育”和“体育学校”这两个完全不同的主题概念。1.3.3.关键词法是指直接从文献内容中抽取关键词作为文献主题标识的主题词法,它具有标引速度快,编制检索工具简便的特点,是应索引编制自动化的需求而产生的。目前,这种不用受控词表、不用主题分析、不用人工标引的关键词法正随着网络电子资源的急剧增长而迅速发展。然而,由于关键问的非受控性,大大影响了它的检准率和检全率。1.3.4.叙词法是以叙词作为文献主题标识的主题词法。所谓叙词,是指从文献内容中抽出的能够概括表达文献内容基本概念的名词或术语。也就是说,它是一种从自然语言中精选出来的,以基本概念为基础的受控词汇。叙词法采用后组式的概念组配来标识文献主题,因此它比元词法、标题法以及关键词法都更加优越,成为当代文献标引和检索的主流工具。《汉语主题词表》就是这样一部大型的综合性的叙词表。1.3.4.叙词法1)叙词的概念2)叙词的规范3)叙词的专指性4)叙词法概念组配的三种方法5)叙词的概念组配原则1)叙词的概念从概念的外延分,可分为专指概念和普通概念。专指概念,反映某一特定事物的概念,只包括一个对象。例如:毛泽东、《湘江评论》等。普通概念,反映一类事物的概念,包括许多对象的集合。例如:国家、民族等。1)叙词的概念从概念的内涵分,可分为具体概念和抽象概念。具体概念,反映具体存在的事物的概念。例如:桌子、电子计算机等。抽象概念,反映事物属性的概念。例如:科学性、可靠性等。从概念间的关系分,可分为属、种概念、同一概念、相关概念。属、种概念,指两个概念,其中一个概念的外延被另一个概念的外延所包含。例如:数学与高等数学,其中数学就是属概念,而高等数学则是种概念。同一概念,指在外延上完全重合,并具有同义关系的两个概念。例如:晶闸管与可控硅:单车、脚踏车与自行车等。相关概念,指除了属种概念和同一概念之外的,具有某种密切关系的两种概念。例如:因果关系、比较关系、影响关系、应用关系等。从概念的结构分,可分为单一概念和复合概念。单一概念,表达一个完整的意思,在结构上不可再分。例如:雷达,就不能再分成“雷”与达”。如果那么分,在概念上就会产生歧异,就会导致意义失真。复合概念,在结构上可以分解为两个以上分概念的概念。例如:高空超音速飞机,可以分解为“高空飞机”和“超音速飞机”。2)叙词的规范叙词的规范主要分为四种,即同义规范、词义规范、词类规范与词形规范。同义规范,是指对自然语言中的同义词、准同义词进行规范。例如:激光与莱塞;马铃薯与土豆等。词义规范,是指对多义词、同形异义词的规范。例如:六书(汉字造字法)、六书(汉字书法);褪色(植物病害)等。词类规范,是指叙词的选词范围,主要控制在具有实在意义的名词(含动名词)的范围。例如:光盘、收音机;组织培养、驱动程序等。词形规范,叙词的词形规范包括对它的字面形式(词、繁简体)、标点符号、字母符号和数字等方面的控制。例如:“超音速歼灭机”,不能写成“歼灭机,超音速的”:“托尔斯泰,L.N.:MOS存储器”;“900偏转显象管”等在标引与检索时都应以词表中的形式为准。3)叙词的专指性因为叙词法是直接从文献内容中选词,并采用组配的方法来描述主题。所以,无论文献的主题如何专深,也无论其主题的学科性质如何复杂与交叉渗透,只要真正具有检索意义,一般都可以根据需要,或者直接将其选为主题词,或者通过组配加以表达。4)叙词法概念组配的三种方法交叉组配:指使用两个或两个以上的交叉关系叙词有组合,以表示一个新的复合概念的组配。也称并列组配。限定组配(也称方面组配)是将某一表示事物的叙词和表示事物某一属性或某一部分、某一方面的叙词所进行的组配。联结组配表示两个或两个以上主题概念之间一定联系的组配。5)叙词的概念组配原则叙词具有概念特征,因此叙词对文献主题概念的揭示往往更准确。每一个叙词都是作为主题组配的一个基本概念单元被选进叙词表。就这个意义来讲,叙词语言是一种组配性质的语言。其组配原则一般应遵循以下几点:组配必须是概念组配,而不能采取单纯的字面拼合组配或随意组配。例《胃外科手术图谱》应标引为:6060#$a胃疾病$A[拼音]$x外科手术$j图谱而不能标引为:6060#$a胃$A[拼音]$x外科手术$j图谱组配标引应优先选用在概念上具有交叉关系的交叉组配方式,在不能采取交叉组配方式时,才考虑采用限定组配方式。例《介质光波导》应标引为:6060#$a介质波导$A[拼音]$x光波导而不能标引为:6060#$a介质$A[拼音]$x光波导组配必须选用与文献主题关系最密切、最邻近的主题词,不能选用泛指的主题词进行越级组配。例《国际航空运输》应标引为:6060#$a国际运输$A[拼音]$x航空运输而不应标引为:6060#$a交通运输$A[拼音]$x国际运输或者:6060#$a交通运输$A[拼音]$x航空运输组配必须概念清楚、确切,只能具有一个含义。若组配的结果具有多个含义时,应考虑改用上位或近义的主题词标引,或者是增补新的专指主题词标引。例《知识经济浪潮》靠词标引为:6060#$a技术经济学$A[拼音]$x概论增词标引为:6060#$a知识经济$A[拼音]$x概论而不应用“知识”和“经济”组配标引形成以下两个概念歧异的标目:6060#$a经济$A[拼音]$x知识$x概论或6060#$a知识$A[拼音]$x经济$x概论组配次序依据国家标准《文献叙词标引规则》(GB/T3860-1995),叙词的组配次序为:“主体因素(A)一通用因素(B)一位置因素(C一时间因素(D)一文献类型因素(E)”。但随着近年来主题标引技术的发展,在标引实践中,其组配次序演变为:“主体一方面一空间一时间一文献类型”,并且此种做法在业界已经得到普遍的认可。所以,在机读目录格式中,论题性主题606字段的子字段次序应为:$a主体因素$x方面因素$y空间因素$z时间因素$j文献类型因素。关于“通用因素”演变为“方面因素”的问题,是与CNMARC6XX字段中$x应用变化相关。原$x为“通用复分”,现为“学科主题复分”或“论题复分”。就是说对于一般文献而言,$a应指主要研究对象,学科主题,即主题标引中的主体因素。$x是指附加于主题标目,以进一步说明该主题标目所描述主题的方面,故为方面因素。“通用因素”的概念应包含于“方面因素”中。例1《21世纪中国农业与农村经济》6060#$a农业经济$A[拼音]$x经济发展$x研究$y中国$z21世纪例2《1998中国城市统计年鉴》6060#$a城市经济$A[拼音]$x统计资料$y中国$z1998-#$j年鉴注意:1)在编文献的主题所涉及范畴不一定全部包括这五个方面,要视具体情况而定。例《中国明代风俗习惯》,只涉及到三个方面:风俗习惯(主体因素)一中国(位置因素)一明代(时间因素)。2)关于“主体因素”,应视不同文献所论述的主要对象而定,不能机械地照搬。一般而言,文献学科内容的主题概念是标引的主要对象,地区、时间、文献类型等作为标引的次要对象。但当地区、时间、文献类型等是文献的主要研究内容时,则应作为标引的主要对象。例1《汕头:黄金海岸的明珠》(位置面做主体因素)例2《年鉴学概论》(文献类型面做主体因素)3)关于方面因素中的通用因素的标引,如果在揭示文献内容方面的意义不大,则无需标引,例如“研究”这个标引词,目前就用得很泛滥。