分类法与主题法尤世民2014103565分类法与主题法一、分类法分类系统分为聚类和归类两个子系统:聚类是指按照信息资源的特点和使用需要,通过区分和类聚建立起类目体系的过程;归类是指依据建立的分类体系进行类分信息资源的过程。聚类的结果是建立科学、合理的、类目体系,如各种文献分类法等,聚类是归类的前提条件,是分类组织的重要依据和工具;而归类系统则是聚类系统的具体应用,它体现了聚类过程的实际存在意义。信息资源分类法的类型按照编制方式分为:等级列举式、分面组配式、列举——组配式。(一)等级列举组配式等级列举式分类法是一种将所有的类目组织成一个等级系统,并且采用尽量列举的方式编制的分类法。类目体系组成一个树状结构,按照划分的层次,列举详细类目,以缩格表示类目等级关系,最后形成一个等级链。常见的有《杜威十进制分类法》(DDC)、《中图法》等。(1)杜威十进分类法(DeweyDecimalClassification,DDC)杜威十进分类法是广为全球各地图书馆使用的分类法。这个分类系统最早在1873年时MelvilDewey有此分类构想,而于1876年正式出版。负责DDC出版的是ForestPress,而它于1988年成为OCLC下的一个部门。DDC已被全球超过135个国家的图书馆使用,并且被翻译逾30种语言,包括阿拉伯文、中文、法文、希腊文、希伯来文、意大利文、波斯文、俄文、西班牙文及土耳其文等。在美国,有95%的公共图书馆及学校图书馆、25%的学院及大学图书馆及20%的专门图书馆使用DDC。此外,DDC更能用来组织网际网络上的各种资源。杜威十进制图书分类法于1876年首次发表,历经22次的大改版后,内容已有相当程度的修改与扩充。最新的版本为2004年版。该分类法以三位数字代表分类码,共可分为10个大分类、100个中分类及1000个小分类。除了三位数分类外,一般会有两位数字的附加码,以代表不同的地区、时间、材料或其他特性的论述,分类码与附加码之间则以小数点“.”隔开。例如330表经济学+.9表地区别论述+.04表欧洲=330.94表欧洲经济学。10大分类编辑000-计算机科学、资讯与总类100-哲学与心理学分类法与主题法尤世民2014103565200-宗教300-社会科学400-语言500-科学(指自然科学)600-技术应用科学700-艺术与休闲800-文学900-历史、地理与传记(2)中图法《中图法》即中国图书分类办法,就广义而言,包括《中国人民大学图书馆图书分类法》、《中国科学院图书分类法》、《中国图书馆图书分类法》、台湾赖永祥仿十进分类法(所谓“中国图书分类法”)、《国际图书集成分类法》。就狭义而言,《中图法》是《中国图书馆图书分类法》的简称,是我国目前通用的分类图书的工具,读者掌握了这部分类法的有关知识,便能迅速、有效地查寻全国各图书馆的馆藏。根据图书资料的特点,按照从总到分,从一般到具体的编制原则,确定分类体系,在五个基本部类的基础上,组成二十二个大类。《中图法》的标记符号采用汉语拼音字母与阿拉伯数字相结合的混合号码。即用一个字母表示一个大类,以字母的顺序反映大类的序列。字母后用数字表示大类以下类目的划分。数字的编号使用小数制。现将五个基本部类及下设的二十二个大类列表如下:A马克思主义、列宁主义、毛泽东思想、邓小平理论N自然科学总论B哲学、宗教O数理科学和化学C社会科学总论P天文学、地球科学D政治、法律Q生物科学E军事R医药、卫生F经济S农业科学分类法与主题法尤世民2014103565G文化、科学、教育、体育T工业技术H语言、文字U交通运输I文学V航空、航天J艺术X环境科学、安全科学K历史、地理Z综合性图书等级列举式分类法的特点为:分类结构显示直观,易于把握,便于使用;类目体系展开比较系统,并可作适当等级调整;标记简明,适于分类排架,适于组织分类检索工具。其缺陷在于:揭示专门主体能力差,具有一定的凝固性,不便于调整检索途径和多角度检索,无法根据科学发展自动生成新类,不能保持与科学同步;篇幅较大,管理要求较高。(二)分面组配式分类法分面组配式分类法是指在类目之间完全采用分面结构,将文献的内容分析为若干因素,从分面寻找相应的类号,并按照一定的次序将其排列组配成一个完整的分类号的分类法。最常用的分面组配分类法是冒号分类法(CC)和布里斯书目分类法(BC2)。分类法的基本思想就是将事物分面,任何复合主题都可以分解为基本概念,同时,也可以通过相应的基本概念组合加以表达。分析——综合的原则贯穿分面分类法的始终,分面(组面)就是按照某种分类特征产生出来的一组分面类目。分面的依据主要是主题的范畴体系,分类学家对主题范畴的理解不尽相同。根据阮冈赞的范畴理论,范畴包括五个方面:(1)本体:表示事物对象或事物种类,例如,社会心理学和心理学中的人,宗教中的基督教、佛教等。(2)物质:表示与主题对象有关的材料、载体等,例如音乐类中的乐器、图书馆类中的期刊等。(3)动力或动因:涉及方面比较多,诸如形态、功能、问题、方法、操作、处理以及技术等,例如,经济类的出口、进口,语言学类中的语法等。(4)空间、时间:在不同的基本类下,同一概念因情况变化,可归入不同范畴,例如,期刊在图书馆中归入物质,在目录学类中即是本体。另外,我国还有一种常用的中文范畴理论引用次序进行分面,具体为:(1)主体因素;(2)通用因素;(3)位置因素;(4)时间因素;(5)文献类型因素。分面组配法由分面类表、使用说明、大纲及索引组成,其中分面类表是具体,使用说明、分类法与主题法尤世民2014103565大纲及索引是其重要组成部分。每个大类由若干组面(范畴)构成分面公式,每一组面还可以由细分的亚面构成。如物质范畴还可以分为物质、物质性质、物质方法等;亚面下面还可以细分为类目。组面、亚面、类目系统排列,形成分类体系。例如,冒号分类法中规定的42个大类,其中艺术大类分为建筑、雕塑、绘画、音乐、舞蹈、戏剧等基本类。雕塑又分为风格、形象、材料、技巧等组面;风格再分为亚洲风格、欧洲风格等许多种亚面。大类内排列顺序按照每个大类的分面公式进行,每个大类的分面公式在同一分类法中遵循同一引用次序。分面组配式分类法的表现形式为:类表中按范畴列出各种基本概念(组面),分别配以相应号码,据主题分析,选择基本概念及标识号码,将标识组合、排序(先后次序按照分面公式)。例如,冒号分类法中“2图书馆学”类的分面公式为2[P];[M];[E];[2P],表示其组配次序为:图书馆类型面/资料面/操作面/学科面/时间面。“大学图书馆中的期刊流通工作”这一文献主题,用冒号分类法的类号是234;46:6。从类号可以看出它由三个组面组配而成,其中“2”表示图书馆学,“34”表示大学图书馆,“;46”表示期刊,“:6”表示流通工作。分面组配法的特点为:标引专指,可以通过概念组配,表达复合主题;标记表达性强,便于调整标记次序,多途径检索,易于适应科学的新发展;类目篇幅较小,便于管理和修订。其不足为:分面类表体系不够直观;检索工具中的类目是组配而成的,类目分布不均衡;标引难度较高,专业素质要求较高;分面标记成分复杂,号码冗长,不宜用于排架。(三)列举——组配式分类法列举——组配式分类法是上述两种编制方法的结合,是一种在详尽类表的基础上,广泛采用多种组配式的分类法,亦称半分面分类法。其特点为:以列举式列表为基础,有一定的直观性,广泛采用组配方式,可以达到分面类表同等标引水平;管理列表工作量大,组配符号标记复杂、冗长。该分类法当前以《国际十进分类法》(UDC)和俄国的《图书馆书目分类法》为代表。二、主题法主题法是指直接以表达主题内容的词语做检索标识、以字顺为主要检索途径,并通过参照系统等方法揭示词间关系的标引和检索信息资源的方法。主题法是信息资源的主题整序方分类法与主题法尤世民2014103565法,是主题标引语言的统称。其中,主题词是主题法的主体,主题标引是主题法在信息组织中的应用,因而,各种各样的主题词表是主题法发展演化的主体。在我国,主题词表的发展在其数量上十分可观。例如,《中国中医药学主题词表》、《中国档案主题词表》、《中国分类主题词表》、《教育主题词表》、《汉语主题词表》、《大气科学主题词表》、《广州市人大公文主题词表》、《电力主题词表》、《烟草行业公文主题词表》、《军用主题词表》、《国家汉语主题词表》、《数学汉语主题词表》、《物理汉语主题词表》等。以《中国档案主题词表》为例,该表由前言、说明、主表、范畴索引组成。前言介绍编制目的、过程,适用范围及收词数量;说明阐述选词原则、范围、结构体例及使用的一般方法等。主表亦称字顺表,是正文部分,共收录主题词27288条,其中正式主题词22759条,非正式主题词4529条。非正式主题词是主题词的同义词和准同义词,用来指引和查找正式主题词。词条款目按汉语拼音顺序并结合汉字字形排列。款目结构包括汉语拼音、款目主题词、注释、词间关系、范畴号,但没有英文译词。主表不分为社会科学和自然科学两大部分,而是作为一个整体,也未把组织机构、人名、行政区划名、地理区域等从主表中抽出另编附表。范畴索引亦称分类索引,即将全部主题词按概念属性划分成若干大小类目排列编制而成,与主表间由范畴号加以联系。分类类目最多设3级,是以《中国档案分类法》为基础并结合主题词词目属性而设置的。此外,主表前还设有“主表拼音音节索引”和“词目首字笔划检字表”,以便从不同角度去查寻主题词。国内国外采用的主题法类型很多,一般都具有以下特征:(1)直接选用自然语言中的词语进行标引和检索,而不是像分类法那样采用一种抽象的号码系统作为检索标识。(2)以字顺为主要检索途径,通用性强。虽然主题法往往也采用按范畴、词族等方式组织主题词,但字顺方式始终是它的主要排检依据。我国的主题检索系统通常是根据汉字特点,按照拼音或笔画笔顺进行排检的;在采用机检系统的情况中,一般可以直接输入语词,由计算机进行查找,不必如使用分类法那样,必须预先了解主题词之间关系,因而通用性好。(3)以特定事物、问题、现象即主题为中心集中信息资源。分类法由于受学科体系的限制,从不同学科角度研究同一对象的信息资源是分散在各知识门类中的,主题法则没有这一限制,而是直接从主题对象的角度揭示图书资料,这一特性是由语词标识和字顺排列决定的。以论述茶的文献为例,在分类法中,关于茶的种植、茶的焙制、茶的贸易等主题,一般应按学科分别归入农业科学、工业技术、经济等不同科学部门,而在主题法中,通过语词标分类法与主题法尤世民2014103565识和字顺排列,可以直接在“茶”这一主题下集中予以揭示。(4)通过详尽的参照系统等方式揭示主题词之间的关系。按照字顺排列不能必然揭示主题概念之间的联系,为了克服这一局限,主题法发展了完备的参照系统,通过在主题词下设置用、代、属、分、参等多种参照项,建立起“隐蔽的分类体系”。同时,一些系统还备有词族索引、范畴索引、轮排索引等多种辅助索引,通过各种形式的结合,在主题词之间建立起充分的语义联系。当然各种主题系统中对词间关系的揭示状况是不平衡的,就整体而言,其对主题之间关系的揭示不如分类法。按照选词方法划分,主题法可以分为标题法、元词法、叙词法、关键词法四种。(一)标题法标题法是最早的主题法,是一种以标题词作为主题标识,以词表预先确定的组配方式标引和检索的主题法。其中,标题词是指经过词汇控制,用来标引文献的词或词组,通常是比较定型的事物名称,如图书分类法、信息组织、信息科学等。标题法的依据是标题表,目前最常用的是1909年诞生的《美国国会图书馆标题表》。标题法的优点是:采用列举式词表,形式直观;采用定组式标题,结构固定,含义明确;按照词表列举的的标题和副标题进行标引,操作简便;通过参照方式对词汇进行控制,并揭示标题的相关性。不足:由于采用列举方式,往往造成收词量巨大、专指度相对不足、修订量大等问题;采用定组式标题,无法从多角度多因素检索。(二)元词法元词,是指用来标引文献主题的、最基本的、字面上不能再分的语词。如马克思、图书馆等,元词法是以元词作为主题标识,通过字面