第四章检索语言检索语言时检索文献所使用的语言。信息的存储和检索是两个紧密联系的过程,通常在存储和检索过程中要涉及到文献著者、文献标引者、信息检索者和信息用户四个方面的人。这些人因其专业知识、工作经历、地区语言习惯不同,所使用的语言也各有不同。如不采取措施克服语言上的差异,就没有共同语言,就会给信息检索造成极大困难。为了使信息检索过程顺利进行,在信息的存储与检索联系起来,把标引人员与检索人员联系起来以便取得共同理解的语言,这就是信息检索语言。4.1检索语言的基础知识4.2检索语言的类型4.3网络环境下检索语言的发展趋势第四章检索语言4.1检索语言的基础知识任何一种检索语言,无论其表达形式是词、词组还是符号,都是一种用概念及其相互关系来表达文献内容特征的标识系统。检索语言不仅要表达事物的不同概念,还要揭示概念之间的逻辑关系。概念之间的逻辑关系有:同义关系、从属关系、交叉关系、矛盾关系、对立关系等。同义关系表达的概念完全相同。如:马铃薯与土豆;澳大利亚与澳洲。AB从属关系又称上下位关系。其中一个概念完全被包括在另一个概念的外延里。外延较大的称为上位概念,外延较小的称为下位概念。如:信息与知识传播——新闻学——新闻工作者——电视工作者。AB交叉关系概念间有部分外延重合。如:A=技术,B=经济,C=技术经济学ACB矛盾关系两个概念的外延互相排斥,而它们的外延之和等于其共同上位概念的外延总和。如:英语教材——非英语教材,它们的外延之合为教材。AB对立关系两个概念的外延互相排斥,而它们的外延之和不等于其共同上位概念的外延总和。ACB4.2检索语言的类型检索语言的种类很多,由于它们表达主题概念以及提供给用户检索的方式不同,因而就形成了各具特点的不同类型。检索语言描述文献内容特征的语言分类语言主题语言描述文献外表特征的语言题名(书名、刊名、篇名)著者出版事项代码/序号体系分类语言组配分类语言混合分类语言关键词语言叙词语言标题词语言单元词语言分类语言分类语言是用分类号表达各种概念,并将各种概念以学科性质为主加以分类和系统排列的检索语言。我国的分类法主要有“中国图书馆图书分类法”简称“中图法”和“中国科学院图书馆图书分类法”简称“科图法”。国外常用的分类法有“杜威十进分类法”、“国际十进分类法”、“美国国会图书馆图书分类法”。下面主要介绍一下“中图法”“中图法”采用的是拉丁字母与阿拉伯数字相结合的混合小数层累制标记符号。分为5大部类,22个基本大类。每个大类又分成若干类,被划分的类叫上位类,划分出来的类叫下位类,从同一类划分出来的若干个类,称为同位类。每一个类目都给以一个固定号码,这个号码就叫做分类号。利用分类途径查找文献的一般步骤为:1.分析所需查找文献的内容主题;2.判断该主题在分类法中属于哪一大类,然后再从大类一级一级往下寻找,只到查到具体类目为止,记下分类号3.根据检索到的分类号在检索工具中检索,便可查得所需文献。主题语言主题语言是使用词语标识的一类检索语言。它用自然语言中的名词、名词性词组描述事务概念的中心语义。主题语言不管各概念间的相互关系,全部按照字顺来排列。主题词语言包括标题词语言、叙词语言、关键词语言和单元词语言。标题词语言所谓标题词,是指从文献的内容或题目中抽选出来,经过规范化处理,用以描述文献内容特征的词或词组。标题词由标题词表控制,标题词表由标题词按照字母顺序排列组成,使用时,直接按照标题词表所规定的标题词进行查找,象查字典一样。叙词语言所谓叙词,是指从自然语言中优选出来经过规范化处理的名词术语,具有组配功能。叙词受叙词表控制,叙词表中词与词之间无从属关系,都是相互独立的概念单元。检索时,可根据需要选出相应的叙词,按照组配原则任意组合想检索的概念。关键词语言所谓关键词,是从文献的题名、摘要和内容中直接抽取出来的,未经规范化处理的自由词汇。关键词不受词表控。单元词语言所谓单元词,是从文献正文、摘要或题目中抽取出来的、最基本的、不可再分的词。它一般未经规范,也无词表,检索时根据检索课题的内容特征,选取恰当的单元词进行组配检索。4.3网络环境下检索语言的发展趋势在网络时代,检索语言为了适应计算机检索的态势,呈现出2个方面的发展趋势。1分类语言和主题语言向一体化方向发展2自然语言和检索语言综合应用的方向发展