检索语言、技术及策略图书馆采编部(图书馆154室)Email:Tangbei@sues.edu.cnTel:67791303唐蓓日星期日上讲回顾信息的各种类型图书、期刊、专利文献、会议文献、学位论文、科技报告、政府出版物、技术标准、产品资料、技术档案、报纸、公共记录信息信息的特点不同信息类型所对应的不同检索工具意义:解决了信息来源的问题日星期日课堂讨论为什么选这门课?小张是机械学院的研二学生,毕业论文方向为“多功能堆垛机控制系统的研究”,导师要求查找一些与论文方向相关的文献资料。小张该怎么去查?章检索语言、技术及策略2.1检索语言2.2检索技术2.3检索方法2.4检索步骤2.5检索效果评价检索语言根据文献信息检索的需要创造出来的一种人工语言,也称受控语言。是依据一定的规则对自然语言进行事先规范,将其编制成表,以供文献标引和检索时使用的语言。其使用的场合不同,检索语言也有不同的叫法。如:在存储文献的过程中用来标引文献,叫标引语言,在检索文献过程中则为检索语言。日星期日描述外部特征检索语言描述内容特征书名、刊名题名专利号、ISBN、文献号代码著者、译者、编者责任者分类语言主题语言检索语言的种类主题语言——主题法主题语言——由受控的自然语言语词直接表达主题概念,按词语字顺排列主题概念,主要用参照系统显示概念之间关系的标引语言。以自然语言的字符为字符,以名词术语为基本词汇,用一组名词术语作为检索标识的一类检索语言日星期日主题语言——主题词的类型标题词、单元词、叙词——规范词指经过控制的,表达文献信息内容的语词,由主题词表来规范。关键词——自由词凡是能概括文献主题或读者需求的、有检索意义的实词都可以作为关键词;没有词表,不是受控制词;适应计算机检索需要。日星期日主题词的构词形式:缩略词单词词组短语含有倒置符的词组——Pipe,Copper含有圆括号的词组——疲劳(材料)日星期日主题词的参照关系——语义网车辆非承载式车体承载式车体卡车载重汽车重型载重汽车轻型载重汽车货车属分关系等同关系属分关系属分关系相关关系日星期日概括主题词的一般方法(1)固定词组概括(2)复杂概念分解(3)主题词替换日星期日针对:概念比较单一的文献需求,可直接用一个固定词组概括表示。•通用的专称、术语例:经济危机、万有引力•复合的概念(字面分解后会失去检索意义或产生歧义)例:剩余价值、猎户星云(1)固定词组概括针对:适于概念比较复杂的文献需求,需要分解后用逻辑组配表示分解原则——“最小概念原则”例:弥雾喷粉喷烟机——弥雾机、喷粉机、喷烟机分解方法——“逐词切割”•划分成具有交叉关系的并列概念例:食品的低温贮藏——食品、低温、贮藏•划分成主体概念和限定概念例:环境污染取样分析——环境污染、取样、分析液压系统油泵——液压系统、油泵(2)复杂概念分解日星期日(3)主题词替换近义词替换法(采用同义词、同义词替代)计算机→电脑客运→旅客运输概念扩大(采用上位词)汽车发动机→发动机概念缩小(采用下位词)信息检索→计算机检索:多功能堆垛机控制系统的研究课堂讨论日星期日概括课题主题时的其他注意事项注意主题概念中含有而课题字面上没有直接表示出来的概念,这些概念可能是用同义词、近义词或具有从属关系的词表示的。注意同一概念可能用不同语词表示的情况。名牌、商标我国、国内如:中国市场的品牌效应分类语言分类语言是指用分类号和类目表达文献主题概念的检索语言。分类号可以是数字、字母或字母与数字的结合。G252.7五级类目四级类目三级类目二级类目大类(一级类目)如:《信息检索与分析利用》——G252.7日星期日中外图书分类法世界三大图书分类法《杜威十进分类法》(DDC)(DeweydecimalClassification)《国际十进分类法》(UDC)(UniversalDecimalClassification)《国会图书馆图书分类法》(LCC)(Librarycongressclassification)中国图书分类法《中国图书馆分类法》(中图法)《中国科学院图书馆分类法》(科图法)《中国人民大学图书馆分类法》(人大法)日星期日我国目前的分类法是建立在学科分类体系上的,属于体系分类法。它是将全部文献按其性质分为几个主要大类,把相同的文献集中在一起,相近的文献连接在一起,并将它们按由一般到具体的逻辑顺序加以排列,从而组成一个系统。换句话说,就是先将文献归入某一大类,然后按第二级类目、第三级类目......层层划分下去,直至划分到能准确反映文献内容的那一级类目为止。中图法日星期日《中国图书馆分类法》《中国图书馆分类法》是我国图书分类法的基础,中图法把一切知识门类按“五分法”分为:马列、毛泽东思想;哲学;社会科学;自然科学;综合性图书这五大部类。在此基础上建成由22个大类组成的体系系列。表2-1《中国图书馆分类法》基本大类表A马克思主义、列宁主义、毛泽东思想N自然科学总论B哲学法律O数理科学和化学C社会科学总论P天文学D政治Q生物科学E军事R医药、卫生F经济S农业科学G文化、科学、教育、体育T工业技术H语言U交通运输I文学V航空航天J艺术X环境科学K历史地理Z综合性图书表2-2文学类的类目设置Ⅰ文学Ⅰ0文学理论Ⅰ1世界文学Ⅰ2中国文学Ⅰ3/7各国文学Ⅰ22诗歌、韵文Ⅰ23戏剧文学Ⅰ24小说Ⅰ25报告文学Ⅰ26散文Ⅰ27民间文学……………..Ⅰ222古代至近代作品(~1919年)Ⅰ226当代作品(1919~1949年)Ⅰ227现代作品(1949年~)Ⅰ227.1自由诗Ⅰ227.2抒情诗Ⅰ227.3叙事诗Ⅰ227.7格律诗Ⅰ227.8词Ⅰ227.9其他日星期日从属关系:下位概念具有其上位概念的属性下位类目的含义要通过其上位类来理解上位概念包含其所属的各级下位概念从属关系为通过移位进行缩检索和扩检提供了便利并列关系:并列概念之和等于其直接上位概念并列类未能枚举出所有同级类目,则最后一个并列类目应该是其他类相关关系两个类目在概念上具有相似性,但不属于同一上类位。类目含义的理解日星期日从属和并列关系实例:B哲学(上位类包括下位类,下位类从属于上位类)B0哲学理论B1世界哲学B2中国哲学•B20唯物主义与唯心主义•B21古代哲学•B22先秦哲学(并列类之和等于其直接上位类)•B232秦代哲学•B234汉代哲学产品、商品装璜J524.2包装TB一般工业技术TB48包装工程TB482包装设计TB482.2结构设计(袋、盒、罐等容器设计入此)TB484包装材料(总论包装材料及其包装技术入此)TS轻工业、手工业TS0一般性问题TS09包装装璜技术年9月8日星期日书架的顺序A马列毛邓B哲学宗教………………X环境、安全科学Z综合图书按中图分类法的排架年9月8日星期日分类途径的优点具有族性检索的功能,查全率较高。以学科分类为基础,容易被人们接受和应用适用于信息需求不很明确时的闲逛搜索日星期日分类途径的缺点不适用于特性检索,查准率比主题词低不能适应学科发展中的变化,难以反映新学科和新名词术语人的认识不统一,往往造成分类不一致及排检错误,不易反映交叉学科。日星期日主题途径的优缺点优点:1、适合特性检索,查准率高•例如主题词“C语言—程序设计”就比分类号TP312表达得更准2、能将不同学科的信息集中到一起缺点:1、通常不适合族性检索,查全率比分类号低2、由于很规范,非专业人士难以掌握例如图书《C++Builder5程序设计》应该用“C语言—程序设计”作为主题词。检索大学教材,“大学”不能作为主题词,应该用“高等学校”作为主题词。非专业人士不知道哪些词汇能作为主题词。数据库检索技术布尔检索截词检索限制检索位置检索布尔检索也称布尔算符,用来表示两个检索单元之间(检索项)之间的逻辑关系。AND(逻辑与,可用﹡表示)OR(逻辑或,可用+表示)NOT(逻辑非,可用-表示)逻辑与用于组配不同的检索概念,表示概念交叉和限定。用以缩检,减小范围。运用逻辑与组配检索可以提高查准率,降低误检率。AANDB;A*B注意:(不能用)AB概念等同的词从属概念的词不相邻的词逻辑或用于组配具有从属关系和等同关系的词;表示概念的并列关系;扩大检索范围,提高查全率,降低漏检率。AORB;A+B异形同义词缩写和全称商品名、俗名、学名英文同根词注意:BA日星期日逻辑算符注意事项针对存在整体和部分关系的检索如果检索词涉及到表达整体的概念,就要针对具体情况分别列出每一个表达部分概念的检索词,否则将出现漏检。OR逻辑处理原则:“检索关于欧洲能源问题的文献”欧洲AND能源但欧洲无法代表英国、法国、意大利等能源也无法代表煤、石油等(欧洲OR英国OR法国OR意大利OR…)AND(能源OR煤OR石油OR…)月