第4讲文献检索策略与步骤2005.7一、文献检索基本要求1检阅要全面,即全面性不仅要广泛查阅自己特定范围内的国内外有关研究成果,而且要把视野放宽,广泛测览特定范围以外的有关研究成果。不仅要搜集与自己观点一致的材料,也要搜集那些与自己观点不一致,或与自己构思相矛盾的资料。不仅要广泛查阅中文资料,同时也应查阅外文资料,以便及时掌握最新的研究资料和动向特别是要着力搜集第一手资料,以保证研究的客观全面。2检阅要认真细致,即准确性通过细读,基本掌握若干年来所研究的领域内讨论过的问题,分歧意见,代表人物和主要著作,主要倾向。要认真推敲观点和论据,并做好记录。从前人分歧矛盾中发现问题:(1)前人的结论可能是正确的,但论据不充分;结论可能是错误的,但研究过程或研究方法可能有启发;(2)前人的争论焦点,可能是问题的关键所在,也可能只在表面现象上争吵不休,并未触及问题的实质;(3)前人的理论依据及史料依据,可能是准确无误十分丰富,也可能是篡改文献,贫乏薄弱得不足为据。我们要通过细致查阅,搞清来龙去脉。常见论据失误:(1)曲解引伸,主观臆断;(2)只知其一,不知其二,或突出其一,忽略其二,断章取义;(3)脱离实际,追赶时尚,将马克思主义词句作为教条,生吞活剥并未真正理解。3勤于积累我们应养成不断学习、善于积累的好习惯,并有意识地培养自己读书治学的能力,掌握查阅文献的方法,逐步积累自己所需要的资料目录。还要善于做摘要、札记、卡片,编制自己的文摘、提要、综述,建立个人资料库,同时又会使用国家的信息库。4善于思索由于文献是在一定的历史条件下产生的,带有时代和个人的局限性,应在批判中继承,在扬弃中创新,必须靠理论思维。在阅读中进行比较、分析、联想和构思,从而产生解决问题的新思路、新观点。二、什么是检索策略含义:针对一定的检索目标,围绕信息检索过程而制订的具体实施计划或实施方案。也即在分析检索提问的基础上,确定检索的数据库、检索的用词,并明确检索词之间的逻辑关系和查找步骤的科学安排。无论是作为一种方法还是一种技术,信息检索都表现为一种过程,该过程始于用户的信息提问,而终于检索结果的输出。三、检索策略步骤明确课题需求、选择数据库主题概念分析编制检索式检索效果评价和调整检索策略(1)分析课题需求,选择数据库分析课题检索的目的开始某一项科学研究需要对课题进行全面的文献普查,选择年限较长,收录较广的相关专业的二次文献数据库,在全面回溯检索的基础上,选出相关的文献,再获取一次文献。为解决某个技术难题,查找关键性的技术资料对这样的课题,可选择工程和技术类数据库或专利数据库。为贸易与技术引进、合资谈判,了解国外市场、产品与公司的行情。查找科学数据库以了解技术的先进性,查找市场、产品、公司等商情数据库以对手的情况。为申报专利或鉴定成果,查找参考依据,以选择国内外专利数据库为主。为撰写论文查找相关文献等,以期刊论文、学位论文等学术研究性的数据库为主。明确课题所涉及的学科范围和专业面根据数据库的主题收录范围进行选择。对文献的新颖性程度的要求选择数据更新周期短、速度快的数据库。用户对检索的查全与查准要求为满足查全要求,就要普查多种数据库,为快速满足查准要求,应选择主题范围最专指的数据库。用户可对检索目标给予可以这样的说明:1)要求高查全率,希望获得所有的相关文章;2)要求高查准率,希望有一定范围的文献量,不限定篇数,但不希望有误查;3)提出某一固定的期望文献量:几篇相关文献;4)有一定比例相关文献量;5)没有特殊要求。(2)主题概念分析对用户的课题进行主题概念的分析,并用一定的概念词来表达这些主题内容,同时明确概念与概念之间的逻辑关系。主题概念分析内容:概念的表达要确切。抓住课题的实质性内容,分析出课题中有几个概念组面。找出核心的概念组面,排除掉无关概念组面,包括意义不大的概念和重复概念。找出隐含的重要概念。如“智力测试”,隐含着“能力测试”、“态度测试”、“创造力测试”等概念。明确概念组面之间的交叉关系,即明确是逻辑“与”、逻辑“或”还是逻辑“非”的关系。(3)编制检索式选择合适的检索用词对于分析出来的每个概念组面,用具体的检索用词来表示,如“学校活动”这个概念可以用具体的“班级活动”、“课外活动”、“学生活动”等检索词来表示。选择合适的位置算符对于每一个概念组面选择出来的检索词,为表达位置关系,可根据各系统的规定,使用位置算符,如,Wn、W/n等。拟定合适的检索式(检索式是上述各步骤和各种检索技术的综合体现,是检索策略的表达形式。)注意概念组配的逻辑关系不要搞错,正确使用布尔逻辑AND,OR,NOT算符。英文检索词的不同表达方式尽量使用截词技术正确使用各种位置算符。注意后缀与前缀代码的限定使用。注意逻辑算符与位置算符的先后处理次序,注意括号的使用。(4)调整检索策略缩小检索范围将检索词限定在篇名或叙词字段中。增加概念,加入AND算符。用时间期限或其它辅助字段来限定。用NOT算符排除无关概念。将AND改为更精确狭隘的位置算符。扩大检索范围增加同义词、相关词,加入OR算符。减少AND或NOT的使用次数。将狭隘的位置算符改成宽泛的位置关系或AND。在文摘或全文字段中检索。必须注意缩小检索范围会降低查全率,扩大检索范围则会降低查准率。(5)检索效果评价查全率是指检索出的相关文献量占系统中所有相关文献总量的百分比,用来反映检索的全面性。查准率是指检索出的相关文献量占所有检出文献总量的百分比,用来反映检索的准确性。查全率P=a/(a+c)ⅹ100%查准率R=a/(a+b)ⅹ100%R:表示查全率;P:表示查准率;a:检出的相关文献量为;b:检出的非相关文献量;c:系统中未检出的相关文献量。查全率的互补数就是漏检率查准率的互补数就是误检率。查全率和查准率也是互补的关系。在一个特定的检索系统中,当查全率不断提高的同时,查准率就会降低,而当查准率提高的同时,查全率又会降低。但当查全率和查准率都很低的时候,两者可以通过检索策略的改善同时得到提高。构造检索策略的主要方法提高查全率采取的策略a.去掉AND联结的非主题词;b.增加用OR联结的相关词;c.利用上位类或上位词检索;d.截词方法;f.同义词控制;提高查准率采取的策略a.利用下位类或下位词检索;b.利用外部特征进行限制检索;c.增加用AND联结的相关词开始提问弄清(明确)问题的实质提问的分析综合处理用情报检索语言表达提问,编制提问检索式和检索提问式切题文献和信息的检索形成检索结果显示检索结果分析结果与提问的相关性结果不相关相关(6)制定检索策略步骤提出检索课题确定检索的主题内容协商检索目标,查全、准等指标选择检索系统和服务方式选择数据库选择检索途经选择检索项选择检索词拟定检索提问方式检索匹配处理浏览检出记录,判别相关性实现了检索目标吗?可以输出检索结果?打印检索结果分析失误原因评价检索效果给出各种反馈信息和调节方法再次浏览检出文献修改检索提问式重选检索途经调节检索项重选数据库或文档重选检索方式调节检索指标修改检索提问是是否否(7)检索策略的动态构造及反馈调整四、制定检索策略应注意问题(1)制定检索策略的基础是弄清信息需要和检索目的对信息需求进行正确分析,可以从信息需求的形式和内容两方面来分析。有关信息的形式需求要明确的问题有:①明确检索目的。②明确所需的文献量。③明确所需文献的语种、年代范围、类型、作者或其他外表特征。关于信息的内容需求要明确的主要问题有:①明确检索课题内容涉及的主要学科范围,这对以后选择合适的数据库很重要。②分析检索课题的主要内容,用自然语言来表达这些内容要求,这是联机检索中较为重要的环节。(2)在明确检索目的基础上,对检索课题进行概念分析。①把您的研究课题转换成一个问题。②把和概念的同义词陈列开来。③把概念放宽,这样可给予您更多检索词组。分析研究课题应该明确以下问题:明确课题的主要内容以及所涉及的知识点(术语集合、术语之间的关系)。明确需要的文献特征:即需要的文献种类、语种、年代以及文献量。明确查询的侧重点:对查新、查准、查全的指标要求。确定所需要的文献应该具备的内外部特征。内部特征所需文献的知识构成、术语构成以及术语之间的关系外部特征文献种类、年代、语种、媒体格式等文献可能出现的网络系统的特点课题检索的类型:查全型:开题报告、综述等查准型:在具体细微的专业问题方面的研究动态型:新技术、新理论的研究查新型:同类研究项目比较专业与数据库专业数据库教育EBSCO:ERIC、Kluwer、光盘网络(人大复印资料)、中国期刊网、维普、PSYCINFO&ARTICLES心理EBSCO:ERIC、PSYCINFO&ARTICLES、光盘网络(人大复印资料)、中国期刊网、维普法政PQDD(UMI)、EBSCO:ASE、光盘网络(人大复印资料)、中国期刊网、维普、Kluwer经济EBSCO:BSE、ISI新兴市场、国研网、PQDD(UMI)、KLUWER、光盘网络(人大复印资料)、Gale:BusinessResourceCenter管理EBSCO:BSE、Kluwer、国研网、光盘网络(人大复印资料)文学Gale:LiteratureResourceCenter、光盘网络(人大复印资料)、中国期刊网、维普语言EBSCO:ASE、Kluwer、Gale数据库、PQDD、光盘网络(人大复印资料)、中国期刊网、维普历史EBSCO:ASE、PQDD、中国期刊网、维普、光盘网络(人大复印资料)、Gale:HistoryResourceCenter(3)注意对课题任务的研究分析课题的内容实质,析出误假主题概念,析出被隐匿的主题概念;在多个主题概念中析出主要概念和次要概念,以及重复概念;在建立检索式时,少用主题概念泛而检索意义不大的主题词;明确主题概念表达的下位与上位概念的关系。(4)选择检索工具,确定检索方法根据检索课题的主题及学科范围选择对口的检索工具(数据库);检索工具选择标准:专业对口,检索途径多,收录范围广。注意对数据库系统的研究:数据库品种繁多,选择适当的数据库,十分必要。准确合适的数据库对联机检索获得理想的效果起着决定性作用。选择数据库具体要注意:根据检索课题的内容范围和要求来选择数据库,主要包括:1)数据库的类型是否满足检索需要。2)数据库的学科专业范围是否相吻合。3)数据库收录的文献类型、文献存贮年限、更新周期是否符合检索需求。4)数据库对文献的描述程度、标引深度、专指度如何等,是否按标准化著录。5)数据库提供的检索入口是否与检索课题的已知线索相对应。(5)确定检索词的基本准则必须能正确反映检索要求;必须符合数据库的检索用词规则;优先选用具有检索意义学科名词术语;多选常用的基本词汇进行组配。提取检索词的要领:选用涵盖主要主题概念的词汇,关键词必须清楚界定研究主题;选用意义明确的词汇,不用一般的、有共通性的词汇;选用实质意义的概念词,不使用过长的词组或短语;选用各学科的专门用语来检索各学科的资料库,不能用一般性的词或通俗用语来作关键词;确定关键词的检索范围:有些数据库有专门的关键词字段;有些数据库的关键词查询范围是题名,或包括摘要等几个主要字段,这些都会影响检索结果。进行文献的主题分析,包括审读文献,划分主题类型和分析主题结构,选直接表达文献主题概念的词表中的正式专指叙词;要利用概念之间的属种关系和相关关系增加检索线索选择主题词要领把握概念的含义注意利用词表属种关系又称上下位关系,包括概念是属概念,被包括的概念是种概念。利用属概念扩大检索途径,可提高查全率,利用种概念缩小查找范围,可提高查准率。相关关系指属种关系以外的具有交叉、并列、对立关系的概念,以及形式与内容、本质与现象、原因与结果等关系。善于利用这些关系,有利于提高查全率。《词表》是文献检索的重要辅助工具,使用时要注意从多角度查词,要充分利用辅助表。当查不到与某个具体概念相对应