文献检索策略的构建一、检索策略的构建检索策略是根据检索课题的具体要求而制定的一套具体、合理的检索方案。正确制定检索策略,优化检索过程,有助于取得最佳的检索效果。检索策略的制定是否合理,以及在检索过程中能否根据实际情况随时修改原有的策略,使之更加完善,都会直接影响检索结果。分析检索课题,明确检索目的选择检索方式和数据库确定检索途径与检索标识编制检索提问式执行检索式浏览检出文献,评价检索结果调整检索策略输出检索结果转录、复印等YesNo(一)分析研究课题,明确检索目的分析研究课题的目的在于明确检索内容和具体要求。为此,应对课题的背景、以知条件、以及要解决的问题及要求等进行认真分析,明确所需文献的范围、类型、文种、时间、空间、输出方式等。(二)选择检索方式与数据库1、检索方式(机检)的选择1)脱机检索2)联机检索3)光盘检索4)网络检索2、数据库的选择数据库是指在计算机存储设备上按一定方式存储的相互关联的数据集合。选择数据库时要充分考虑到:①学科专业范围是否适用;②收录的文献资料是否齐全;③揭示的文献特征是否准确和深入;④报道时间是否迅速;⑤使用的语种是否熟悉。等等。1)数据库的类型①文献型数据库书目型数据库(题录、文摘)全文型数据库②事实型数据库(PDQ等)③数值型数据库(GenBANK,PTECS等)④图像型数据库⑤混合型数据库2)数据库的结构数据库的基本结构主要由文档、记录、字段三个层次构成。①文档(File)数据库可以由一至多个文档构成。文档按其编排结构和功能的不同,可分为顺排文档(Sequentialfile)和倒排文档(Invertedfile)。顺排文档是若干个记录构成的信息集合。在书目型数据库中,它以文献记录作为信息存储单元,按记录入藏的顺序号从小到大排列。它相当于印刷型检索工具的正文部分。倒排文档是从顺排文档记录中抽取出的、以每一个文献特征标识作为信息存储单元,按一定顺序排列,并在每一个标识后注明相应的文献记录顺序号。不同的文献特征标识的组合就构成了不同类型的倒排文档。如著者倒排文档等。它相当于印刷型检索工具的辅助索引部分。②记录(Record)记录是构成数据库的一个完整的信息单元,由若干个字段构成。每条记录都描述了与原始信息有关的各种特征,这些特征(字段)为判定检索结果是否符合检索需要提供了依据。书目型数据库中的一条记录相当于一篇完整的文献;其他类型数据库中的记录则是某种信息单元,如一组理化指数、一种治疗方案等。下面是MEDLARS系统中的MEDLINE数据库的一条文献记录:AU—GINGRASSDJ;MESSERRJTI–-ASIMPLIFIEDTHCHNIQUEOFINFEIORBORDER……AB—THEINFERIORBORDERWIRE,ASORIGINALLY……LA---ENGMH--*BONEWIRES;HUMAN;MANDIBLE/*SURGERYAD—DEPARTMENTOFORALMAXIL—LOFACIALSURGERY,MEDICALCOLLEGEOFWISCONSIN,MILWAUKEE.SO---ORALSURGORALMEDORALPATHOL2002;81(4):264……③字段(Field)字段是构成记录的基本信息单元(数据项),是对原始信息的具体属性进行描述的结果。书目型数据库中的字段是描述文献内外特征的各项标识内容,如标题字段、著者字段、文摘字段等。每个字段都有各自的字段标识符(fieldtag),以供识别其所表达的文献特征,例如:标题字段的标识符为TI、著者字段的标识符为AU等等。字段标识符也参与构建检索策略。检索系统>数据库≥文档>记录>字段(三)确定检索标识与检索途径确定检索途径取决于两方面的条件:一是待查课题的已知条件和检索内容的要求;二是使用的检索工具(数据库)所揭示的文献各种特征是否准确和深入。不同学科、不同类型的检索工具采用不同的文献特征来标引文献,形成不同的检索标识而提供不同的检索途径。1、文献检索语言(检索标识)文献检索语言(Documentlanguage是来描述文献特征和表达检索提问的专门语言,即根据检索需要而创建的统一文献标引用语和检索用语的一种人工语言。检索语言既是汇集、组织、存储文献标准,也是检索提问时所利用的手段及工具。1)文献检索语言主要类型:①描述文献外表特征语言书刊题名著者姓名文献序号②描述文献内容特征语言分类语言主题语言(主题词、关键词等)代码语言2)检索词典(Retrievalthesaurus)检索词典是文献标引用语和检索用语的语源和依据性文本。它是对各学科中的名词术语、概念、代码、分类号等进行规范化的记录,起着对检索语言规范控制作用。常见的检索词典是各种分类表和主题词表。例如:《中国图书馆分类法》和《医学主题词》表(MeSH)/《Thesaurus》。2、检索途径(1)著者途径这是利用已知著者姓名(团体机构名称)作为检索标识进行查检文献的一种途径。它适用于了解国内外某著者或团体机构所发表的文献内容及其所研究课题的最新进展情况。使用著者途径检索文献的关键在于熟悉著者姓名在索引中的编排规则。(如姓名顺序、音译、排序)(2)分类途径这是利用检索工具所采用的特定分类体系中的分类号或分类类目作为检索标识进行查检文献的一种途径。它能较好地满足按类检索文献的要求,适用于按学科概念检索文献。使用分类途径检索文献的关键在于熟悉检索工具所采用的特定分类法。(3)主题途径这是根据能反映文献主要内容的主题(包括主题词和关键词等)作为检索标识进行查检文献的一种途径。它具有较强的专指性和直接性的特点,适用于查找内容比较具体、专一的文献。使用主题途径检索文献的关键在于能够选准代表所需文献主题内容的检索词。***选用主题词时应注意的问题:1.选用主题词,应从事物的“专有名词”来考虑,不要从“过程词”来考虑。如“肾结石的诊断”“肾结石/诊断”2.选用主题词的概念要恰如其分,不能太广或太狭。3.利用MeSH表或Thesaurus将非主题词转换成可供检索使用的正式主题词。包括同义词、近义词、简称与繁称和俗名与学名等。例如:cancerneoplasms怀孕妊娠、子宫纤维瘤子宫平滑肌瘤4、要注意主题词的倒置形式。过敏性休克休克,过敏性5.主题概念的分析与转换①隐性主题分析“为乳腺癌服务的工作组织”“癌监护组织”“办公室吸烟对他人有害”“吸烟污染”②主题概念分解转换“胃十二指肠溃疡”应转换成“胃溃疡”和“十二指肠溃疡”两个主题词③注意英文同义词(解剖名词)的主题词胃gastric,stomach、心heart,cardio-眼eye,ocul-,ophathalm-、肝liver,hepat-6.没有相应主题词时,可采用靠词或上位词检索靠词检索:“上消化道出血”“胃肠出血”;“红细胞存活”“红细胞衰老”上位词检索:“污水处理”“废弃物处理,液体”7.可使用副主题词与主题词进行组配“肝疾病的早期治疗”“肝疾病/治疗”8.要注意主题词与副主题词组配范围的限定肺/诊断肺炎/诊断9.已有先组的主题词,不用组配“维生素A缺乏症”“维生素A缺乏症”,“维生素A/缺乏症”10.不能越级组配“胆囊炎的B超诊断”“胆囊炎/超声检查”“胆囊炎/诊断”举例:“加压素治疗休克引起冠心病”显性主题:休克/药物治疗、加压素/临床应用、冠心病/化学诱导隐性主题:加压素/副作用(四)编辑检索提问式***检索提问式是用户向检索系统表达文献需求的句式。检索提问式有简单提问式和复合提问式。后者含有两个或两个以上的检索词,表达多维概念的检索,要用检索运算符号相连接。检索系统中常用的检索运算符号有以下几种:1.布尔逻辑运算符用来表达检索词之间或检索词与检索式之间的逻辑运算关系。这种概念组配是检索系统使用最为广泛的检索技术。常见的布尔逻辑运算符有“逻辑与”、“逻辑或”和“逻辑非”3种,其符号分别为“and”、“or”和“not”(有的数据库则分别用“*”、“+”和“-”或“andnot”来表示)。它们的逻辑运算关系如下图所示:AAABBABAandB逻辑与AorB逻辑或AnotB逻辑非1)“逻辑与”运算这是具有概念交叉关系或限定关系的一种组配。它要求检索出的文献记录必须同时含有检索词A和检索词B。例如:“吸烟与肺癌的关系”检索式为:吸烟and肺癌smokingandlung-neoplasms“逻辑与”的作用是缩小了检索范围,提高查准率。2)“逻辑或“运算这是具有概念并列关系的一种组配。它要求检索出的文献记录中含有检索词A,或者含有检索词B,或者同时含有二者均为命中文献。例如:“食欲亢进与过度饮食”检索式为:食欲亢进or过度饮食hyperphagiaorovereating“逻辑或“的作用是扩大了检索范围,提高查全率。3)“逻辑非“运算这是具有概念排除关系的一种组配。它要求检索出的文献记录是在检索词A的记录中去掉含有检索词B的记录,即排除了不希望出现的文献记录。例如:“非儿童性白血病”,检索式为:白血病not儿童“逻辑非“的作用是缩小了检索范围,提高查准率。使用逻辑非运算符号须慎重,容易造成漏检。因为它会把那些同时出现在检索词A和检索词B的记录排除在外。在一个复合检索提问式中,各种布尔逻辑运算符是按照not>and>or的次序运算。也可用()来改变运算次序,以符合检索课题的逻辑关系。例如:“用青霉素或红霉素治疗非儿童性肺炎”检索提问式,应为:#1青霉素or红霉素#2肺炎not儿童#3#1and#2或者:#1(青霉素or红霉素)and(肺炎not儿童)2.位置算符位置算符是要求原始记录中检索词之间要满足某些条件而使用的符号。例如:检索式为AwithB,则表示检索词A和检索词B必须同时出现在同一记录中的同一字段内;检索式为AnearB,则表示检索词A和检索词B必须同时出现在同一记录中的同一句子内。等等。位置算符提高检索结果的准确性。它比“逻辑与”更专指,是调整检索策略的一种重要手段。3.字段限制符字段限定符是限制检索词在数据库记录中的特定字段范围内检索的一种符号。常见的字段限定符有“in”或“=”。字段限定检索的表达形式是:“检索词in字段标记符”或者是“字段标识符=检索词”。例如:hepatitisinti、张志inau、la=English等字段限定检索也是缩小检索范围、提高查准率的一种方式。4.截词符截词(Truncation)检索是利用截词符附加在所截取检索词的局部进行检索的一种技术。它具有将同一词干的词全部查出的功能,扩大检索范围,提高查全率。按截词的位置,截词检索有前截断、中截断、后截断、前后截断四种方式,最常用的是后截断检索。不同的检索系统有不同的截词符,常用的截词符有“?”和“*”。“?”是有限截词符(即“?”的数量就是替代被屏蔽字符的数量),如输入“leukemi?”,可检索出含leukemia、leukemic、leukemid等词的记录。“*”是无限截词符(即表示所截去的字符数量不受限制),如输入“leukocyt*”,可一次性查出以leukocyt开头的所有检索词的记录。如输入“*sight”,可查到以sight结尾的所有检索词的记录,如“farsight”和”nearsight”等。使用截词检索技术,要确定好合适的截词位置,切忌截词过短,以免造成误检。检索课题:“胃镜检查胃炎(仅限2010—2012年的英文综述文献)”。胃炎gastritis胃镜gastroscopegastroscopicgastroscopy内窥镜endoscopeendoscopicendoscopy检索提问式为:#1gastritisand(gastroscop*orendoscop*)#2la=English或Englishinla#3pt=review#4py=2010—2012#5#1and#2and#3and#4(五)浏览检出文献,评价检索结果对检出的文献进行综合分析与评价。如果符合检索要求,可直接输出检索结果(转录、复印等);如果检索结果与检索期望存在