文献检索策略与技巧内容计算机检索原理计算机检索语言计算机检索功能检索主题词确定计算机检索步骤1.计算机检索原理计算机检索原理示意图:用户检索意图(检索词)对比匹配数据库输出检索结果定义:是用于描述信息系统中文献信息的内容特征、外表特征和表达用户信息检索提问的一种专用语言。2.计算机检索语言根据文献存贮与检索的需要编制的,供标引文献和检索文献用的一种人工语言,是标引者和检索者共同约定使用的语言。外表特征内容特征题名语言:书名、篇名、刊名等著者语言:作者、编者、译者等号码语言:专利号;标准号;ISBN号;ISSN号等机构语言引文语言描述文献外表特征的语言描述文献内容特征的语言分类语言:根据学科内容对文献进行分类。如图书分类号、国际专利分类号等主题语言:关键词、叙词、标题词、单元词类型外表(内容)特征索引检索语言检索途径检索项AllFields:TX(全文)Abstract、Title、Keywords(摘要、题目、关键词)Authors(作者)SpecificAuthor(特定作者)SourceTitle(刊物名、书名等)Title(题目)Keywords(摘要)Abstract(关键词)References(参考文献)ISSN(国际标准刊号)ISBN(国际标准书号)Affiliation(作者单位)FullText(全文):10.4236/as.2011.23028DOI(Digitalobjectidentifier),数字对象标识符号、,用来标识在数字环境中的内容资源。3计算机检索功能布尔逻辑检索(Booleans)词间位置检索(Proximity)截词检索(模糊检索)(Wildcard)短语检索(精确检索)(Phrase)限定字段检索(Field)禁用词(StopWords)在结果中进行检索3.1布尔逻辑检索逻辑与:and逻辑或:or逻辑非:not;andnot(ScienceDirect)AB逻辑“与”:and表达式:AandB,表示被检索到的文献中既包括检索词A,又包括检索词B。特点:提高查准率举例:图书馆and信息素质中国知网AB表达式:AorB,表示被检索到的文献中至少包括一个检索词。特点:提高查全率举例:检索土豆相关文献检索维生素C相关文献逻辑“或”:orAB逻辑“非”:not表达式:AnotB,表示被检索到的文献中包括检索词A而不包括检索词B。特点:提高查准率举例:癌症not肺癌AorBandC不同算符的组合,其运算次序为not、and、or,也可用括号改变运算次序,如AorBandC的检索结果与(AorB)andC的检索结果完全不同。ABCACB(AorB)andCDialog系统:世界上最大的国际联机情报检索系统,覆盖900多个数据库逻辑算符举例查找关于“动物保护”的文献:“动物”和“保护”可以用“逻辑与”组配,表示为“动物AND保护”,检出记录中既涉及动物又涉及保护的相关文献。查找有关冬虫夏草的文献:冬虫夏草又称冬虫草、虫草,“冬虫夏草”、“冬虫草”、“虫草”三者要用逻辑或组配,表示为“冬虫夏草or冬虫草or虫草”,检索出文献中包含三者任意一种即被检出。查找关于国外建筑特色的文章:国外即不包括中国,建筑和中国之间为逻辑非的关系,表示为“建筑not中国”,检索结果排除了中国建筑的相关文献。检索西红柿种植技术的相关文章:西红柿”又称“番茄”,表示为“西红柿OR番茄”;“种植”的同义词有“栽培”、“培育”,表示为“种植OR栽培OR培育”;检索表达式为:(西红柿OR番茄)AND(种植OR栽培OR培育)3.2词间位置检索:“W/n”、“PRE/n”“W/n”:表示检索词之间可以加入其它词,词的数量根据需要而定,词的顺序任意。例如:geneW/5express“PRE/n”:表示检索词之间可以加入其它词,词的数量根据需要而定,词的顺序依输入词的顺序。例如:genePRE/5expressSD数据库:geneW/5expressSD数据库:genePRE/5express3.3截词检索(模糊检索):?、*无限截词符“*”:可以替代零个、一个或多个字符。例如:comput*→compute,computer,computing,computation等h*r*t→heart,harvest,homograft等有限截词符“?”:可替代一个字符例如:ne?t→neat,nest,nexttransplant??→transplanted,ransplanter,但不是transplanting用在词前、词中或词后,可用于名词的单复数、不同拼写方法及词干相同的各个衍生词的检索。把一个短语作为一个整体进行检索例如:“powderymildew”→powderymildew“heart-attack”→heartattack;heart-attack{heart-attack}→heart-attack(ScienceDirect)3.4短语检索(精确检索):“”,{}3.5字段检索例:检索我校于振文院士发文情况3.6在结果中检索ScienceDirect3.7禁用词:系统检索时会自动忽略部分数据库允许用“”或{}让禁用词变为检索词例如:ScienceDirect中,“not”或{not}部分数据库不允许用“”让保留词变为检索词例如:sinkorswim=sinkorswim部分数据库虽然自动忽略禁用词,但作为数量计数例如:“companyofAmerica”→companyofAmerica、companyinAmerica、companyforAmerica,但不能是companyoftheAmerica注意找出显性主题概念词(词的切分)排除无关和重复概念词(删除)找出隐性主题概念词(替补、增加)确定核心主题概念词4检索主题词确定(a)切分:对课题的语句以自由词为单位进行拆分,转换为检索的最小单元。注意:切分后最好能保持意义的完整性“固氮作用”不能切分为“固氮”、“作用”(c)替补、增加替补:同义词、近义词、相关词等的变化马铃薯:土豆增加:上位词、下位词、同类词关系土壤环境:温度、湿度、ph值(b)删除不具有实质性检索意义,如介词、连词、冠词、副词等检索意义不大而比较泛指的概念词,如展望、发展趋势、现状、近况、应用、利用、作用、方法、影响、效率、结构等专指性太高,或过分具体的限定词例一:土壤环境条件对豆科植物固氮作用的影响土壤环境豆科植物固氮作用温度湿度ph值大豆花生固氮菌根瘤菌(土壤环境or温度or湿度orPH值)and(豆科植物or大豆or花生)and(固氮作用or固氮菌or根瘤菌)例二:芸豆天然食用色素的提取芸豆天然食用色素提取芸豆色素提取例三:天然植物茶叶中提取茶多酚作为食品防腐剂例四:汽车尾气催化剂应用研究提炼关键词:汽车、尾气、催化隐性关键词:机动车、废气隐性:工厂、流水线、计算机控制、智能控制例五:企业生产线优化研究检索词:企业生产线优化例六:地表水体的防治污染检索词:地表水体防治污染地表水防治污染组合检索:中图分类号+检索词•(1)文献类型、年代、语种、学科•(2)确定检索主题词分析检索课题,明确检索要求•(3)选择数据库和子数据库•(4)选择检索方式:高级、初级、专业等•(5)选择检索途径,确定检索标识•(6)构造检索式制定检索策略•(7)调整检索策略:扩检或缩检执行检索•直接下载全文•根据文献记录信息,获取全文途径获取文献全文5计算机检索步骤TheEndAnyQuestions?•全面合理的选择数据库•文献类型查全•准确规范的检索词.•正确的逻辑关系查准评价信息检索系统效果的指标ABCA---数据库中与课题有关的文献量B---检索输出的文献量C---B中与检索课题有关的文献量(1)查全率(2)查准率CA×100%R=CB×100%P=3)两者关系最理想的检索效果是R、P均为100%,但实验表明:R和P之间存在相反的相互依赖关系,即提高R会降低P,反之亦然。在物理、技术科学信息检索范围内,P提高1%将导致R降低3%。实践经验证明:在现代科技信息检索系统中,R为60-70%,P为40-50%检索特性曲线