第3章检索策略与技巧1235本章内容3.1制订检索策略的基本步骤3.2灵活运用检索技巧3.3原文获取6783.1制定检索策略的基本步骤u一位同学想了解sludge(矿泥)处理方面的研究进展和一些主要的研究机构,她首先选择了中文科技期刊数据库,但只能查到很少的文献,她的检索策略存在哪些问题呢?检索需要遵循合理的检索步骤3.1.1Big6信息问题解决方案uBig6信息问题解决方案评价问题解决的结果评价问题解决的过程评价(会评价)表达信息从多个资源中组织信息整合信息(能综合)摘录信息阅读信息运用信息(详阅读)从资源里发现信息查找资源定位和搜索(取资料)列出资源的优先顺序讨论研究可能的资源的范围信息搜索策略(找策略)确认完成这项任务所需的信息定义信息问题的任务任务定义(定问题)步骤二步骤一阶段名称3.1.1Big6信息问题解决方案u定问题:明确信息需求,认真分析所面临的信息问题,确认完成这项任务所需的信息。举例分析(sludge(矿泥)):1)信息问题的任务:了解有关sludge的研究进展和找出主要研究机构。2)完成这项任务所需的信息:有关sludge的高质量的期刊文献、会议文献以及专利文献,相关的综述论文等。3.1.1Big6信息问题解决方案u找策略:研究可能存在所需信息的信息资源并确定这些资源的优先顺序。举例分析(sludge(矿泥)):应该首先选择重要的文摘型检索工具如SCI数据库和ISIProceedings数据库。一般来说,对于查全率要求较高的信息问题,总是先使用文摘型检索工具,找到线索后,循线索利用全文型检索工具查找原始文献。3.1.1Big6信息问题解决方案u取资料:找到所选定的文献检索工具,查找所需文献线索。举例分析(sludge(矿泥)):SCI数据库中检索,使用主题语言,以“sludge”为检索词实施检索,由于命中文献量太多,利用文献内容类型和研究机构的分类检索语言,可以很方便地发现综述文献和主要研究机构。3.1.1Big6信息问题解决方案u详阅读:快速阅读信息和摘录信息建立卡片法Word或Excel文档法计算机个人文献管理工具:EndNOTE等3.1.1Big6信息问题解决方案u综合阶段:将从各个文献检索工具中“阅读”并“摘录”阶段获得的信息进行综合分析,形成课题调研报告或综述论文。3.1.1Big6信息问题解决方案u评价阶段:判断是否解决了最初的信息问题,如果没有解决,则需要调整策略,重新检索;判断整个信息问题解决过程的效率和方法是否最优。3.1.2检索语言对检索策略的影响u检索工具所采用的检索语言的不同,也会影响检索策略,当两个文献检索工具存储的文献范围差别不大时,主要依据检索工具能够提供的检索点来选择合适的检索工具。3.1.2检索语言对检索策略的影响u举例:某工程研究所的小王想看看自己发表的所有论文以及被引用情况解析:一方面,小王发表的中文论文基本都被中国知网、维普中文科技期刊、万方数据资源等数据库收录,但能够比较方便地获得自己发表的论文的被引情况的只有中国知网,因此最好选择中国知网来获得中文论文的被引情况。另一方面,虽然SCI、ISIProceedings、EI、SCOPUS同时收录小王发表的部分外文文献,SCI、ISIProceedings、SCOPUS同样能够比较方便地获得自己发表的论文的被引情况,但SCOPUS收录的资源量更大,因此最好选择SCOPUS。3.1.2检索语言对检索策略的影响u举例:小李同学想通过ISSN号,在SCI数据库中查找该刊最新论文的摘要解析:由于SCI数据库有刊名检索点但没有ISSN号检索点,因此需要首先选择JCR这个数据库,获得期刊的名称,然后才能利用刊名检索点查找该刊最新论文的摘要。3.2.1单项检索只选择一个检索点和一个检索词的检索过程为单项检索。单项检索简单方便,但是检索效果不是很理想,所以一般不采用单项检索。例:想了解“金银花”的药用价值,只用“金银花”作为检索词,可能会出现金银花种植和需求类的信息,干扰目标信息的获取。3.2.2组合检索组合检索可以是单项检索中多个字或词的组合检索,也可以是多个检索点之间的组合检索,即在一个检索点中设定多个检索词,或是同时限定多个检索点的不同条件后执行检索。3.2.2组合检索u运算符号布尔逻辑算符:与或非例:检索华东理工大学教师以外的科研人员撰写的有关磁流体密封的文献检索式:关键词=(磁流体and(密封or泄漏))not机构=(华东理工大学or华东化工学院)3.2.2组合检索u运算符号制定检索策略要尽量使检索词简短合理使用逻辑算符号,提高检索效率“逻辑与”:提高查准率;“逻辑或”:提高查全率;“逻辑非”:提高查准率。3.2.2组合检索u邻近算符邻近算符是“逻辑与”的特殊形式,用邻近算符连接的两个检索词必须同时出现在同一篇文献中,且两词的邻近关系必须符合一定的条件。当使用“逻辑与”时,检索出来的结果较多,但又不适合再增加检索词,此时最好的方法就是使用邻近算符,近一步缩小检索范围,使相关性更强的文献被检索出来,提高查准率。3.2.2组合检索u邻近算符不同的数据库用来表示邻近算符的符号不同。例:Dialog中,分别用nW,nN,F表示含义不同的邻近算符。power(nW)coating表示power和coating必须在同一检索字段内同时出现,前后次序不能颠倒,且最多间隔n个单词。power(nN)coating表示power和coating必须在同一检索字段内同时出现,前后次序可以颠倒,且最多间隔n个单词。power(F)coating表示power和coating必须在同一检索字段内同时出现,前后次序可以颠倒。3.2.2组合检索u截词符使用截词的目的是提高文献的查全率。截词检索在有些数据库中也称为模糊检索,因此截词符、模糊字符和通配符的含义都是基本相同的。3.2.2组合检索u截词符合理使用截词符主要注意以下几个问题:第一,截词的长度要适合,不能太短,否则会使检索结果过多。例如,electro*将检索出含有electron,electronic,electrostatic等的文献,如果写成elec*就可能检索出许多意思完全不相关的文献。3.2.2组合检索u截词符合理使用截词符主要注意以下几个问题:第二,要考虑到有一些特殊单词,它的词性、单复数或其它变化不一定体现在词的末尾,这时就要充分考虑使用词首截词或词中截词。如:*conductors将检索出conductors,semiconductors等dr*v*将检索出drivedrovedriverdriving等sul*ate将检索出sulphate,sulfate等colo*r将检索出color或colour3.2.2组合检索u截词符合理使用截词符主要注意以下几个问题:第三,有些截词的模糊部分我们能够肯定究竟有几个字母,此时可直接使用能够限制字母数量的截词符号,提高查准率。如:在工程索引数据库中?只代表一个字符,所以:wom?n将检索出woman或者women3.2.2组合检索u截词符合理使用截词符主要注意以下几个问题:第四,要注意有些数据库的特殊规定。在使用外文数据库时,经常会使用词组作为检索词。美国化学文摘规定可以在词组后的最后一个单词后使用截词,而美国专利数据库或EIVillage数据库规定在词组中不能使用截词符号。此时,可列举词组的不同形式用“逻辑或”组合成检索条件,或使用邻近算符来表示不同形式的词组。3.2.2组合检索u截词符合理使用截词符主要注意以下几个问题:第五,中文截词在中文文献数据库中一般使用模糊检索来表示检索词的多种情况,使用截词算符的情况不是很多。中国国家知识产权局的专利数据库是可以使用截词算符来表示检索词的中文文献检索工具之一,其截词算符的功能和使用方法同英文数据库是一样的,所不同的是,前者截词符号代表的是汉字,而后者是字母。3.2.2组合检索u检索点限制不同的检索词限制在不同的检索字段时,检索结果是不同的,会直接影响文献的查全率和查准率。第一,关于“任意字段”(ALL)和“全文”(FullText)“任意字段”的使用在提高查全率的同时,使查准率大大降低。在使用“任意字段”或“全文”字段的时候需要仔细考虑,尽量减少因使用“任意字段”造成的查准率下降。3.2.2组合检索u检索点限制不同的检索词限制在不同的检索字段时,检索结果是不同的,会直接影响文献的查全率和查准率。第二,关于“题名”、“关键词”、“主题词”和“文摘”这四个字段是检索时最为常用的检索字段,因为它们直接反应文献的主题,而且采用描述性语言输入,使用起来最为灵活,字段的选择将直接关系到检索结果的查全率和查准率。3.2.2组合检索u检索点限制不同的检索词限制在不同的检索字段时,检索结果是不同的,会直接影响文献的查全率和查准率。第三,关于“分类号”、“专利号”等检索字段分类号也是能反映文献内容的字段,只是不采用描述性语言,而是用分类代码,因此检索人员要十分熟悉分类的特点,所以,除特殊要求外,我们不经常单独使用分类号检索字段,有些时候和“关键词”、“文摘”等检索字段配合使用会收到较好的效果。3.2.2组合检索u检索点限制不同的检索词限制在不同的检索字段时,检索结果是不同的,会直接影响文献的查全率和查准率。第四,关于“文摘号”、“刊号”、“标准编号”、“作者”、“机构”等检索字段这些检索字段不能直接反映文献的内容,属于“外部特征”的检索字段。在以内容特征为主的检索实践中,这些字段不常用,但有时我们仍然会依据这些检索点进行课题检索,因此在大多数的数据库中,这些字段都有索引。3.2.2组合检索u检索条件组配(1)在结果中检索(2)组配检索式在EIVillage中检索有关“数控机床远程故障诊断系统的研究”的文献。要求文献语种为英语检索字段:文摘这个检索式可以写为:(((CNCorNCor($numericalONEAR/0$control)or($digitalONEAR/0$control))and(fault*orfailure*)anddiagno*and(integratedorremoteordistance))wnAB)and(EnglishwnLA)3.2.2组合检索u确定正确的检索词,提高检索效果(1)多用单元词少用多元词(2)尽量使用所有的同义词和近义词(3)善于利用叙词表(4)尽量少用含义宽泛或过于偏窄的词(5)兼顾俗名和学名(6)善于利用数据库的人工标引3.2.3特殊检索技术u特殊检索技术1)加权检索2)相关性检索3)引文检索4)概念检索和自然语言检索词6)资源导航7)跨语言检索8)文献漫游3.3原文获取u各种检索技术帮助我们获得了文献的基本信息,但是对于科学研究来说阅读原文是必不可少的重要环节,原文中有很多重要信息是不一定在文摘中体现出来的,诸如有用的数据、图表等,这些信息都需要阅读全文才能获得。3.3.1原文的线索u通过著录信息判断原文的文献类型不同的数据库收录的文献类型不同,只有充分了解所要查找的文献类型,才能有针对性地快速找到到相应的文献数据库进行查找。不同的文献类型具有不同的典型特征,这里介绍的文献类型是按照文献的出版形式划分的,这也是数据库或其它文献信息源常用的分类方法,根据简单的著录一般能够判断文献的类型。u图书3.3.1原文的线索书名基础生命科学责任者吴庆余主题/关键词生命科学摘要略。出版社高等教育出版社出版日期2002-5-1标识ISBN7-04-011161-6.2标识类型ISBN中图法分类号Q1-0ISBN号7-04-011161-6u学术期刊(Periodicals)连续出版物3.3.1原文的线索题名:溶氧水平与搅拌转速对发酵生产透明质酸分子量的影响作者:杨利;张旭;谭文松作者单位:华东理工大学生物反应器工程国家重点实验室,上海,200237刊名:华东理工大学学报(自然科学版)年/卷/期:2008/34/06ISSN:1006-3080分类号:TQ920.6u报纸(Newspaper)连续出版物3.3.1原文的线索Title:Bioceramics21-Ke