检索式编制技巧检索:有关地震和海啸的相关研究•(earthquak*ortembl*orseism*orearthshock*orearthdin*)and(tsunami*orseismicseawaveorgroundseaormegatsunamiortidalwave*)分析研究课题,明确检索要求选择检索工具(或数据库)与检索手段确定检索途径与拟定检索式实施试检索操作检索结果的评价与获取原始文献一个好的检索式是最终实现检索策略是否达到预想结果的具体表现形式。文献信息检索的基本步骤检索式的定义百度百科定义:指搜索引擎理解和运算的查词串,由关键词、逻辑运算符、搜索指令(搜索语法)等构成。关键词是检索式的主体,逻辑运算符和搜索指令根据具体的查询要求从不同的角度对关键词进行搜索限定。逻辑运算符是表达检索词之间逻辑关系和限制关系的运算符号,它是复合检索式中必不可少的构件。如何编制检索式•检索词的选择;•运算符的使用;•编制检索式。关键词与主题词◆关键词即是“自由词”,是信息的提供者各自采用的不经过一定规范化限定的词。检索操作方便,但其专指度差,常需用较高的逻辑匹配、截词符等技能。◆主题词即指以自然语言中优选出的,经过规范化处理后的名词术语。检索操作一般需将习惯使用的自然语言与各数据库自编的主题词表对照后方能使用,但专指度较高。检索词的选择技巧?关键词的选择——应以课题提供的关键词为参考选定的关键词应符合主题;确认关键词是否为规范词;并应列出常用中外文同义词、缩写词,以及核心关键词的上下位类词。应充分利用词表、辞海、术语标准、词典等工具书,以及从已检出的文献中,复核、筛选、补充、精炼检索用词。关键词的选择应注意——(1)应覆盖检索主题(2)寻找常用同义词(3)词的全称、简称及缩写(4)必要时应向上下位类词扩检(5)合理使用词组或短语(6)规范词的利用1.勿忘检索词的全称、简称、俗称与英文缩写项目名称:乙型病毒性肝炎的中医药研究篇名=乙型病毒性肝炎*(中医药+中药)乙型病毒性肝炎的同义词:乙型肝炎乙肝HB篇名=(乙型病毒性肝炎+乙型肝炎+乙肝+HB)*(中医药+中药)项目名称:耐高温粘接剂的研究篇名=高温*粘接剂粘接剂的同义词:胶粘剂、粘固剂、粘合剂、胶结剂、粘结剂、粘胶剂、粘接剂、粘着剂、黏合剂、胶合剂篇名=高温*(粘接剂+胶粘剂+粘固剂+粘合剂+胶结剂+粘结剂+粘胶剂+粘接剂+粘着剂+黏合剂+胶合剂)初级检索高级检索搜索同义词方法(1)利用数据库的同义词选择功能(2)利用搜索引擎寻找同义词(3)从数据库检索结果中寻找同义词(4)利用自己的专业知识(5)利用自己平时积累的知识2.注意检索词的上下位类扩展项目名称:电阻焊在汽车生产中的应用篇名=电阻焊*汽车*生产电阻焊F点焊缝焊凸焊对焊篇名=(电阻焊+点焊+缝焊+凸焊+对焊)*(汽车+机动车+客车+轿车)*生产项目名称:苯胺的烷基化反应催化剂研究文摘=苯胺*烷基化*催化剂烷基化——AlkylationF甲基化Methylation乙基化Ethylation文摘=苯胺*(烷基化+甲基化+乙基化)*催化剂●课题(1)“加氢裂化防污垢的开发与应用研究”,将“加氢裂化”与“防污垢”组配,结果不理想。概念向上位“石油加工与石油炼制”的概念扩大,再与“防垢剂”组配,完成了课题的要求。课题(2)碳4、碳5馏份工艺情况(C4orC5)anddistillat*上位:Petroleumandproduct*anddistillat*下位:(Buteneor1-3butadiene…)anddistillat*3.注意外来词的译写变化波尔兹曼54欧几里德290玻耳兹曼109欧几里得197玻尔兹曼214欧基里德5波耳兹曼12欧几理德3波尔茨曼2欧氏几何135Boltzmann659Euclid351注意:上例中用英文名检索出的中文文献最多!注意检索词的词义变化汉词与英语等西方语言的词汇相比较:◆汉词的字与词界线比较模糊,一个字也许就是一个词,英语基本上没有这种现象。◆汉词无固定的词头、词尾和性、数的变化。而英语构词时这种情况很多。◆汉语的构词一般与语义有关,一个词后加上一个字就派生出另一个新的词,而英语的情况与此有很大的不同。4.深入课题寻找检索词项目名称:石油工业的废水处理篇名=石油工业*(废水+污水)*处理篇名=石油*(废水+污水)*处理•主题=石油*篇名=(废水+污水)*处理•石油工业,燃料工业之一。从勘探、开采到加工石油一系列过程是由石油部门所完成。为国民经济各部门提供各种燃料油,包括天然石油和油页岩的勘探、开采、炼制、储运等生产单位。•重新选择检索词将“石油工业”扩展为“石油”、“油田”、“采油”、“炼油”。•进行二次检索示例:有关“企业知识产权研究”检索式检索结果(*表示AND,+表示OR,限定篇名字段)(2009-2011)1企业知识产权191篇(准确度最高漏检大)2企业*知识产权404(漏检率较高)3(企业+集团+公司)*知识产权466(适合综述性文献)4(企业+集团+公司)*(知识产权+专利权520(查全率查准率较高)+商标权+著作权+名称权)5(企业+集团+公司)*(知识产权+专利权)137(缩小范围效果最佳)5.少用或不用对课题意义不大的词•不用词义泛指过大的词,如展望、趋势、现状、近况、动态,应用、作用、利用、用途、用法,开发、研究、影响、效率。•少用词义延伸过大的词,若一定要用,必须将它们尽可能全地用“或”组合起来,以免漏检,如:“制造”——制备(preparation)、生产(manufacture)、合成(synthesis)、加工、工艺;“提炼”——精炼、提取、回收、利用、萃取;“性能”——Property(ies),Performance,Behavior。6.多主题概念的课题应以“简”为主1、课题有A、B、C、D、E、F等主题概念进行组配,其中“C”词建库人员未从原始文献中挑选出来作为标引词时,该“C”主题词则表现为零,则整个检索式等于零。如:课题“利用基因工程的手段提高植物中淀粉含量”基因工程*淀粉基因*淀粉“最专指面优先”(MostSpecificFaceFirst)方法7.少用无法定性定量的词课题:冷、温复合挤压连续成形技术•(冷挤压or温挤压)and连续and成型•(冷or温)and挤压and连续and成型•冷=常温以下•温=45`C~600`Cor800`C处理结果:取消:冷、温二词深化处理:增加:挤压对象的词。如塑料、金属等词或其他如有助于限制范围的有效实词如:挤压时用的润滑材料:石墨。。。。切忌:把整个题名输入到检索框中如:网络数据库的安全性研究应以课题提供的关键词为参考,根据检索要求复核、筛选、补充、精炼检索用词。选定的检索词应符合检索主题;确认检索词是否为规范词;并应列出常用中外文同义词、缩写词,以及核心词的上下位类词。应充分利用词表、辞海、术语标准、词典等工具书,以及从已检出的文献中,扩展检索用词。•例如有人提出检索真空碳粉包装机方面的文献•VacuumPacker*orVacuumpack*machine*orVacuumpack*equipment*(VacuumPacker*orVacuumpack*machine*orVacuumpack*equipment*)andcarbonpowder*•(VacuumPacker*orVacuumpack*machine*orVacuumpack*equipment*)andpowder*运算符的使用技巧?搜索指令的使用技巧?在进行计算机检索时,有时有一些比较复杂的课题,如:“GPS在建筑中的应用”,既涉及GPS,又涉及建筑,这时候要编制出满足要求的计算机检索式,就必须用到运算符,它是机检的基础。布尔逻辑、截词检索、字段检索,位置算符、其它。1布尔逻辑检索(BooleanLogicRetrieval)逻辑检索的基础是逻辑运算,逻辑运算中最常用的是布尔逻辑运算符,即与、或、非三种运算符号,用它们可以表示概念之间的逻辑关系。检索要求逻辑检索课题表达式检索结果概念相交、限定AND与*计算机用于制图ABAANDBA*B缩小检索范围提高查准率概念平行、并列OR或+土地管理与土地利用ABAORBA+B扩大检索范围提高查全率某一主题去掉一部分相关主题NOT非-除光电测距以外的A电磁波测距BBNOTAB-A提高查准率2位置算符(ProximityOperators)位置算符是表示检索词之间位置关系的一种运算符。由于英文对一句话有多种表达方法,写法可能不同。如:“GPS在铁路桥研究中的应用”这个课题,用英文表达可能是“UsingofGPSinRailwayBridge”,也可能是“UsingofGPSinBridgeofRailway”,因而可能编制出这样的检索式,GPSAND(Railway(2N)Bridge)我们可以通过位置检索提高检索的准确率。NEAR/xNEAR代表所链接的两个词之间的词语数量小于等于x,默认的使用Near的缺省值是15。Example:canineNEAR/10viruscanineNEARvirusSAME只在地址字段中进行检索,同时要求两个词是在同一个地址字段中。Example:yaleSAMEhosp8位置算符位置算符SAMEunivtokyoANDdeptphysunivtokyoSAMEdeptphysIBMSAMENYIBMANDNYIBMResCorp,YorktownHeights,NY10598USACornellUniv,DeptMatSci&Engn,Ithaca,NY14853USAIBMCorp,AlmadenResCtr,DivRes,SanJose,CA95120USA3截词算符(Truncatingoperators)在英语词汇中,一个词可能有多种形态,如词的单、复数形式的不同,英美拼写方法不同、词性不同等。如果检索时将这类词全部输入进去,会增加检索时间和费用,采用截词法可解决这一问题。所谓截词检索,是指在检索标识中保留相同的部分,用相应的截词符代替可变化部分。检索中计算机会将所有含有相同部分标识的记录全部检索出来。常用“?”、“*”符号表示。①有限截词即在检索词后后截几个有限的字母,如名词的单复数,动词的词尾变化等。如:输入computer??表示有0-1个字母变化,可检出computer和computers.输入stud???表示截断处有0-3个字母变化,可检出study,studies,studied,studing.②无限截断在检索词后加一个“?“,表示该词后可加任意个字符。使用无限截词,所截词根不能太短,否则会输出许多无关文献,造成误检。如:computer?可检出computers,computering,computered,computerization.③中间截断在检索词中间加一个或几个?号,主要解决一些英美拼写不同,单复数形式的不同的词的输入,可简化输入。如:输入wom?n可检出woman,women各种算符在数据库中的实际应用•位置算符1)EINEARBridgeNEARPiling*表示这两个词要彼此接近,前后顺序不限W/nPig*W/2pine*表示两个词的距离不能超过n个单词AdjChanneladjtunnel表示含有这两个词,两个词相邻,位置一定2)ISIProceedings用同句算符(SAME):如Channelsametunnel,表示channel和tunnel出现在同一句子中才符合检索条件。3)Elsevier:ADJ表示两词相邻,前后顺序固定,与“词检索”的结果相同;NEAR或(N)表示两词相邻,中间可插入少于或等于n个单词,前后顺序可以发生变化,如果不使用(N),系统默认值为10。4)PQDDW/n两词间距小于n个单词,且前后位置任意Pre/n两词间距小于n个单词,且前后位置一定截词符或通配符如:CSA\ISIProceedings\ProQuest\CA用通配符“?”和截词符“*”输入“pate