第四章计算机检索基础知识

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第四章计算机检索基础知识第一节概述一、计算机检索的发展1、脱机批处理检索2、联机检索3、光盘检索4、Internet网上检索1954~19641965~19721985~1973~三、计算机检索系统的组成硬件、软件、数据库二、计算机检索的服务方式1、追溯检索(RetrospectiveSearch,简称RS)2、定题服务(SelectiveDisseminationofInformation,简称SDI)3、联机订购原文4、电子邮件服务四、数据库类型数据库类型数据库是至少由一个文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合.根据载体的不同,可分为:联机数据库(onlinedatabase)、光盘数据库(CD-ROMdatabase)和网络数据库(networkeddatabase).根据内容与功能可划分为:指南数据库(directorydatabase)、交易(执行)数据库(transactionaldatabase)、全文数据库(fulltextdatabase)、书目数据库(bibliographicdatabase)、字(词)典数据库(dictionarydatabase)、数值数据库(numericdatabase)与统计数据库(statisticaldatabase)、图像数据库(imagedatabase,graphicdatabase)等.第二节计算机检索方法一、逻辑提问式(检索式)的基本要素1、检索词:用户或检索人员给出的字、词、字符或短语,用于查找含有它(它们)的记录.2、布尔逻辑运算符(1)逻辑“与”:运算符为“AND”或“*”(2)逻辑“或”:运算符“OR”或“+”(3)逻辑“非”:运算符“NOT”或“—”ABABAB检索算符在输入检索表达式的过程中,可根据检索符号简化检索的过程,以达到快速检索的目的:运算顺序依次为:NOTANDOR(非与或)可灵活运用括号“()”改变优先级,括号内的逻辑式优先执行检索代码检索词前面的英文字母是各字段的代码,可在检索入口选择框中查看。代码字段:U任意字段S机构M题名或关键词J刊名K关键词F第一作者A作者T题名C分类号R文摘逻辑运算符逻辑运算符逻辑运算符*+-并且、与、and或者、or不包含、非、not逻辑运算符的表达方式1、布尔逻辑检索功能:用布尔逻辑算符来组配检索词以确定文献的命中与否。其算符的相互匹配方式一共有8种。逻辑与(逻辑乘)逻辑或异或关系“逻辑非”的“逻辑或”关系“逻辑或”的“逻辑非”逻辑非被标引在该词下的(1)逻辑与(逻辑乘)用运算符号:AND或*连接检索词例查“有关计算机在图书馆中的应用”的文献,检索式=计算机*图书馆例查“猪的饲养”检索式=猪*饲养用文氏图表示:图1-1AANDBAB(2)“逻辑或”用运算符号“OR”或“+”连接两检索词例1查“苹果或梨”方面的文献检索式=苹果+梨它在同义词检索中使用,能提高查全率。例2查“计算机或机器人”方面的文献检索式=计算机+机器人用文氏图表示如下:AORBAB(3)“逻辑非”用运算符号“NOT”或“—”连接两检索词AANDNOTB有的书上也称为“与非”关系,即“逻辑乘”与“逻辑非”例1查“玉米但不是甜玉米”方面的文献。检索式=玉米—甜玉米例2查“不是铬合金”方面的文献。检索式=合金—铬用文氏图表示:图1-3ANOTBAB(4)“异或”关系(AORB)ANDNOT(AANDB)“异或”排除掉的是AANDB部分例A=水上运输工具,B=陆上运输工而“异或”的关系则排除了AANDB的那部分,即“水陆两栖运输工具”不能被命中。这同AORB是有区别的。用文氏图表示如下:(AORB)NOT(AANDB)AB(5)“逻辑非”的“逻辑或”关系即:NOTAORNOTB两检索词的。例:查除俄文、法文两种文字之外的其它各语种的文献。用文氏图表示:图1-5NOTAORNOTBAB(6)“逻辑或”与“逻辑非”即:AORNOTB检索A但否定B后的逻辑或,例:检索焊接(A)方面的资料,但不要技术标准(B)。这样,结果是“焊接标准”的资料被排除了。但是其它一切课题的资料(除标准外)的资料均被命中。用文氏图表示:图1-6因此,AANDNOTB(即逻辑非)和AORNOTB是不同的其效果相差很远。AORNOTBAB(7)A即标引在A检索词下的文献,(8)NOTA检索不是检索词A下文献。总结:布尔逻辑检索是把任何检索课题加工成可以进行逻辑运算的表达式,这是计算机检索的一种被广泛采用的匹配方式。布尔逻辑运算的优点是简单明确、易于理解、符合人们的思维习惯AANOTAA3、位置逻辑检索符①(W)算符:“with”的缩写例:?SELECTCD()ROM相当于检索CDROM或CD-ROM②(N),(nN)算符:“Near“的缩写③(nW)算符:“nWords”的缩写例:electronic(1w)resources,可检出electronicresources和electronicinformationresources例:Railway(2N)Bridge表示RailwayBridge,BridgeofRailway,BridgeoftheRailway等等。④(F)算符:“Field”的缩写⑤(S)算符:“subfield”的缩写⑥(L)算符:“Link”的缩写4、截词检索符①中间截词Wom?n相当于查找woman和women。②后截词如输入stud???,表示截三个字母,可检索出带有study,studies,studied和studing等的文献。③无限截词符在检索词根后加一个“?”,表示该词后带任意个任何字母的词均为相匹配的词。5、限制检索符类型字段标识符字段名称基本字段索引ABDEIDSHTIAbstract文摘Descriptor叙词Identifier自由标引词SectionHeading分类标题Title篇名辅助索引字段AUCLCPDTJNLAPYSNAuthor作者ConferenceLocation会议地点CountryofPublication出版国DocumentType文献类型JournalName刊名Language语种PublicationYear出版年ISSN国际标准刊号编写逻辑提问式举例:1.高层建筑抗震结构设计(tall+highrise)*building*earthquakeresistance*structuraldesign2.加拿大酸雨造成的污染(要求语种为英文)acid()rain*Canad?*pollution*LA=English3.核测量数据处理软计算方法研究(nuclearmeasurement??+nucleardata)*(soft()comput?+algorithm)*(onreal-time+on-line+dynamic)二、短语检索(phrasesearch)短语用“”表示,检索出与“”内形式完全相同的短语,以提高检索的精度和准确度.三、括号检索(parentheses)用于改变运算的先后次序,括号内的优先进行.四、自然语言检索(naturallanguagesearch)直接采用自然语言中的字、词、句进行提问式检索,同一般口语一样.五、多语种检索(multilingualresearch)提供多种语言的检索环境供用户选择,系统按用户选定的语种进行检索并反馈结果.六、模糊检索(fuzzysearch)当我们输入一个检索词时,搜索引擎不仅反馈包括了该关键词的网址,同时也发来了与关键词意义相近的内容.七、区分大小写的检索(case-sensitiveresearch)第三节检索策略所谓检索策略,广义地说,就是在分析课题内容实质的基础上,选择检索系统、检索文档、检索途径、确定检索词相互间的逻辑关系,直到给出检索顺序的最佳实施方案等一系列的科学措施,是就一个问题检索一个(或多个)数据库所输入的全部检索式的集合。狭义的检索策略,是指填写的“检索提问单”。检索步骤分析课题选择信息资源构造检索式,制定检索策略调整检索策略下载、保存检索结果确定检索课题数据库检索的一般方法①分析检索课题,明确信息需求②选择检索工具,了解检索系统③确定检索途经,选定检索方法④实施检索策略,浏览初步结果⑤调整检索策略,获取所需信息得到一组主题词(关键词)和一些限定要求(如年限、学科领域等)数据库的基本情况和检索功能、检索途径逻辑检索逻辑算符逻辑组配检索途径[检索项]题名|主题浏览模式分类|主题||文献类型匹配模式精确|模糊|截词检索检索模式初级检索|高级|专家结果处理排序|选择|获取|使用特色功能与拓展服务

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功