网络文献信息检索基础

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

网络数字资源检索基础2005年3月数字信息资源概述参考数据库全文数据库事实数据库电子图书电子期刊电子报纸搜索引擎/分类指南网络学术资源学科导航FTP资源其他:网站、BBS、新闻组等检索提问式的定义及类型概括地说,检索式是检索策略的逻辑表达式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。布尔逻辑检索式是目前使用最普遍的检索式,即用布尔算符(and、or、not)将检索词组合起来。位置算符检索式是对布尔逻辑检索式的一种改进,式中不仅有布尔算符,而且有位置算符,用以指明检索词之间的位置关系,从而解决了布尔算符组配检索词时没有词序的问题,进而提高了查准率。构成检索提问式的5种符号位置算符:表示所连接的各个单元词词间位置关系的符号,在不同的系统中往往以不同的符号表示。字段后缀符:限制检索词在数据记录中出现的字段位置,主要是题名、文摘、叙词和标识词字段,分别缩写为TI、AB、DE和ID。通常是在检出的文献量较多的情况下才考虑使用。限制符:挑选命中文献的文种、文献类型、出版时间和重要文章,约束检索结果。其形式和用法同上。字段前缀符:其作用与限制符一样,都是表示文献的外部标志,不反映文献的内容,对检索式的命中文献从非主题方面加以限制。截词符:其作用是在保证关键词检索的前提下,扩大检索范围。除了以上5种符号外,构造检索式还常常用到括号。括号可以规定运算的优先次序。一般说来,使用布尔算符、括号、截词符和位置算符,就可以构造出一个比较完善、切题的检索式了。数字信息资源概述:检索技术布尔逻辑检索布尔逻辑检索逻辑“与”(and):检索时,命中信息同时含有两个概念,专指性强;逻辑“或”(or):检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比and扩大。逻辑“非”(not):命中信息只包括逻辑A,不包括逻辑B或同时有A和B的,排除了不需要的检索词。逻辑“异或”(xor):命中信息包含逻辑A,也包含逻辑B,但不包含同时含有A和B的信息。布尔逻辑检索:运用布尔逻辑算符(Booleanoperators)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。注意:在不同的检索系统里,布尔逻辑的运算次序是不同的,因此会导致检索结果的不同。通常运算次序有这样几种形式:一是按算符出现的顺序,如果是and、or、not,就按and、or、not的顺序运算;如果是or、not、and,就按or、not、and的顺序运算;二是默认and优先运算,其次是or、not;三是默认or优先运算,然后是and、not。一般来讲,检索系统的“帮助”文件中都会有这类说明,只要注意查看即可。在中文数据库里,布尔逻辑运算符有时用and、or、not下拉菜单形式表示,供用户选择;有时用“*”号表示逻辑“与”,用“+”表示逻辑“或”,用“-”表示逻辑“非”。检索技术位置算符检索:即运用位置算符(positionoperators)表示两个检索词间的位置邻近关系,又叫邻接检索(proximity)。这种检索技术通常只出现在西文数据库中,在全文检索中应用较多。如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。位置算符检索位置算符(position)With(field):samefieldorsamesequenceNear:samesentencePre(precede):librarypresciencelibraryscience,librarywithscience,...w/n(Within):libraryw/nsciencelibraryscience,sciencelibrary,…Field:samefieldSame:sameparagraph常用的位置算符有算符功能表达式检索结果W,W/Nwithwithin两词相邻,按输入时顺序排列(也有数据库允许顺序颠倒)Education(W)school,或EducationwithschoolEducationschoolEducationschools(schoolofeducationschoolsofeducation)nW同上,两词中间允许插入n个词Education(1W)schoolEducationschoolEducationschoolsEducationandmusicschoolSchoolofcontinuededucationPre两词相邻,按输入顺序排列EducationPreschoolEducationschoolEducationschools常用的位置算符有算符功能表达式检索结果N,near,adj两词相邻,顺序可以颠倒Education(N)school,或EducationnearschoolEducationschoolEducationschoolsSchoolofeducationnN同上,两词中间可以插入n个词Education(1N)schoolEducationschoolSchoolofeducationEducationandmusicschoolF两个词同在一个标引字段中Education(F)school例如同时出现在题名或文摘字段中Same两个词同在一个段落(paragraph)中EducationSameschool同时出现在一个段落中注意:不是每一个检索系统都使用上述位置算符,不同的系统使用的位置算符不同,不同的算符在不同的系统中有时可能含义不同。例如“W”算符,在Dialog检索系统表示两词相邻,输入顺序不变;在ProQuest系统中,“W”算符表示输入的两个词相邻,但顺序可变,如顺序要求不变,则使用“Pre”算符。用户可以查阅help帮助文档说明。检索技术截词检索:用截词符号“?”、“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。这种检索方式可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。截词检索类型截词方式根据截词的位置不同,分为前截断、后截断、中截断;根据截断的数量不同,分为有限截断和无限截断。截词检索(truncation)后截断:是前方一致检索,又称右截断,截词符放在被截词的右边,是最常用的截词检索技术。后截断主要用于下列检索:词的单复数检索,如company与companies;年代检索,如199?(九十年代);词根检索,如socio*,可以检索sociobiology,socioecology,sociology等20多个词汇。前截断:截词符放在被截词的左边,可与后截断一同使用。例如输入*magnetic,可检electro-magnetic、electromagnetic、thermo-magnetic等。目前这种检索技术应用已经极少。中截断:把截词符放在词的中间。如organi?ation,可检索organisation、organization。这种方式查找英美不同拼法的概念最有效。截词举例符号:*,?,$后截断:librar*library,libraries,librarian,…前截断:*magneticmagnetic,electro-magnetic,electromagnetic,thermo-magnetic,…中截断:organi?ationorganization,organisation截词检索类型根据截断的数量不同,分为有限截断和无限截断。无限截断:不限制被截断的字符数量,例如输入educat?,可以检索educator,educators,educated,educating,education,educational,等等。有限截断:限制被截断的字符数量,例如输入educat**,表示被截断的字符只有两个,可以检索educator,educated两个词。词根检索有些检索系统不支持使用截词符的截词检索技术,系统默认的是词根检索,即输入一个词,系统会自动检索出同一词根的一组词,例如输入gene,可以检索出gene,genic,genome等。这是一种智能检索方式,但要求系统内必须预先配置词根表。IEE/IEEE全文数据库默认词根检索有些数据库需要加入词根运算符如“$”才进行词根检索inSpirs网上各类型信息资源查询数字图书馆:中国数字图书馆、书生之家数字图书馆、超星数字图书馆、北大方正的Apabi系统。报刊资料:中国学术期刊网、中文科技期刊数据库、中国财经报刊数据库。会议文献:中国科学院学术会公告、学界动态、IEEE学术会议数据库、万方学术会议文献数据库、中国重要会议论文集全文数据库、国内专业会议资料数据库、OCLC的会议文献数据库、美国科学信息研究所(ISI)会议数据库。学位论文:中国学术期刊网和万方数据资源系统的学位论文数据库、高校学位论文数据库、PQDD数据库(美国)。专利文献:中国专利信息网、国家知识产权局、DILAOG系统、世界知识产权组织专利数据库、美国专利商标局专利检索数据库。标准类:中国标准咨询网、万方数据资源系统标准数据库、国际标准化组织、美国国家标准委员会。

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功