网络数字资源检索基础2005年3月数字信息资源概述参考数据库全文数据库事实数据库电子图书电子期刊电子报纸搜索引擎/分类指南网络学术资源学科导航FTP资源其他:网站、BBS、新闻组等检索提问式的定义及类型概括地说,检索式是检索策略的逻辑表达式,是指计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符以及系统规定的其他组配连接符号组成。布尔逻辑检索式是目前使用最普遍的检索式,即用布尔算符(and、or、not)将检索词组合起来。位置算符检索式是对布尔逻辑检索式的一种改进,式中不仅有布尔算符,而且有位置算符,用以指明检索词之间的位置关系,从而解决了布尔算符组配检索词时没有词序的问题,进而提高了查准率。构成检索提问式的5种符号位置算符:表示所连接的各个单元词词间位置关系的符号,在不同的系统中往往以不同的符号表示。字段后缀符:限制检索词在数据记录中出现的字段位置,主要是题名、文摘、叙词和标识词字段,分别缩写为TI、AB、DE和ID。通常是在检出的文献量较多的情况下才考虑使用。限制符:挑选命中文献的文种、文献类型、出版时间和重要文章,约束检索结果。其形式和用法同上。字段前缀符:其作用与限制符一样,都是表示文献的外部标志,不反映文献的内容,对检索式的命中文献从非主题方面加以限制。截词符:其作用是在保证关键词检索的前提下,扩大检索范围。除了以上5种符号外,构造检索式还常常用到括号。括号可以规定运算的优先次序。一般说来,使用布尔算符、括号、截词符和位置算符,就可以构造出一个比较完善、切题的检索式了。数字信息资源概述:检索技术布尔逻辑检索布尔逻辑检索逻辑“与”(and):检索时,命中信息同时含有两个概念,专指性强;逻辑“或”(or):检索时,命中信息包含所有关于逻辑A或逻辑B或同时有A和B的,检索范围比and扩大。逻辑“非”(not):命中信息只包括逻辑A,不包括逻辑B或同时有A和B的,排除了不需要的检索词。逻辑“异或”(xor):命中信息包含逻辑A,也包含逻辑B,但不包含同时含有A和B的信息。布尔逻辑检索:运用布尔逻辑算符(Booleanoperators)对检索词进行逻辑组配,表达两个概念之间的逻辑关系。注意:在不同的检索系统里,布尔逻辑的运算次序是不同的,因此会导致检索结果的不同。通常运算次序有这样几种形式:一是按算符出现的顺序,如果是and、or、not,就按and、or、not的顺序运算;如果是or、not、and,就按or、not、and的顺序运算;二是默认and优先运算,其次是or、not;三是默认or优先运算,然后是and、not。一般来讲,检索系统的“帮助”文件中都会有这类说明,只要注意查看即可。在中文数据库里,布尔逻辑运算符有时用and、or、not下拉菜单形式表示,供用户选择;有时用“*”号表示逻辑“与”,用“+”表示逻辑“或”,用“-”表示逻辑“非”。检索技术位置算符检索:即运用位置算符(positionoperators)表示两个检索词间的位置邻近关系,又叫邻接检索(proximity)。这种检索技术通常只出现在西文数据库中,在全文检索中应用较多。如果说布尔逻辑算符是表示两个概念之间的逻辑关系的话,位置算符表示的是两个概念在信息中的实际物理位置关系。位置算符检索位置算符(position)With(field):samefieldorsamesequenceNear:samesentencePre(precede):librarypresciencelibraryscience,librarywithscience,...w/n(Within):libraryw/nsciencelibraryscience,sciencelibrary,…Field:samefieldSame:sameparagraph常用的位置算符有算符功能表达式检索结果W,W/Nwithwithin两词相邻,按输入时顺序排列(也有数据库允许顺序颠倒)Education(W)school,或EducationwithschoolEducationschoolEducationschools(schoolofeducationschoolsofeducation)nW同上,两词中间允许插入n个词Education(1W)schoolEducationschoolEducationschoolsEducationandmusicschoolSchoolofcontinuededucationPre两词相邻,按输入顺序排列EducationPreschoolEducationschoolEducationschools常用的位置算符有算符功能表达式检索结果N,near,adj两词相邻,顺序可以颠倒Education(N)school,或EducationnearschoolEducationschoolEducationschoolsSchoolofeducationnN同上,两词中间可以插入n个词Education(1N)schoolEducationschoolSchoolofeducationEducationandmusicschoolF两个词同在一个标引字段中Education(F)school例如同时出现在题名或文摘字段中Same两个词同在一个段落(paragraph)中EducationSameschool同时出现在一个段落中注意:不是每一个检索系统都使用上述位置算符,不同的系统使用的位置算符不同,不同的算符在不同的系统中有时可能含义不同。例如“W”算符,在Dialog检索系统表示两词相邻,输入顺序不变;在ProQuest系统中,“W”算符表示输入的两个词相邻,但顺序可变,如顺序要求不变,则使用“Pre”算符。用户可以查阅help帮助文档说明。检索技术截词检索:用截词符号“?”、“*”或“$”加在检索词的前后或中间,以检索一组概念相关或同一词根的词。这种检索方式可以扩大检索范围,提高查全率,主要用于西文数据库检索。中文数据库通常不使用这种技术。截词检索类型截词方式根据截词的位置不同,分为前截断、后截断、中截断;根据截断的数量不同,分为有限截断和无限截断。截词检索(truncation)后截断:是前方一致检索,又称右截断,截词符放在被截词的右边,是最常用的截词检索技术。后截断主要用于下列检索:词的单复数检索,如company与companies;年代检索,如199?(九十年代);词根检索,如socio*,可以检索sociobiology,socioecology,sociology等20多个词汇。前截断:截词符放在被截词的左边,可与后截断一同使用。例如输入*magnetic,可检electro-magnetic、electromagnetic、thermo-magnetic等。目前这种检索技术应用已经极少。中截断:把截词符放在词的中间。如organi?ation,可检索organisation、organization。这种方式查找英美不同拼法的概念最有效。截词举例符号:*,?,$后截断:librar*library,libraries,librarian,…前截断:*magneticmagnetic,electro-magnetic,electromagnetic,thermo-magnetic,…中截断:organi?ationorganization,organisation截词检索类型根据截断的数量不同,分为有限截断和无限截断。无限截断:不限制被截断的字符数量,例如输入educat?,可以检索educator,educators,educated,educating,education,educational,等等。有限截断:限制被截断的字符数量,例如输入educat**,表示被截断的字符只有两个,可以检索educator,educated两个词。词根检索有些检索系统不支持使用截词符的截词检索技术,系统默认的是词根检索,即输入一个词,系统会自动检索出同一词根的一组词,例如输入gene,可以检索出gene,genic,genome等。这是一种智能检索方式,但要求系统内必须预先配置词根表。IEE/IEEE全文数据库默认词根检索有些数据库需要加入词根运算符如“$”才进行词根检索inSpirs网上各类型信息资源查询数字图书馆:中国数字图书馆、书生之家数字图书馆、超星数字图书馆、北大方正的Apabi系统。报刊资料:中国学术期刊网、中文科技期刊数据库、中国财经报刊数据库。会议文献:中国科学院学术会公告、学界动态、IEEE学术会议数据库、万方学术会议文献数据库、中国重要会议论文集全文数据库、国内专业会议资料数据库、OCLC的会议文献数据库、美国科学信息研究所(ISI)会议数据库。学位论文:中国学术期刊网和万方数据资源系统的学位论文数据库、高校学位论文数据库、PQDD数据库(美国)。专利文献:中国专利信息网、国家知识产权局、DILAOG系统、世界知识产权组织专利数据库、美国专利商标局专利检索数据库。标准类:中国标准咨询网、万方数据资源系统标准数据库、国际标准化组织、美国国家标准委员会。