第四讲检索工具技术步骤与评价.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第4讲检索工具、检索技术、检索步骤、效果评价内容:教材第2章2-4节,4章目的与要求:通过熟悉常用检索工具及信息检索基本技术,让学生能够根据实际信息需求,使用适当的检索工具,选择合适的检索途径及策略找到需要的信息。要求掌握信息检索各步骤内容,会熟练选择检索工具并运用计算机检索技术查找文献信息;能够对检索结果进行评价,并能够利用检索结果调整策略根据检索需求适当调整检准率与检全率。教学重、难点:1.索引的特点与作用;题录、全文数据库的特点;2.三层结构(字段、记录、文档)与文献特征的对应关系;搜索引擎。3.计算机信息检索基本技术;加权检索、扩展检索、二次检索等。4.查全率、查准率的计算方法与基本调整措施;5.影响检索的主要因素及应对措施。24.1信息检索工具(系统)P254.1.1信息检索工具的定义检索工具是人们为了快速、全面、准确地查询已有的文献信息资源,按照一定的著录规则编制而成的用以报道、存储和查找信息的工具。二次文献即是一种检索工具。现在主流的检索工具形式是数据库。34.1.2信息检索工具的作用:存储作用将大量分散的、不同种类、不同学科的信息资料,进行组织排列使信息由分散到集中,由无序到系统化。报道作用把不同学科信息的类型、数量、质量展示给信息利用者,促进信息传递和使用检索作用以特征序化而形成检索途径可使人们根据特征来寻求与之相对应的信息或文献。44.1.3检索工具的类型可按收录范围、载体形式、加工手段等划分一、按检索工具提供文献信息的特点划分为:一)线索型(目录、题录、文摘、索引)二)事实型三)全文型四)引文型5目录:是以一件或一种完整的出版物(如一本书、一种期刊等)作为著录基本单位的检索工具。主要揭示、报道出版物的外表特征。作用主要是提示藏书,指导阅读。一)线索型检索工具6题录:是以单篇或单份文献为著录的基本单位的检索工具,题录也主要揭示、报道文献的外表特征,但其著录格式于目录有所不同。【论文题名】网络环境下信息检索与报道服务浅析【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment【作者】丁彩云DINGCai-yun【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004【刊名】株洲师范高等专科学校学报【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE【年卷期】2005Vol.10No.2【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道一)线索型检索工具7文摘:是在题录的基础上,在每条著录款目后边再加上文献内容的摘要。【论文题名】网络环境下信息检索与报道服务浅析【英文题名】InformationRetrievalandReportServiceinNetworkEnvironment【作者】丁彩云DINGCai-yun【作者单位】湖南化工职业技术学院,图书馆,湖南,株洲,412004【刊名】株洲师范高等专科学校学报【英文刊名】JOURNALOFZHUZHOUTEACHERSCOLLEGE【年卷期】2005Vol.10No.2【关键词】图书馆;网络环境;信息搜集;信息检索;信息报道【摘要】网络环境下的信息服务已对图书馆的机构组织、人员素质、服务水平和社会地位产了巨大影响.掌握网络环境下的信息服务特点和方法,尽快适应网络环境已成为图书馆提高信息服务质量的重要课题.一)线索型检索工具8索引:是把特定范围内文献中的有关款目或知识单元(如书名、刊名、人名、地名、语词等外表或内容特征)按照描述语言形成标识,按其固有顺序排列起来,并指明出处,为用户提供文献线索的一种检索工具。一)线索型检索工具二)事实型检索工具检索结果是回答问题的知识本身,而不是查找知识的线索。包括事实、数据、知识内容等。三)全文型检索工具特点:提供完整的文献单元内容;不保证内容是否绝对真实、正确。四)引文型检索工具主要功能是用来查找文献间引证关系(继承、评价)如SCI、CSCD等。9二、按信息加工处理的手段分一)手工检索工具历史悠久;形式多样;词义检索;人脑判断与筛选(詹德优《中文工具书导论》中分为8类):书目、索引、文摘;字典、辞典;类书、政书;百科全书;年鉴、手册、名录;表谱;图录;丛集汇要。二)机械检索工具(过渡形式)三)计算机检索工具(数据库)当前主流。更能满足用户对检索的主要要求:准:要求检出的文献有针对性,能解决研究中的具体问题。全:全面了解某一特定领域(问题)的发生、发展和现状。新:掌握最新动态或进展。快:最短时间内获得结果。定义、历史发展、系统构成、类型划分(自学,教材P50-54)1011常用的外文生物医学数据库:PubMed数据库荷兰《医学文摘》数据库(EM)《生物学文摘》数据库(BA)化学文摘数据库(CA)《科学引文索引》数据库(SCI)常见的中文生物医学数据库:中国生物医学文献数据库(CBMdisc)中国知网维普资讯网(维普智立方)万方数字化期刊中医药文献数据库121、数据库的结构13数据库是检索系统的信息源和核心。利用一个数据库,首先要了解其结构。不同的数据库,虽然利用原理相同,但由于数据内容和利用目的的不同,使得其数据结构和文献记录标引方式也有一定的差异,因而其利用也各有特点。数据库对文献特征的组织和揭示影响着数据库的利用及效果。各种数据库的共同点(P54)数据库结构均为字段、记录、文档3个层次的构成。14(从大到小)文档记录字段若干个记录构成的信息集合称为文档。大型的数据库分割成若干文档。记录是构成数据库的完整的信息单元,每条记录描述了原始信息的外部特征和内部特征。组成记录的数据项目15文章号篇名作者文摘全文001asdZhouXxx……..002bysDangYyy……..……vcaWenzzz……..篇名文章号Asd001Bys002vca……作者文章号Dang002Wen……Zhou001索引文档1:篇名索引索引文档2:作者索引主文档(顺排文档)检索篇名检索作者当你要在篇名中查找时,搜索指令将在篇名索引中进行搜索,然后将主文档中对应的记录调出来各项数据以构成一张横竖对齐的二维表格形式存放于数据库文件(库文件)中。文章号唯一,且索引文档与主文档的文章号一一对应索引文档(倒排文档)文档(File)由众多记录按一定方式组织在一起形成。162、搜索引擎(Searchengine)P58概念:是根据一定的策略、运用特定的计算机程序搜集互联网上的信息,在对信息进行组织和处理后显示给用户,为用户提供检索服务的系统。原理:同样分为信息存储与信息检索两个过程。将存储信息与检索需求进行相似度计算,并按一定的排序原则显示在屏幕上。17搜索引擎分类按工作方式:全文搜索引擎代表:百度,谷歌目录索引类搜索引擎代表:早期的Yahoo其他搜索引擎名称:元搜索引擎集合式搜索引擎门户搜索引擎免费链接列表本部分内容安排有实习,此处不展开讲解。184.2计算机信息检索基本技术P55计算机信息检索技术:是指从计算机信息系统中提取符合用户信息需求相关信息的技术。常用计算机算符:布尔逻辑算符字段限定符截词符位置算符其他……194.2.1布尔逻辑检索与布尔算符:来源:(布尔代数)逻辑与、逻辑或、逻辑非。作用:布尔逻辑运算符用来表示两个检索词之间的逻辑关系,用以形成一个逻辑表达式。计算机根据逻辑表达式查找符合限定条件的文献信息。布尔算符形式(3种):逻辑与(AND)逻辑或(OR)逻辑非(NOT)20布尔逻辑算符一、逻辑“与”(AND)表达概念间交叉限定关系的一种组配;作用:描述更为准确,缩小检索范围,提高查准率。例:查找“胰岛素治疗糖尿病”的文献,基本检索式为:insulinANDdiabetes胰岛素AND糖尿病检索式“AandB”表示文献中同时包含检索词A和检索词B的文献才是命中文献。(如右图)21布尔逻辑算符二、逻辑“或”(算符:OR)表达概念间并列关系的一种组配;作用:扩大检索范围,提高查全率。如:查找“肿瘤”的检索式为cancer(癌)ortumor(瘤)orcarcinoma(癌)orSarcomas(肉瘤)orneoplasm(新生物)orlymphoma(淋巴瘤)……。检索式“AorB”表示包含检索词A的文献或者包含检索词B的文献或者同时包含检索词A和B的文献为命中文献。使用注意:处理好整体与部分的关系,避免漏检。22布尔逻辑算符三、逻辑“非”(算符:NOT)表达概念间不包含关系的一种组配。作用:缩小检索范围,提高查准率。例:查“动物(非人类的)感染乙肝病毒”的相关文献。检索式:hepatitisBvirus(乙肝病毒)NOThuman(人类)?“AnotB”表示包含检索词A但不包含检索词B的文献为命中文献。使用需注意:处理好交叉关系,避免漏检。23运算次序与注意事项运算次序在一个检索式中,可以同时使用多个逻辑运算符,构成一个复合逻辑检索式。一般情况下,运算优先级别如下所示(可以使用括号改变运算次序)。()>NOT>AND>OR例:检索厚朴或槟榔对兔离体肠平滑肌运动功能的影响.(厚朴OR槟榔)AND平滑肌实际使用中,不同数据库对运算次序解释不同。24检索实例:例:查找有关肿瘤引起的贫血的非英文文献neoplasms(肿瘤)/complications(并发症)anemia(贫血)/etiology(病因学)English#11687NEOPLASMS/complications#2179ANEMIA/etiology#323867EnglishinLA(或LA=English)#420(#1and#2)not#325截词检索:利用计算机特有的指定位对比判断功能,使不完整词能与标引词进行比较、匹配的一种检索。实质是用逻辑OR对具有相同的词头或词尾的词汇进行检索。截词符号也称通配符,通常用“*”代表无限多字符组合,而用“?”代表任意一个字符。4.2.2截词检索与截词符26一、后截断:将截词符号放在一个字符串的右方,以表示其右的有限或无限个字符组合方式均符合该字符串的检索要求。后截断检索技术最常用,其主要用途有:词的单复数,如book?同根词,例如biolog*,physic*年代,例如199?,19??作者,例如:Lancaster*例如:hypertensi??可查到hypertension、hypertensive。hyperthyr*可查到hyperthyre、hyperthyreosis、hyperthyroid、hyperthyroidosis、hyperthyroidism等。27二、前截断:将截词符号放在一个字符串的左方,以表示其左方有有限或无限个字符。前截断因为实现技术上较困难,在检索系统中比较少见。其主要用途在于:进行一个主题在不同领域应用情况的检索;在化学化工文献中多有类似情况。例1:*magnetic,可检索出magnetic(有磁性的)、electro-magnetic(电磁的)、patamagnetic(顺磁的)、thermo-magnetic(热磁的)thermomagnetic等词的文献。例2:*sighted,可查到farsighted与nearsighted。28三、中截断:将截词符号放在一个检索词的中间的一种截词方式。只允许有限截断,用于检索词的单复数或英美式不同拚法。例如:wom?n,可查到Woman,Women。defen?e,可查到defense,defence。29截词检索在大多数检索系统可基本实现。截词检索的优势:是防止漏检的有力手段。能扩大检索范围,提高查全率;可以减少检索词的输入工作量;简化检索步骤(不需要用OR进行同义词的组配)。注意截断部位是否合适:不是所有用截词符产生的单词与你的检索意图相

1 / 60
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功