信息检索技术

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

信息检索技术与方法主讲:黄艳娟huangyanjuan@hrbeu.edu.cnTel:82519545提纲信息检索方法信息检索途径信息检索技术信息检索步骤网络信息资源检索信息检索方法直接检索法间接检索法追溯检索法循环检索法顺查法倒查法抽查法间接检索方法•顺查法:按时间顺序,从过去到现在,由远及近地利用检索系统进行文献信息检索的方法。•倒查法:利用检索工具从最近期向早期查找。•抽查法:根据检索课题的特点,选择有关课题的文献发表较多的年代,利用检索工具进行重点检索的方法。追溯检索法是指不利用检索工具,而是利用文献后面所列的参考文献,逐一追查原文(被引用文献),然后再从这些原文后所列的参考文献目录逐一扩大文献的信息范围,一环扣一环地追查下去的方法。信息检索途径责任者途径题名途径分类途径主题途径序号途径引文途径信息检索技术布尔逻辑检索截词检索邻近检索字段限制检索模糊检索布尔逻辑检索截词检索•对于词干相同而词尾不同的词,如computercomputecomputing等,可以采用截词检索。Comput*•截词的方式有前截断、中截断和后截断。bas?s=basisbases等截词符号有*?$#等。邻近检索•邻近检索表示两词之间的位置邻近关系,常用到的位置算符有(W)(nW)(N)(nN)等W算符是word或with的缩写,表示在此算符两侧的检索词必须按输入时的前后顺序排列,而且所连接的词之间除了有一个空格或一个标点外不得夹有其他的单词或字母。information2Wmanagement可包括Informationtechnologiesandmanagement和Informationmanagement•N算符是near的缩写,表示在此算符两侧的检索词必须紧密相连,词序可颠倒。•nN表示两检索词之间最多可以插入n个单词,且词序可颠倒。informationNretrievalinformation2Nretrieval字段限制检索•字段限制检索是限定检索词在数据库中出现的字段范围的一种检索方法。如:作者=张三题名=金属热处理字段检索词模糊检索•模糊检索(fuzzysearch)也称概念检索。是指检索系统不仅能检索出包含指定的检索词,还将与检索词主题概念相同的信息检索出来。当输入一个只表达所要查检信息的检索词或词语,系统即可以反馈一串与此内容相近的词或词语。信息检索的步骤课题分析选择相关信息资源制定检索策略,选择检索入口试验性检索和修改检索策略检索结果的评价课题分析1明确检索目的*需要关于某一课题的系统详尽的信息*需要关于某课题的最新信息*了解一些片段信息,解决一些具体问题2明确课题的主题或主要内容要形成若干个既能代表信息需求又具有检索意义的主题词(关键词),及其关系3课题涉及的学科范围4所需信息的数量、语种、年代范围等指标课题一深潜器的发展综述二我国近3年深潜器的研究三哈尔滨工程大学2005年发表的有关机器人方面的论文四纳米管的结构和制备五聚氯乙烯的机理及应用研究选择相关信息资源•是否所有与检索课题相关的信息资源都检索•选择哪些学科的信息资源•选择哪些语种的信息资源•信息资源覆盖的年限范围•信息资源的特点及针对性制定检索策略,选择检索入口•检索策略是为完成检索课题,实现检索目的,对检索的全过程进行谋划之后所制定的全盘检索方案。•检索式:是检索策略的逻辑表达式,是用来表达用户检索提问的,由基于检索概念产生的检索词和各种组配算符构成。(篇名=深浅器or潜器)and年代=2000-2007选择检索入口(检索途径/字段)•题名•责任者•篇名•主题词•文摘•关键词CNKI数据库简单检索CNKI数据库高级检索CNKI数据库二次检索试验性检索和修改检索策略•无论是手工检索还是计算机检索,对于较大的检索课题,一般应先进行快速、少量的试验性检索,以检验检索策略是否合理有效。然后根据试验见过确认或修改原定的检索策略。检索结果的评价•查全率:从数据库中检出的相关文献量与数据库中总文献量的比率。•查准率:指数据库中检出的相关文献量与检出的文献总量的比率。查全率=a/a+c×100%查准率=a/a+b×1000%查全率=检出的相关文献数系统中的相关文献总数查准率=检出的相关文献数检出的文献总数例题:如CNKI数据库中共有“企业管理”方面的相关文献280篇,而小李同学在CNKI数据库中只检索出160篇,而且其检索出的结果中还有28篇是不相关的,那么小李这次检索的查全率和查准率各是多少?KEY•查全率47.1%•查准率82.5%索原文•原文的含义•如果索取原文什么是原文•原文就是原始文献。相对于题名、文摘、参考文献等从不同侧面描述文献的检索标识和著录信息来说,原文就是我们所要查找的文献本身。如何索取原文•通过相应的链接直接获取原文•通过专门收藏机构获取原文•在相应的数据库或检索系统中检索后,直接采取单篇购买方式获取全文网络信息资源检索网络信息资源检索网络信息资源的含义网络信息资源的检索工具国内外典型搜索工具网络信息资源的含义•网络信息资源是指以电子数据的形式将文本、图像、声音、动画等多种形式的信息存放在光磁等非印刷型载体的介质中,并通过网络通信、计算机或终端等方式再现出来的电子信息资源。网络信息资源的检索工具•FTP•BBS•RSS•搜索引擎FTP是英文FileTransferProtocol的缩写,译为文件传输协议。它的主要功能就是完成从一个系统到另一个系统的完整的文件拷贝。BBS称为电子公告板,BulletinBoardSystem。它提供一块公共电子白板,每个用户都可以在上面发布信息或提出看法,具有信件交流、软件交流、信息发布等功能。RSS是简易信息聚合(RSS:ReallySimpleSyndication)的英文缩写,使用RSS订阅功能就如同线下订阅报纸、杂志一样,并且更加地便捷。本站每一个频道,例如新闻、个人Blog、论坛、黄页、分类信息等等,都提供了RSS订阅功能,使用RSS阅读器,例如Foxmail6.0以上版本,您就可以从中订阅自己感兴趣的内容。RSS阅读器会自动收集您订阅的最新信息,保持信息内容的及时性,无需您再逐页访问网站,目标性强,为您节省宝贵的时间。搜索引擎(searchengines)是对互联网上的信息资源进行搜集整理,然后供用户查询的系统,它包括信息搜集、信息整理和用户查询三部分。搜索引擎是一个为用户提供信息“检索”服务的网站,它使用某些程序把因特网上的所有信息归类以帮助人们在茫茫网海中搜寻到所需要的信息。国内外典型的搜索工具•Google•百度•搜狐•雅虎•Excite•Altavista•Lycos•Scirus•网上书店亚马逊Amazon.com是全球最大的互联网书店。可检索310多万种书目,在亚马逊网站上读者可以买到近150万种英文图书、音乐和影视节目等20多个门类的商品。当当网上书店是全球最大的中文网上书店。当当经营20万种图书。www.dangdang.com/book.asp网上免费电子图书网站•小说阅读网•原创文学门户——起点中文网•免费文学书库•榕树下•潇湘书院•中华读书网•中国电子图书网•全景中文图书/小说大全www.cnovel.com

1 / 36
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功