第六章信息检索

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

信息管理概论王爱Wangai_001@163.com——第六章信息检索236.1信息检索的沿革与发展456.1.2信息检索的类型与特征66.1.2信息检索的类型与特征76.1.3信息检索的发展历程86.1.3信息检索的发展历程96.1.3信息检索的发展历程106.1.3信息检索的发展历程116.1.3信息检索的发展历程126.1.4信息检索模型136.1.4信息检索模型146.1.4信息检索模型156.1.4信息检索模型166.1.4信息检索模型176.2信息检索的职能与程序186.2.2信息检索策略196.2.2信息检索策略20216.2.2信息检索策略226.2.3信息检索效率的评价236.2.3信息检索效率的评价246.2.3信息检索效率的评价256.2.3信息检索效率的评价266.2.3信息检索效率的评价276.2.3信息检索效率的评价286.2.4信息检索的程序296.2.4信息检索的程序306.2.4信息检索的程序316.2.4信息检索的程序326.2.4信息检索的程序336.3信息检索的技术与方法6.3.1手工信息检索的技术与方法6.3.2机械信息检索的技术与方法6.3.3计算机信息检索的技术与方法346.3.1手工信息检索的技术与方法1、手工信息检索工具目录:图书或其他单独出版物规律化、系统化的记载索引:把一种或多种书刊里的具体内容按一定的方式分别摘录,并注明出处,以便检索的一种工具文摘:把文献资料的主要内容,由有一定水平和经验的编者将其准确简要地摘录出来,并注明出处后,经分类排序而编制成的检索工具年鉴:以描述和统计的方式逐年提供某一领域信息的工具书手册:汇集某一学科领域或业务部门专门知识的工具书百科全书:荟萃一切门类或某一门类知识、以概要方式介绍为主的多功能工具书356.3.1手工信息检索的技术与方法2、手工信息检索工具的排检技术字顺排检技术:将检索工具的内容按字、词的一定顺序或规律,有系统地组织排列起来的技术。分类排检技术:将信息素材按学科或事物性质系统地加以排列。主题排检技术:以规范化的自然语言为标识符号来标引信息内容的排检技术时序排检技术:按时间的顺序组合信息素材的技术,多用于编制年表、年谱等检索工具。地序排检技术:按一定时期的行政区域来排列信息素材的技术。366.3.1手工信息检索的技术与方法3、手工信息检索方法顺查法:一种以信息检索课题起始年代为起点,按时间顺序由远而近地查找信息的方法。倒查法:一种逆时间顺序由近而远地查找信息的方法抽查法:一种针对研究课题发展的特点,抓住学科发展迅速、发表文献较多的年代进行查找的方法。追溯法:又叫回溯法,是以某一篇文献末尾所附参考文献的线索进行追溯查找。循环法:先用检索工具查出一批文献,然后再利用这些文献末尾所附参考文献的线索进行追溯查找的方法。376.3.2机械信息检索技术与方法机电信息检索系统继手检穿孔卡片之后,出现了机检穿孔卡片和选卡机。这就形成了机电信息检索系统。光电信息检索系统主要是以缩微胶卷(片)检索方式出现的。缩微胶卷(片)的检索方式大致可以分为两种类型:(1)寻址检索方式(2)编码检索方式386.3.3计算机信息检索技术与方法一、联机信息检索信息用户利用终端设备,通过通讯网络与世界各地的信息检索系统联机,进行人机对话,从检索系统的数据库中查找出用户所需信息的全过程。优点:①检索速度快;②检索范围广而全面;③检索途径多、质量高;④检索内容新、实时性强;⑤检索辅助功能完善、使用方便,检索结果输出方式灵活、实用。缺陷:①主机负担重,一旦出现故障,则整个网络都将瘫痪;②信息组织方式以线性为主,不够灵活;③联机检索不像Internet是面向最终用户的,操作也没有后者方便。396.3.3计算机信息检索技术与方法联机信息检索系统的结构:由检索服务机构、国际通讯网络及终端三部分构成。联机信息检索的技术原理:一个典型的计算机信息系统,能完成数据收集、分析、加工处理、存储、传递通信和检索信息的全过程。联机信息检索的服务方式:a、定题信息提供b、专题回溯检索c、联机订购原文d、电子邮件406.3.3计算机信息检索技术与方法(二)光盘信息检索特点:使用光盘检索系统,可免联系检索系统所必须使用的电讯设备,节省了电讯费和联机系统使用费,还可免除由通信线路传输过程中所造成的失误。光盘系统向用户提供相当于联机信息检索系统功能的软件。光盘存储容量大、耐用、复制费用低如果光盘数据库量不够多,则信息资源就显得有限,购买大量光盘数据库,又受到经费限制。光盘检索不如联机检索系统,因为光盘只能定期提供。数据库费用大416.3.3计算机信息检索技术与方法(二)光盘信息检索光盘信息检索系统由微机、驱动器及连接设备、CDROM数据库(光盘)及其检索软件构成。选在驱动器时主要考虑以下性能:a速度:一般在185ms-500ms之间b查找速度:一般在250ms-400ms之间c数据缓冲区越大,可直接从存储器存取的数据就越多,节省查询时间d数据传送速度:有单速、双速乃至40倍以上的驱动器。426.3.3计算机信息检索技术与方法(三)网络信息检索特点:信息量更大需要处理各种不同的语言(大多是自然语言)信息检索的范围更宽(多学科、多领域)信息检索的时效性要求更高检全率较高,而检准率较低436.3.4信息检索技术演进信息检索是一个具有浓重技术色彩的研究领域,其技术经历了快速而巨大的演变和进步;检索对象:结构化书目信息—无结构化或半结构化全文文本—多媒体信息信息组织方式:传统的线性文本组织—超文本/超媒体组织检索匹配技术:关键词(字面)匹配——基于概念匹配——概念语义匹配与推理检索方式:手工检索—计算机化—联机实时—网络检索环境:单机—网络平台,集中网络—分布式网络446.3.5大型综合性检索系统大型综合性检索系统:中国知识基础设施工程(CNKI,);万方数据资源系统();维普资讯有限公司数据库系统;中国高等教育文献保障系统CALIS();联机检索系统Dialog();联机计算机图书馆中心OCLC();454647484950常用的大型数据库:中国人民大学书报资料中心复印报刊资料全文数据库;国家科技图书文献中心(NSTL)数据库();北京文献服务处(BDS)全文信息检索系统();上海市图书馆全国报刊索引数据库;ProQuest系统全文数据库();EBSCO书目与全文数据库();51常用的大型数据库:中国人民大学书报资料中心复印报刊资料全文数据库;国家科技图书文献中心(NSTL)数据库();北京文献服务处(BDS)全文信息检索系统();上海市图书馆全国报刊索引数据库;ProQuest系统全文数据库();EBSCO书目与全文数据库();526.4搜索引擎搜索引擎(SearchEngine)搜索引擎是提供给用户进行关键词、词组或自然语言检索的工具,简言之,就是一种在互联网上查找信息的工具。工作的基本原理是:用户提出检索要求,搜索引起代替用户在数据库中进行检索,并将检索结果反馈给用户。检索的结果:上的主页、新闻组中的文章、软件的存放地址及作者、企业网站、个人主页等。536.4.1搜索引擎的发展阶段第一代:根据词频搜索的原理开发第二代:“超链分析”技术第三代:以竞价排名商业模式为特征下一代:社区化搜素“知识共享社区+搜索引擎”546.4.1搜索引擎的发展阶段(1)基于web内容特征的排序技术主要考虑用户所查询的关键词在结果网页中的出现的频率和出现的位置等因素,并以此来评价命中网页与用户查询请求之间的相关度大小,作为排序依据。556.4.1搜索引擎的发展阶段566.4.1搜索引擎的发展阶段(2)基于网页链接结构的排序技术最早出现在1998年,主要根据网页被链接或被引用的情况来判断页面信息的权威性和质量,以此来优化对搜索结果的排序,如Google中的PageRank算法。57585960(3)通过关键词竞价的排名搜索引擎通过将关键词拍卖,让网站或网页所有者对其价格进行竞争的办法来产生搜索结果的排序616.4.1搜索引擎的发展阶段(4)基于知识共享的社区化搜索机器搜索—社区搜索百度知道雅虎知识堂新浪爱问626364

1 / 64
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功