信息管理与信息系统专业核心课信息检索信息检索IfratiRtrialInformationRetrieval2014/9/301主要内容主要内容一课程简介、课程简介二信息检索概论二、信息检索概论22014/9/30一课程简介一、课程简介(一)信息检索是什么?(二)为什么要学习信息检索?(三)学什么?(三)学什么(四)怎么学?(四)怎么学?32014/9/30一课程简介一、课程简介(一)信息检索是什么?从个联应用说起•从几个互联网应用说起……42014/9/30个应用例子的共同特征三个应用例子的共同特征•给定需求(或者是对象),从信息库中找出与之昀匹配的信息(或对象)出与之昀匹配的信息(或对象)–Google的例子:需求“信息检索概论”–卓越-亚马逊的例子:对象“天王表-石英女表LS3522S(黑色)”–世纪佳缘网的例子:•对象“你自己”!对象你自52014/9/30()信息检索是什么?(一)信息检索是什么?2014/9/3062014/9/3072014/9/308信息检索信息检索•从大规模非结构化数据(通常是文本)的集合(通常保存在计算机上)中找出满足用合通常保存在计算机中找出满足用户信息需求的资料(通常是文档)的过程。•给定用户需求返回满足该需求信息的门•给定用户需求返回满足该需求信息的一门学科。通常涉及信息的获取、存储、组织和访问和访问。•“找对象”的学科,即定义并计算某种匹找对象的学科,即定义并计算某种匹配“相似度”的学科。92014/9/30一课程简介一、课程简介(一)信息检索是什么?()信息检索是什么(二)为什么要学习信息检索?为什么要学习信检索(三)学什么?(四)怎么学?102014/9/30(1)信息检索的重要性(1)信息检索的重要性•全球范围数字化、信息化的基础服务科学究领域中的信息获•科学研究领域中的信息获取•电子商务中的产品检索、评估电子商务中的产品检索、评估•日常生活中的信息和知识的获取•企业创新能力的提高112014/9/30(2)市场发展的需求(2)市场发展的需求•用户需要信息检索技术:互联网的信息量太大、噪音太用户需要信息检索技术:互联网的信息量太大、噪音太多,寻找所需要的信息非常不容易•企业需要信息检索技术搜索引擎改变了很多传统的生•企业需要信息检索技术:搜索引擎改变了很多传统的生活方式,Yahoo、Google、Baidu,还有一些公司如MicrosoftSinaSohuTecentNetease都加入到这个搜Microsoft、Sina、Sohu、Tecent、Netease都加入到这个搜索技术的竞争。不只是搜索引擎才需要信息检索技术,电子商务(如亚马逊网站、阿里巴巴)、社交网(微博、子商务(如亚马逊网站、阿里巴巴)、社交网(微博、Facebook、twitter、校内网)、数字图书馆、大数据分析等都需要信息检索技术都需要信息检索技术–人才的竞争:搜索相关人才人数出现缺口,他们非常抢手,待遇如日中天抢手,待遇如日中天122014/9/30一课程简介一、课程简介(一)信息检索是什么?(二)为什么要学习信息检索?(三)学什么?(四)怎么学?132014/9/30(1)课程目的(1)课程目的•掌握信息检索的基本知识、基本理论•熟练掌握常用信息检索系统熟练掌握常用信息检索系统•将所学信息检索的知识在实际运用中进行实践在定程度上把握本学科的部分研究热点问题•在一定程度上把握本学科的部分研究热点问题和前沿问题进行文献文献综述的练•进行文献调研和文献综述的训练•学会科学研究的一般方法,为下学年的毕业设计进行文献检索和文献综述做准备。14142014/9/30(2)教材与主要参考书目(2)教材与主要参考书目教材教材祁延莉,赵丹群.信息检索概论.北京:北京大学出版社,2013参考书目1孙建军,等.信息检索技术.北京:科学出版社出版社,20042ManningCD,RaghavanP,SchützeH.AnIntroductiontoInformationRetrieval.Cambridge:CambridgeUniversityPress,20093张晓林.现代信息检索技术与系统.成都:张晓林现代信检索技术与系统成都成都科技大学出版社,19964夏立新等.信息检索原理与技术.北京:科学出版社,20112014/9/30科学出版社,0(3)课程体系结构(3)课程体系结构检匹匹检检信息用户需求需求状态检索系系统描述界面功能匹配框匹配函检索策检索技息用户需求状态状态转换提问分析系统(工界面设计数据库检索服务与评价架数略术户提问分析具)基本概念、基本理论、基本历史、基本方法与实例系统检索服务与评价基本信息环境162014/9/30(4)本课程主要内容(4)本课程主要内容•基本概念与基本理论•检索工具与检索系统检索工具与检索系统•基本检索技术•检索系统应用•检索服务与评价•检索服务与评价172014/9/30一课程简介一、课程简介(一)信息检索是什么?(二)为什么要学习信息检索?(三)学什么?(四)怎么学?182014/9/30如何学好“信息检索”?如何学好“信息检索”?•掌握必须的基本知识•实践总结经验体会实践……foreverforever192014/9/30(1)教学方式(1)教学方式–讲授讲授基本知识基本理论基本方法课堂演示常用信•讲授基本知识、基本理论、基本方法,课堂演示常用信息检索系统上机检索与文献综述–上机检索与文献综述•先在课堂上布置一些学科热点问题,然后大家在上机课和课后进行文献调研并进行文献综述和课后进行文献调研,并进行文献综述。•该课程是一门实用性和实践性很强的课程,对信息检索的理论只要求一般理解和了解,但要注重实用,强调实的理论只要求般理解和了解,但要注重实用,强调实践,掌握方法,所以,一定要重视上机实践和文献综述。–课堂讨论•在上机检索和文献综述的基础上,进行课堂讨论发言。(分组)202014/9/30(2)课程考核说明(2)课程考核说明•课程成绩构成–考勤10%平时作业50%–平时作业50%–期末考试40%期末考试40%212014/9/30主要内容主要内容一课程简介、课程简介二信息检索概论二、信息检索概论222014/9/30二、信息检索概述二、信息检索概述2014/9/3023课程体系结构课程体系结构检匹匹检检信息用户需求需求状态检索系系统描述界面功能匹配框匹配函检索策检索技息用户需求状态状态转换提问分析系统(工界面设计数据库检索服务与评价架数略术户提问分析具)基本概念、基本理论、基本历史、基本方法与实例系统检索服务与评价基本信息环境2014/9/3024息二、信息检索概述()信息检索的基本概念(一)信息检索的基本概念(二)信息检索的基本原理(二)信息检索的基本原理(三)信息检索的研究对象与研究方法(三)信息检索的研究对象与研究方法(四)信息检索的发展历史2014/9/3025息二、信息检索概述信息检的基本念(一)信息检索的基本概念1信息检索的定义1、信息检索的定义2信息检索的类型2、信息检索的类型2014/9/3026信息检索的三种基本观点第一类(面向系统观点)从信息处理出发,致力于用数学语言来描述信息检索过程和在这个过程中的各种有关因信息检索过程和在这个过程中的各种有关因素之间的匹配关系,强调计算机化的检索系统的设计建立和管理统的设计、建立和管理。2014/9/30信息检索127信息检索的三种基本观点信息检索的三种基本观点第二类(面向用户观点)第二类(面向用户观点)立足于记录下来的知识如何组织,如何有针立足于记录下来的知识如何组织,如何有针对性地为用户查找与利用,而把计算机信息处理作为服务于实现机械化与自动化检索系统的种手段种可资利用的知识统的一种手段、一种可资利用的知识。2014/9/30信息检索128信息检索的三种基本观点信息检索的三种基本观点第三类(面向认知观点)第三类(面向认知观点)更加关注在复杂的信息查寻与检索情境中人更加关注在复杂的信息查寻与检索情境中人类行动者、工作任务与搜索任务的作用,以及相关性判断的社会情境影响。2014/9/30信息检索129信息管(情报学)学界的信息检索概念信息管理(情报学)学界的信息检索概念广义上广义上信息检索就是将信息按一定的方式组织与存储起来,并根据信息用户需求查找出相关信息的方法与技术,并根据信息用户需求查找出相关信息的方法与技术,即信息存储与检索(informationstorageandretrieval);retrieval);狭义上信息检索仅仅是广义信息检索的后部分即从信息信息检索仅仅是广义信息检索的后一部分,即从信息集合中找出所需信息的方法与技术,亦称为信息查寻(iftikih)(informationseekingorsearch)2014/9/30信息检索130(一)信息检索的基本概念(一)信息检索的基本概念信息检索的实质有目的和组织化的信息存取活动有目的和组织化的信息存取活动是用户的信息需求或信息检索式与信息集合或是用户的信需求或信检索式与信集合或信息替代品的比较与选择,即匹配(match)过程过程是一个相关性不断变化的过程是一个用户不断摸索的迭代过程2014/9/30信息检索131息二、信息检索概述信息检的基本念(一)信息检索的基本概念1信息检索的定义1、信息检索的定义2信息检索的类型2、信息检索的类型2014/9/30322信息检索的分类2、信息检索的分类信息检索分类存储信息信息检索信息存储检索对象信息组织形式信息检索手段检索服务区域信息规模对象形式手段区域2014/9/30332、信息检索的分类(1)按存储与检索对象(早期)2、信息检索的分类(1)按存储与检索对象(早期)文献检索(DocumentRetrieval)以文献(文摘,题录或全文)为检索对象事实检索(FactRetrieval)事实检索(FactRetrieval)以文献中事实为检索对象数据检索(DataRetrieval)以文献中数据为检索对象以文献中数据为检索对象三者区别在于?2014/9/3034教材P22、信息检索的分类(1)按存储与检索对象(现在)2、信息检索的分类(1)按存储与检索对象(现在)文本检索(textRetrieval)以各种自然语言符号系统所表示的信息为检索对象以各种自然语言符号系统所表示的信息为检索对象数值检索(metricRetrieval)以数值数据为检索对象以数值数据为检索对象多媒体检索(multimediaRetrieval)以形像音视频信息为检索对象以图形图像及音视频信息为检索对象超文本与超媒体检索(hypertext&hdiRtil)hypermediaRetrieval)以节点为内容以超链接为对象的检索2014/9/3035文本检索实例例1:张店区大学生不看重大城市的户口本文本检索实例张店区大学生不看重大城市的户口本本张店区大学生不看重大城市的户口本本张店区大学生不看重大城市的户口本本……例例2:Sawsawasawsawasaw2014/9/30362014/9/30372014/9/30382014/9/3039多媒媒体检检索CBR(CttbdRtil)形状颜色纹理空间关系CBR(Content-basedRetrieval):形状颜色纹理空间关系()2014/9/3040超超媒体及超文文本检检索12014/9/3042超媒体及超文本检索22014/9/30432、信息检索的分类信检索的分类(2)按信息的组织形式文摘索引检索()文摘-索引检索(Abstract-IndexRetrieval)以信息的加工浓缩物(主要是文摘与索引)为检索对象全文检索(Full-textRetrieval)以存储的全文为检索对象超文本检索(Hyper-textRetrieval)超文本检索(yp)以节点为检索对象,以形式或内容的链接提供浏览式查询览式查询超媒体检索(Hyper-mediaRe