信息检索思考题分栏排列

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《信息检索》复习大纲1.信息,是指事物的存在方式和运动状态,是对客观世界中各种事物的变化和特征的反映,是客观事物之间相互作用和联系的表征,是客观事物经过感知或认识后的再现。这里强调信息是事物属性的表征,即信息不是事物本身,而是用来表现事物特征的一种普遍的形式。特征客观性、普遍性、可存储性、可传递性、扩散性、共享性、时效性。功能有经济型功能,选择与决策功能、管理与协调功能、研究与开发功能。2.知识是人类通过信息对自然界。生物界、人类社会运动规律的认识和概括,是人的大脑通过思维重新集成整合的系统化信息,是信息中最有价值的部分。也就是说信息是产生知识的原材料,知识是信息的加工的抽象化产物。知识是一种特定的人类信息,它四对信息进行提炼和深化的结果。类型显性知识和隐性知识、实体知识和过程知识、核心知识和非核心知识。3.情报是具有特定传递对象的特定知识或有价值的信息。根据情报的来源与加工程度划分,情报可以分为:零次情报、一次情报、二次情报、三次情报。零次情报是指为公开于社会、没有经过记录整理、非正式传递的、直接作用于人的、非文献情报的总称。如私人笔记、手稿、设计草图、会议记录、口头言论等。一次情报:是指为经过加工或者加工程度等于零的原生情报。这种情报直接反映实际情况和科研成果,有如生产过程中的原料。固定原生情报的文献称为原生文献,也称一次文献。如调查报告、研究报告、科学论文、专利说明书、会议文献、专著等。二次情报是一种派生情报,是针对一次情报加工的产品。一二次情报的作用不仅在于报导,更重要的是为查找一次文献提供线索。刊载二次情报的文献称为二次文献,二次文献按照加工的方式和深度又分为书目、索引、文摘等形式。其中文摘是一份文献的内容缩短的精确的表达,它是二次情报的重要形式。三次情报是在一次二次情报的基础上,经过分析研究和综合概括而编撰的情报。刊载三次情报的文献称为三次文献,三次文献是情报研究的成果。其主要形式有综述、专题评论、年度总结、科研进展报告、数据手册、专业年鉴等。这种情报浓缩了所有的原生情报,可以节约大量阅读时间、减轻劳动强度、提高工作效率。4.信息、知识和情报之间的关系:知识是人的大脑经过思维重新集成整合的、反映事物运动规律的系统化信息,是信息中最有价值的部分;情报是具有特定传递对象的特定知识或有价值的信息,其中一部分在知识之内,另一部分则在知识之外的信息之内。因此,从逻辑上看,信息、知识、情报三者的概念是相容关系。具体来说、信息与知识、情报之间是属种关系,信息是属概念,知识、情报是信息之下具有交叉关系的种概念。5.信息资源的概念:广义,信息资源是指人类社会活动中积累起来的信息、信息生产者、信息加工技术等信息活动要素的集合。狭义,信息资源是指人类社会经济活动中经过加工处理有序化并大量积累后的有用信息的集合。特征有作为生产要素的人类需求性、稀缺性、使用方向可选择性、共享性、时效性。类型:根据载体不同可以分为,载体信息资源、文献信息资源、实物信息资源、网络信息资源。6.如何理解信息检索的概念:广义包括信息存贮和信息检索指将信息按一定方式收集组织和存储起来,并根据信息用户需求找出所需信息这一过程和技术;狭义不包括信息存贮,指依据一定方法,从已经组织好的信息集合中,查找并获取特定需求的信息这一过程。7.简述计算机检索的发展过程:计算机信息检索的发展过程经过脱机平批处理检索阶段、联机检索阶段、光盘检索阶段、网络化检索阶段。8.试述信息检索的基本原理:信检基本原理是检索提问标识与存储在检索系统中的标引标识进行比较,二者完全匹配或信息标引中的标识包含提问标识即为检索命中,具有该标识的信息就从检索系统中作为检索结果输出9.算机检索的原理:计算机检索的实现过程,计算机检索如同手工检索一样,都分两个过程,一是信息存储,即按一定的规则将信息进行加工,赋予特征标识,并将这些标识按照一定的顺序编排后纳入检索系统;一是信息检索,就是用户根据自己的检索要求向系统发出含有提问特征的检索式,系统自动地将自己存储的相关信息集合的标引标识及其逻辑组配关系与之类比、匹配、给出特征标识相符的记录。因此信息检索过程其实就是表示用户需求的字符串与系统内存储的大量字符串进行类比、匹配和逻辑运算的过程。实现条件:计算机、通信网络、检索终端设备、数据库10.信息检索的类型及其发展趋势:1.信息检索的类型按检索内容或检索对象分为文献、数据、事实检索;按组织方式分为全文检索、超文本检索和超媒体检索;按检索设备分为手工检索和机器检索。2.信息检索的发展趋势呈现出统一检索界面、主动的信息推送服务、多种检索模式融为一体、可视化技术实用化、检索的智能化。11.什么是检索语言?它有哪些主要类型:检索语言一般指文献标引和检索所使用的一种专门语言,是用以表达概括文献信息和检索课题内容特征的概念及其相互关系的一种概念标识系统,即在存储是用以描述文献信息的内容和外部特征,而在检索时则用于表达提问的语言。类型按检索语言的规范化程度可以分为规范化的人语言和非规范化的自然语言;按检索语言的词汇组配方式可分为先组式语言和后组式语言;按描述文献信息内容特征来划分,可分为分类语言和主题词语言;按词汇的类型来划分,可分为关键词语言、单元词语言、标题词语言和叙词语言等等。12.简述检索系统的概念及其类型。答:检索系统是为了满足信息需求而建立的,具有收集、组织、存储和查询等功能的文献信息资源和相关设备设施的总称。组成信息资源库技术设备规则体系检索人员。类型按加工手段和技术设备的不同,可将检索分为:手工检索系统、机械检索系统、计算机检索系统。按载体形式不同,可分为卡片式、书本式、缩微式、磁性材料式等检索系统。按著录格式不同,可将检索系统分为目录,题录、索引、文摘、全文检索系统。13.简述人工语言和自然语言的概念,比较它们的特点。答:人工语言:由人工采用规范词而创建的一种受情报检索控制的语言。人工语言使用的控制、规范词是用来专指某个概念和网络、指示宽度适当的概念,共检索时选择。它可以将同义词、近义词、多义词和缩略词等规范在一起,由人工控制,因此又称为控程语言。然语言:检索用词是取其自然形态,从信息内容本身抽取,不收人工控制,主要赖于计算机自动抽词技术来完成,但是需要辅助以人工自由标引,即不一句词表的标引方法,使用非规范词或称自由词。人工语言和自然语言的比较:人工语言的查全率和查准率均比较高,因此,人工语言的检索效率要高于自然语言。但是,人工语言是基于印刷型文献资源产生的,对标引来说,工作量大,成本高,对文献信息检索来说,用户不易掌握。而自然语言则不然,对标引来说主要由计算机检索系统自动完成,具有灵活性,新颖性、和专指性,并且检索点多,管理和维护的成本低;对文献信息检索来说,用户很容易掌握。但是,由于目前计算机的抽词技术还无法达到从自然语言中抽取最准确并能够表达信息资源内容的词,无法自动规范自然语言,无法指示概念之间的关系,缺乏对词汇的控制能力,因此检索效率比较低。14.什么是数据库?简述数据库的结构。:“至少一种文档组成,并能满足某一特定目的或某一特定数据处理系统需要的一种数据集合。”简单地说,它是某一范围的附有检索标识的记录的集合,即为满足特定需要而按一定方式和特定结构收集、加工、处理并存储在计算机中的关联数据的集合,这些数据具有共同的存取方式,可以供多个用户共同利用。一般结构:1字段、记录、文档;2顺排文档、倒排文档;3基本索引、辅助索引。从数据库用户的角度看数据库的结构可分为:集中式数据库结构、分布式数据库结构、并行数据库结构、易购数据库结构、客户机/服务器结构、浏览器/服务器结构。15.数据库的有哪些特点和类型?文献数据库的功用。答:数据库的特点:结构化、所存储的数据是面向现实世界的、数据的共享性好、数据库中数据的独立性强、数据库由数据管理系统统一管理和控制。类型:按提供信息的等级来分,数据库可分为参考数据库和源数据库;按存储类型的不同科分为磁带数据库、磁盘数据库和光盘数据库等;按数据模型的不同分为层次型数据库、网状数据库和关系型数据库;按涵盖学科内容的不同分为综合性数据库、专业型数据库。文献数据库的功用:对文献信息的规范化管理、为用户提供多途径的检索方式、为用户提供多种形式的服务内容、为用户提供多渠道的检索服务。16.什么是数据仓库?数据库系统和数据仓库系统有哪些不同?答:一个更好地支持企业或组织决策分析处理的、面向主题的、集成的、不可更新的、随时间不断变化的数据集合。它不是简单的数据库产品,而是一种解决方案。区别事务处理与分析处理性质不同、数据集成问题、历史数据的使用。17引文追溯法(又称引文循环查找法)。即依据已掌握的文献所附“参考引用书目”,查出被引文献,然后又从被引文献所附“参考书目”,再次查出被引文献,如此循环往复,逐步扩大检索成果。这种方法适合于无检索工具的用户获取有关情报。其缺点是文献越查越旧。另一种是依靠引文索引,从被引文献入手查到引用文献。然后又将已查到的引用文献作为被引文献,再次查找这些文献的引用文献,如此循环往复,逐步扩大检索成果。其优点是文献越查越新,但其局限性是必须已经有相关学科的引文索引存在。引文追溯法可以不顾学科的分类和控制词汇,故易于查找,其缺点是,由于引用文献与被引文献之间的联系角度和相关程度差别很大,因而可能导致很高的误检率。18.信息检索的主要途径有哪些?答:分类途径、主题途径、提名途径、引文途径、序号途径和符号代码途径、全文关键词途径著者/机构途径、其他途径。19.什么是检索策略?答:检索策略有广义和狭义之分:从广义看,检索策略是为实现检索目标而制定的全部检索计划,即在对课题进行全面、实质分析的基础上,选择检索系统、检索途径和检索词、明确各词之间的逻辑关系,并根据各检索词之间的关系和系统允许使用的各种算符、限定字段等组建检索式,明确检索步骤。狭义的检索策略指检索提问式。20.如何制定和调整检索策略?制定检索策略时不仅要全面准确地对课题进行概念分析,确定概念单元和概念间的关系,而且要熟悉有关的检索系统,才能将概念单元转换成系统能够接受的检索词,并选择合适的方式组配起来,完整地表达自己的检索要求,另外还要掌握各种检索方法和途径,适当地运用到检索过程中去,才能取得较好的检索结果。调整:从检索结果的数量上看,计算机信息检索经常会出现检索结果过多或者过少的现象,这时应及时调整检索策略,扩大或缩小检索范围,以增加或减少命中结果,提高查全或查准率。要扩大检索范围,一般可通过扩大概念,增加同义词或同族相关词并运用逻辑或进行组配、减少检索词或少用逻辑与算符、减少位置算符的使用或有关的字段限制;扩大检索的年代、文献类型、文种范围等方法达到目的。要达到缩小检索范围的目的,可以采取缩小检索概念;使用逻辑与等算符;缩小检索的年代,文献信息源范围等方法。21.简述信息检索的一般程序。答:全面分析课题,确定信息需求和检索目标——选择检索系统——确定检索途径和检索方法——确定检索词与检索词之间的关系,编制检索式——检索,并根据需要随时调整检索策略,得到所需检索结果——索取原始文献信息。22.如何获取原始文献?答:1直接通过网络获取原始文献——通过搜索引擎查找、网络出版物及网络出版物目录、出版商网站、学术网站、免费全文数据库、通过文摘题录数据库提供的订购途径购买;2间接获取原始文献——先查到馆藏地点再通过图书馆联系获取全文:先查找馆藏地点,再从实体图书馆获取全文,3通过个人与机构的交流获得。23.简述布尔逻辑算符的运算原理。答:常用的布尔逻辑算符有三种:逻辑或、逻辑与和逻辑非。布尔逻辑算符的作用是将代表单一概念的检索词组配在一起,以允许表达信息需求,进行不要的逻辑运算可以确保系统输出的检索结果更为准确。逻辑“或”文字表示为“or”用符号表示为“+”。检索词A与B用or组配,提问式可写为:AorB或A+B;逻辑与,提问式可写为:AandB或者A*B,逻辑非,提问式可写为:AnotB或者A-B,表示每条检索结果比需包括检索词A,但不包含检索词B,运算符的优先次序是:NOT>AND>OR。24什么是

1 / 2
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功