第1页共2页计算机信息检索复习知识点第一章1、人类生活的3个基本要素是材料、能源和信息。(单选)2、信息是指应用文字、数据或信号等形式,通过一定的传输和处理,来表达各种相互联系的客观事务在运动中所具有的特征性内容夫人总称。(名词)3、信息的特征有:客观性、动态性、相对性、依存性、可传递性。(多选)4、共享性是指同一内容的信息可以在同一时间里被多个信息用户使用。5、信息的功能有哪些?(简答)(1)信息是感知世界的中介;(2)信息是管理决策的依据;(3)信息是科学研究的必要条件;(4)信息是社会发展的资源;6、信息的类型有哪些?(论述)(1)按信息的表达形式划分,可以分为①文献信息②声像信息③电子信息(2)按信息的应用范围划分,可分为①白色信息②灰色信息③黑色信息(3)按信息的加工层次划分①一次信息②二次信息③三次信息7、信息需要:所谓信息需要,就是指人们在从事各项实践活动的过程中,为解决所遇到的各种问题而产生的对信息的需要。(名词)8、信息需求的特征有哪些?广泛性、社会性、发展性、多样性(多选)9、现代信息技术的基础是微电子技术(单选)10、数据库是指为满足多个用户的多种应用需要,按一定的数据模型在计算机中组织、存储和使用的相互联系的数据集合。(名词、单选)11、通信系统的基本组成包括信源和:信宿、变换器、反应器、信道、噪声源12、信号的接收者称为信宿13、信息传输的通道称为信道14、信号在传输过程中受到的干扰称为噪声15、数据库简称DB16、数据库的四种基本操作是:检索、更新、删除、插入17、数据库的特点有哪些?(简答)(1)数据共享;(2)面向全组织的数据结构化;(3)数据独立性;(4)可控数据冗余度;(5)统一数据控制功能。18、数据结构化有利于实现数据共享19、数据库管理系统可以提供哪些方面的数据控制功能:安全性、完整性、并发控制、数据恢复20、构成数据库的三个主要层次是:文档、字段、记录21、记录的基本单元是:字段22、文档的基本单元是记录23、一个文档中你好,认识一下!包含大量的记录24、检索系统提供的数据库相关文档组成包括的文件数是3个25、顺排文档:按记录的存取号的大小顺序存入全部记录,它相当于印刷型检索工具的正文部分。26、倒排文档:把记录中的可检字段抽出,包括单元词、多元词,按某种顺序重新加以组织后得到的一种文档。27、倒排文档只包括记录的标识、信息的数量及信息存取号。28、存储了数据库所有记录的特征标识的是倒排文档29、数据库文档中便于随机存取,实现非顺序存储结构的文件是索引文档30、传统的检索对象主要是文献型的信息源31、传统的检索对象的存储介质是纸张32、对超文本、超媒体信息资源实施的检索是超维检索第二章1、计算机信息检索经历了哪几个主要发展阶段?(简答)(1)脱机批处理检索阶段;(2)脱机检索阶段;(3)光盘检索阶段;(4)网络化检索阶段2、计算机信息检索必备的条件是物质和人员3、计算机检索的类型有哪些?(论述)计算机信息检索的类型可以通过检索的内容、信息出版的时间和检索工作的方式加以划分1根据计算机信息检索的内容划分,检索可以分为(1)数据检索;(2)事实检索;(3)文献检索2根据被检索信息出版的时间划分,可分为:(1)定题信息检索;(2)回溯性信息检索3根据计算机检索工作的方式划分,可分为:脱机检索系统;(2)联机检索系统4、事实检索的对象是事实5、检索结果能够满足用户需要的文献线索或文献全文的是文献检索6、回溯性信息检索:根据用户提供某一段时间范围内的文献信息的检索方法7、计算机批处理的信息检索系统称为脱机检索系统8、用户以联机会话方式直接访问系统及其数据库的信息检索系统称为联机检索系统9、信息检索系统:是指按照某种方式、方法见利起来的供读者检索信息的一种有层次的体系,是表征有序的信息特征的集合体。10、信息检索系统的职能有:报道职能、存储职能、检索职能11、信息数据库可以划分为:参考数据库、源数据库、混合型数据库12、参考数据库:是指用户从中获取信息线索后,还需要进一步查找原文或其他资料的一类数据库13、源数据库:能够直接为用户提供原始资料或具体数据的一类数据库。14、信息系统的构成模式是什么?(简答)(1)信息数据的选择、处理、录入和维护子系统;(2)词表和标引子系统;(3)检索子系统;(4)系统----用户接口子系统统15、信息检索系统的存储结构有:印刷存储、微缩存储、磁存储、半导体存储、光存储16、信息存储的逻辑结构有:线性结构、非线性结构、树形结构、网形结构17、数据元素按一定顺序构成一个有限序列的信息存储结构称为:线性结构18、非线性结构中最常用的的是树形结构和网形结构19、将信息用二进制表示称为编码20、计算机处理信息的最小单位是一位二进制数21、两级存储器是指主存储器和辅助存储器22、信息检索的概念起源自文献信息检索23、对信息进行主题分析,提取代表该信息的特征的过程称为标引24、自动抽词标引:利用计算机直接从信息正文、标题或文摘中抽出能表达信息主题的关键词作为标引词,并自动生成关键词索引或倒排文档。25、对一本书或一篇文章所做的扼要摘述称为文摘26、利用计算机自动编制文摘称为自动文摘27、在信息检索自动化处理中,常用的运算是排序28、常用的自动排序的方法有选择排序和快速排序29、存储区域网简称为SAN30、目前大多数中小企业见利网络环境的协议基础是TCP/IP31、信息检索系统的组织:为了控制信息的流速和流向、数量和质量等,把传递中的杂乱无序的信息整理为系统有序状态的活动。32、信息检索系统的组织目的是什么?(简答)(1)减少社会信息流的混乱程度;(2)提高信息系统的质量和价值;(3)建立信息检索系统与用户的联系;(4)节省社会信息活动的总成本。33、信息检索系统的组织的要求有哪些(1)信息内容有序化;(2)信息流向明确化;(3)信息流速适度化;(4)信息质量最优化。34、信息检索系统组织方法:是指对每一信息的各种外表特征和内容特征进行描述并确定其标识,然后按一定方式或规则将其内容组织起来以供检索的方法35、信息检索系统的传统组织方法有哪些?(1)分类组织法;(2)主题组织法;(3)字顺组织法;(4)号码组织法;(5)自然组织法36、进行网络信息资源组织的方式主要有:文件组织方式、主题树组织方式、超文本组织方式、超媒体组织方式、元数据组织法37、以文件为单位共享和传输信息的组织方式称为文件组织方式;38、超文本的信息组织方法是非线性;39、元数据又称描述数据;40、对初选信息的鉴别、筛选和删除称为优化;41、优化选择的方法有:比较法、分析法、核查法、引用摘录法、专家评估法42、检索语言:检索信息所使用的人工语言;43、登录在类表、词表中的所有标识称为词汇44、检索语言的作用有哪些?(简答)(1)对信息内容进行主题分析;(2)便于将标引、检索用的标识符进行相符性比较,保证检索和标引的一致性;(3)保证检索结果和检索要求的一致性;(4)保证信息存储集中化和系统化45分类语言的基础是科学分类46主题语言是使用词语标识的一类信息检索语言,称为主题法47、把主题词按照一种便于检索的方式编排起来,称为主题词48、关键词:从信息的题名、摘要和内容中抽取出来的,能够表达信息主题内容的具有检索意义的关键性词汇。49、叙词:是指从自然语言中优选出来并经过规范化处理的名词术语,属于后组式语言的一种,是采用表示单元概念的规范化语词的组合来对信息主题或内容进行描述的标识系统。50、叙词的特点:专指性、直观性、多维检索、适应性、网络结构51、按照学科体系进行系统排列的语言称为分类语言52、按照主题词的字顺序列排列的语言称为主题语言53、计算机信息检索是指利用计算机存储信息和检索信息54、进入检索的入口称为检索途径55、按学科分类体系查找信息的途径称为分类检索56、利用信息主题内容进行检索的途径称为主题检索57、选择实现检索计划的具体方法和手段是选择检索方法58、利用检索系统查找信息的方法称为工具法59、信息检索策略:将课题的提问及其检索词与检索系统的收录内容、编排特点相匹配而确定的检索方案或程序。60、检索效果:是指信息系统检索信息的有效程度,反映了信息系统的检索能力61、查全率:检索出的相关信息量与信息系统中的相关信息量之比62、查准率:检索出的相关信息量和检索出的信息总量之比。63、衡量检索效果的相对合理指标是差准率和查全率第三章1、布尔逻辑检索:是指通过标准的布尔逻辑关系词来表达检索词与检索词之间逻辑关系的检索方法。2、布尔逻辑运算符有:逻辑与、逻辑或、逻辑非3、INTERNET上信息出传输的主要方式是FTP4、检索者将检索词在他认为合适的地方截断称为截词5、限制检索:在检索系统中,使用缩小和限定检索范围的方法称为限制检索6、邻近检索:通过专门符号来规定检索词在结果中的相对位置7、中级检索技术包括哪些内容?(1)加权检索技术;(2)自然语言检索技术;(3)相关信息反馈检索技术;(4)模糊检索技术;(5)概念检索技术。8、自然语言处理应用领域之一是信息检索9、概念层次网络简称HNC10、自然语言处理技术可以分为机器翻译、语义处理以及人机会话11、搜索引擎用到的自然语言处理技术是机器翻译与语义处理12、实现只能搜获的过程主要分为:语义处理、知识管理、知识检索13、从用户角度看,用户可以分为最终用户和职业用户14、信息检索发展史上的突破是应用了自然语言检索15、智能代理资源管理器的基本结构是:适配器、引擎、知识、库、视图16、智能代理信息检索系统的特点有哪些?(论述)(1)智能代理侧重于面向用户。(2)智能代理主要借助知识库、数据库,并参考用户需求习惯和一段时期内的偏好,推断用户提问的真实意图,提高检索的专指性。(3)智能代理采用机器学习、用户框架模型、推理机制主动协助用户查找信息。(4)智能代理不仅是关键字的匹配,而且是基于概念和知识的检索。(5)智能代理能不断了解用户需求的变化,并根据用户的反馈信息及时修正检索目标策略。(6)智能代理能分离发送请求和接收结果,使它们异步进行。(7)智能代理能使用户按照个人的兴趣爱好进行信息分类。17人们进行信息检索时总是期望获得较高的查全率和查准率18对信息进行采集、标引、存储、处理,最后形成信息集合体19、通过模拟自然进化过程搜索最优解的方法称为遗传算法20、搜索引擎和挖掘引擎处理的都是字串和文本21、数据挖掘也称知识发现22、聚类:按照事物的某些属性,把事物聚集成类,使类间的相似性尽量小,类内相似性尽量大23、一种很有效的预测模型技术是神经元网络第四章1.INTERNET起源于ARPANET2、我国的四大互联网络是:中国科技网、中国教育科研网、中国公用互联网、中国公用经济信息网3、INTERNET提供的基本信息服务有:电子邮件、文件传输、远程登陆、电子公告板、网络新闻组4、可以在异地主机上登陆注册的服务是TELNET5、通过专用电缆与INTERNET主干网直接连接在一起的称为专线连接6、综合业务数字网简称ISDN7、非对称数字用户环路简称ADSL8、网络信息资源主要类型是联机检索系信息资源和网络信息资源9、联机检索信息资源的主要表现形式是联机数据库10、文件传输协议是FTP11、网络信息资源进行组织的主要方式有:文件方式、主题树方式、超文本方式、数据库方式、超媒体方式、元数据方式。12、元数据:就是关于数据的数据,是对数据内容的描述。13、元数据的作用有哪些?(论述)(1)描述数据的内容、质量和特征,以及数据所适用的范围。(2)管理和存储大量科学数据(3)提供一种对数据进行检索、查询的方法(4)帮助数据的使用者更好的了解和使用数据。(5)促进数据共享(6)为数据交换和数据传输提供辅助信息(7)元数据是数据发挥其作用的一个必要条件(8)维护科研成果,维护在数据方面的投资。14、DC的特点有:简易性、通用性、兼容性、灵活的可扩展性15、知识产权:是公民和法人对在科学和文学等领域内创造的精神财富以及智力成果依法享有权利的总称。16、INTERNET上每