1、信息与知识之间的关系。1、⑴信息:①克劳德·香农首次提出“信息是用来消除不确定性的东西”。②知识的类型可划分为知事、知因、技能、知人。③信息可分为正确信息和虚假信息、有用信息和无用信息,而知识是在实践中获取并经过实践检验的正确、有用的信息。④信息、知识之间的关系(理解就好)主要体现在:信息是起源,是基础;知识是系统化了的信息,各种信息经过组织、系统化地加工处理、提高深化,才能成为知识。1、文献*是记录知识的一切载体,即用文字、图形、符号或声频等技术手段记录知识的物质载体,或称固化在物质载体上的知识。【必知】狭义:纸质,印刷形式存在的;2、(不在关系中,只是概念)信息检索(是对其更详尽的解释)是指将信息按照一定的方式组织和存储起来,并根据信息用户的需求查找出相关信息的过程。信息检索有广义和狭义2重含义。⑴广义上说,信息检索包含信息存储和信息查找2个过程。①信息存储是对信息进行收集、标引、描述和组织,并进行有序化编排,形成信息检索系统的过程;②信息查找是指通过查询机制从各种检索系统中查找出用户所需的特定信息的过程。信息的存储与检索存在着相辅相成、相互依存的辩证关系。存储是为了检索,没有存储就无法实现检索。⑵狭义地讲,信息检索仅仅指信息查找的过程。4、知识(Knowledge):概念不用记,判断知识与信息的区别知识是在改造客观世界的实践中获得的对客观事物存在和运动规律的认识和总结,是人的大脑通过思维重新组合的系统化的信息的集合,是对信息的理解和认识,是信息的一部分。《辞海》解释说“知识借助于一定的语言形式,或物化为某种劳动产品的形式,可以交流和传递给下一代,成为人类共同的精神财富”。按照经济合作与发展组织(OECD)的《以知识为基础的经济》报告,知识的类型可以从不同角度划分为知事、知因、技能、知人(Know-What,Know-Why,Know-How,Know-Who)4类。信息可分为正确信息和虚假信息、有用信息和无用信息,而知识是在实践中获取并经过实践检验的正确、有用的信息。4、信息、知识之间的关系【看题型大小来讲】重要信息、知识之间的关系主要体现在:世界是物质的,信息是物质存在的方式、形态和运动规律的表征,人脑对物质属性的感知形成信息,信息是起源,是基础;知识是系统化了的信息,各种信息经过组织、系统化地加工处理、提高深化,才能成为知识2、【都记】信息检索的实质就是将用户的检索提问标识与存储在信息检索系统中的信息特征标识进行比较、匹配,两者一致或者信息特征标识包含着检索提问标识,则具有该标识的信息就从检索系统中输出,输出的信息就是检索命中的信息。(在一个有序的集合···检索的过程到匹配(1、用户2、系统)用自己的话讲清楚也可以)信息检索和文献检索是不同的两个概念。区别:信息检索主要是通过文献检索实现的,文献检索是信息检索的一个重要组成部分。联系:由于文献是情报、知识、信息的存储载体,情报、知识、信息一般都不能超越文献这种载体而存在,因此,信息检索一般也都超越不了作为信息载体的文献。3、文献检索方法(不需要记概念,知道方法):顺查法、倒查法、引文追溯法、抽查法4、按照加工的程度来划分。文献信息源可以分为:加以区别就好,加以明确①零次文献:素材最原始的信息资源,虽未公开交流,但它是生成一次文献信息的主要素材;②一次文献:最主要的信息资源,作者本人的研究成果、原创③二次文献:对一次文献信息的集中提炼和有序化,是检索一次文献信息的工具,故又称检索工具;文摘、目录、索引、题录重点④三次文献:分门别类,综述指南,按知识门类或专题将一次文献信息重新组织、高度浓缩而成,是人们查考数据信息和事实信息的主要信息源。5、信息检索的类型(了解,不记概念)按检索对象的内容划分①书目检索(BibliographicRetrieval)。书目检索通常也称为文献检索,是指以查找某一课题的相关文献为目标的检索。②数据检索(NumericRetrieval)。数据检索是指以特定的数值型数据为对象的检索。③事实检索(FactRetrieval)。事实检索是指以特定的事实为目标的检索。6、数据库(Database)*是指在计算机的存储设备上按照一定的方式存储的相互关联的数据集合,通常由一组相关的文档组成。数据库主要由文档、记录、字段3个层次构成。{CNKI、维普、搜索引擎的索引,数据库核心,外文,艾斯维尔?}搜索引擎数据库、索引数据库搜索引擎的核心:索引数据库①文档,即文件,是数据库内容的基本组成形式,是由若干个逻辑记录组成的信息集合。一般来说,一个数据库至少包括一个顺排文档(主文档)和一个倒排文档(索引文档)。②记录是文档的基本单元,是对某一实体的全部属性进行描述的结果。在全文数据库中,一个记录相当于一篇完整的文献;在书目数据库中,一个记录相当于一条文摘或题录,或者相当于目录中的一个款目。③字段是记录的基本单元,是对某一实体的具体属性进行描述的结果。在各类数据库中字段的内容都是不同的,一般字段与信息的著录项目相对应。文献数据库中的字段通常分为基本字段和辅助字段。【帮助理解就好】7、检索技术:常用的布尔逻辑运算符有3种,分别是逻辑“或”(OR)、逻辑“与”(AND)、逻辑“非”(NOT)。可以用自己语言解释概念,出现在搜索引擎中,其运用,如钱伟长。检索方法【谈谈是什么,会举例】第二章前面,优先顺序:NOT-And-OR,改变是用“()”,能看懂检索式(1)逻辑“或”是用于表示并列关系的一种组配,用来表示相同概念的词之间的关系,用OR或“+”算符表示。例如检索式AORB,表示检索的文献记录中只要含有A或者B中的任何一个即算命中。这种组配可用于扩大检索范围,增加命中文献数量,有利于提高检索结果的查全率。(2)逻辑“与”是用于表示交叉关系或限定关系的一种组配,用AND或“*”算符表示。例如检索式AANDB,表示检索的文献记录中必须同时含有A和B才算命中。这种组配可用于对检索词进行限定,从而缩小检索范围,有利于提高检索结果的查准率。(3)逻辑“非”:是用于在检索范围中排除不需要的概念或排除影响检索结果的概念,用NOT或“-”算符表示。例如检索式ANOTB,表示检索记录中凡含有A不含B的记录被检出。这种组配能够缩小命中文献的范围,增强检索的准确性。(4)注意事项①布尔逻辑检索的执行顺序。3种布尔逻辑检索运算符之间的运算顺序为NOT、AND、OR。有括号时,先执行括号内的逻辑运算。②不同检索工具的布尔逻辑检索有不同的表现形式和使用规则。首先,不同检索工具表示布尔逻辑关系的符号不同;此外,不同检索工具支持布尔逻辑的方式不同。8、截词检索是指在检索式中使用专门的符号(截词符号)表示检索词的某一部分允许有一定的词形变化,用检索词的词干或不完整的词形查找信息的一种检索方法。(定义)形式:按截断的位置来分,可分为后截断、中截断和前截断(有利于查全率,相当于逻辑或)(三种形式);按截断的字符数量来分,可分为有限截断和无限截断。运算符号:有限截断是指说明具体截去字符的数量,通常用“?”表示;而无限截断是指不说明具体截去字符的数量,通常用“*”表示。⑴后截断是最常用的截词检索技术,是将截词符号放置在一个字符串右方,以表示其右的有限或无限个字符将不影响该字符串的检索,是一种前方一致的检索。这种方法可以省略输入各种词尾有变化的检索词的麻烦,有助于提高查全率。如:physic*,可检出的词汇有:physic、physical、physician、physicist、physics等。不难看出,截词检索具有隐含的OR运算特性。归纳起来,后截词主要使用在如下4个方面:(1)词的单复数,如book?,potato??;(2)年代,如198?(80年代),19??(20世纪);(3)作者,如用Lancaster*可检出所有姓Lancaster的作者;(4)同根词,如用biolog*,可检出biological、biologist、biology等同根词。⑵前截断是将截词符号放置在一个字符串左方,以表示其左方的有限或无限个字符不影响该字符串检索,是一种后方一致的检索。这种检索方法在各种词头有变化的复合词的检索中应用比较多,有助于提高查全率。例如,输入“*magnetic”,可以检索出含“magnetic”、“electro-magnetic”等词的文献。⑶中截断是把截断符号放置在一个检索词的中间。一般地,中截断只允许有限截断。中截断主要解决一些英文单词拼写不同,单复数形式不同的词的输入。如,wom?n例如,输入“c?t”,可以检索出含有词“cat”、“cut”的文献;输入“mod?????ation”可以检索出含有词“moderation”、“modernization”、“modification”的文献。8、信息检索途径可分为内容特征检索途径(关键词、主题词{查全率高})和外部特征检索途径(作者、代码、引文)(清楚哪些特征是内容特征,哪些是外部特征)。内容特征检索途径:分类途径(类名和类号。)、主题途径(主题索引、关键词索引、叙词索引);外部特征检索途径:题名途径(书名、篇名、刊名)、作者途径、代码途径、引文途径(参考文献)9、分类途径是按信息内容,利用分类检索语言实施检索的途径。分类检索是从文献内容所属的学科类别来检索,它依据的是一个可参照的分类体系。其基本过程为:首先分析提问的主题概念,选择能够表达这些概念的分类类目(包括类名和类号),然后按照分类类目的类号或字顺,从分类体系中进行查找,进而得到所需的文献信息。10、分类途径一般是以学科体系为入口进行检索,较能体现学科的系统性,使同一学科有关内容集中在一起,使相邻学科的内容相对集中,所以能较好地满足族性检索的需要,泛指性强,查全率较高,一般只能满足单维概念的检索。11、主题途径是按信息内容,利用主题检索语言实施检索的途径。其基本过程为:首先分析提问的主题概念,选择能够表达这些概念的主题词。然后按照主题词的字顺,从主题词索引中进行查找,进而得到所需要的文献信息。主题途径以词语(叙词或关键词)作为检索标识,表达概念直接、准确、灵活,并可根据科学技术的发展随时增加新的检索标识,反映学科发展的新概念,具有动态性特征。所以,主题途径具有特性检索的特点,专指性强,查准率较高,能满足多维概念的检索,并能及时反映新兴学科、交叉学科和边缘学科的发展。*13、Internet是基于TCP/IP协议的网络,互联网中的每个结点必须有一个唯一的地址,每个IP地址由32位二进制位组成,它是网络位置的唯一标识,称为IP地址。14、由于IP地址是以数字来表示主机地址,较难记忆。为了使用和记忆的方便,为了用户寻址的方便,就产生了更为高级的字符型主机地址,即域名地址。关系:域名地址和IP地址之间一般存在一一对应关系,但也有两个域名地址对应一个IP地址或域名地址不变而IP地址改变的情况。15、网络信息资源检索的特点:1.检索范围大2.用户界面友好3.交互式作业方式4.传统检索技术和网络检索技术相融合5.信息检索效率高6.信息冗余大16、计算机信息检索策略的含义(全部掌握)狭义上的信息检索策略是指检索表达式(检索提问式)的构造,即运用检索系统特定的检索技术,确定检索词之间的逻辑关系,形成表达用户信息需求的检索表达式(检索提问式)。广义上的信息检索策略是指在分析检索课题的实质内容、明确检索目标的基础上,选择检索系统和检索工具,明确检索途径和检索方法,确定检索词之间的逻辑关系以及查找步骤最佳方案的一系列科学安排。17、检索效果的评价指标:查全率是对所需信息被检出程度的量化,用来表示信息系统能满足用户需求的完备程度,可以用检索文献中合乎需要的文献数量占检索系统中存在的合乎需要的文献总量的比率来表示;查准率是衡量信息系统拒绝非相关信息的能力的量度,可以用检出文献中合乎需要的文献数量占被检出文献总量的比率来表示;查全率(R)=查准率(P)=两者关系:查全率和查准率之间存在互逆关系,即当某一系统的查全率与查准率处于最佳比例关系时,如果继续提高查全率,会导致查准率降低;如果继续提高查准