《信息检索与利用》课程复习绪论一一一、在人类漫长的发展历程中,物质、能源和信息三种资源支配着人类最基本的生产活动。物质--向人类提供材料及生活必需品信息---向人类提供知识和智慧能源---向人类提供动力二、人类历史上发生的五次信息技术革命:第一次是语言的产生;第二次是文字的出现;第三次是造纸术和印刷术的发明;第四次是电报、电话、电视的问世;第五次信息技术革命是电子计算机和现代通讯技术的结合。三、信息素质及其内涵信息素质的概念:(1)利用大量的信息工具及信息源,使问题得到解决或解答的技能。(2)要成为具有信息素质的人,他必须能够确定何时需要信息,并且具有检索、评价和有效利用信息的能力。信息素质的内涵包括:(信息意识:是指人们对信息的敏感程度;信息能力:发现、评价、利用和交流信息的能力信息道德:在信息活动中应遵循的道德规范)四、(一)信息检索的意义:(1.信息检索是获取知识的有效途径2.信息检索是创新型人才应具备的基本技能3.信息检索是继承借鉴前人成果的主要手段)(二)信息检索的作用(1.信息检索能够避免重复研究和走弯路;2.信息检索有助于节约时间、提高科研效率3.信息检索是科学决策的必要前提)第一章信息与信息资源第一节信息的基本知识-----信息可是当代社会使用最多、最广、最频繁的词汇之一,它普遍存在于自然界、人类社会以及人类思维活动之中。信息的内涵丰富、形式多样,具有物质和能量资源所不具备的独特性质和专门功能。一、信息的概念(P6)二、信息的特征(1.信息的普遍性和客观性2.信息认识的主观性3.信息的依附性4.信息的可传递性(四要素:信源、信道、信息、信宿)5.信息价值的不定性6.信息的共享性)信息传递四要素:信源(信息的发出体)、信宿(信息的接收体)、信道(信息的传递媒介)、信息。三、信息的功能(1.资源功能;2.组织管理功能;3.中介功能;4.消除不定性(解惑)功能;5.传播功能四、信息与知识、文献的关系1.知识(Knowledge)知识是人类对客观事物的认识和经验的总和,是人类对客观事物规律性的认识,是信息中最有价值的部分。知识一经产生就以声像信息、实物信息、文字信息等形式传播。人类不仅要通过信息认识世界,而且要根据所获得的信息组织知识。知识与信息的关系:(1、知识是信息的一部分,不直接等同于信息;2、知识是人类大脑活动的产物,是系统化、精炼化的信息;3、信息是知识产生和形成的基础.)2.文献----文献是指记录有知识的一切载体。文献由四个基本要素组成:1、所记录的知识和信息,即文献的内容。2、记录知识和信息的符号,文献中的知识和信息是借助于文字、图表、声音、图像等记录下来并为人们所感知的。3、用于记录知识和信息的物质载体,如竹简、纸张、胶卷、胶片等,它是文献的外在形式。4、记录的方式或手段,如铸刻、书写、印刷、复制、录音、录像等,它们是知识、信息与载体的联系方式。文献具有认识、存储和交流知识的作用。3.三者的关系可见,信息与知识之间的逻辑关系为包含与被包含的关系,知识是信息的一部分,信息是知识产生和形成的基础。文献是信息、知识的具体体现,它不仅是信息、知识的主要物质形式,也是读者吸收利用信息、知识的主要途径。第二节信息资源的基本知识一、信息资源(InformationResources)的概念国内外学者对信息资源概念的认识有两种具有代表性的观点:狭义的理解:信息资源是人类社会经济活动中经过加工处理使之有序化并大量积累起来的有用信息的集合,如科技信息、政策法规信息、社会发展信息、市场信息等,都是信息资源的重要构成要素。广义的理解:信息资源是人类社会信息活动中各种要素的集合。二、信息资源的本质特性(1.知识性2.共享性)三、信息资源的类型(一)按物质载体划分1.纸质文献纸质文献是利用纸张作为存储介质,以手写、印刷为记录手段而产生的文献形式。包括油印、铅印、胶印、复印等印刷品及手稿。纸质文献历史悠久,至今仍是主要的文献形式。2.非纸质文献(1)缩微型文献:缩微型文献是以感光材料为存储介质,利用缩微照相技术使文献缩微化的一种文献类型,如缩微胶卷、缩微平片。(2)声像型文献(视听资料):该种文献以磁性或感光材料为存储介质,利用特定的设备及技术,直接记录声音、图像,并以此传递信息。如唱片、录音带、录像带、电影胶片、幻灯片。(3)电子文献:电子文献是指以电子数据的方式将图、文、声、像等信息存储在磁光介质上,通过网络通信、计算机或类似设备再现的信息资源。它包括数据库、电子图书、电子期刊、电子报纸以及Internet信息资源(站点、网络新闻组、BBS、电子邮件等)。发展趋势:由以纸质信息资源为主向以电子信息源为主发展。(二)按出版类型划分1.图书(Book)凡篇幅达48页以上并构成一个书目单元的文献称为图书。国际标准书号(ISBN)2.连续性出版物连续出版物是指具有统一题名、定期或不定期以分册形式出版、有卷期或年月标识、计划无限期连续出版的文献。其主要特点是连续性、及时性和稳定性。它包括期刊、报纸、年度出版物及其他连续性报告、会议录、专著性丛刊等。在众多的连续性出版物中最具代表性的是期刊、报纸、年鉴。连续性出版物是与图书并列的最重要的文献类型。(1)期刊(JournalMagazineperiodical)是指采用统一名称定期或不定期的连续性出版物。具有连续的卷、期号或年、月顺序号。ISSN(国际标准刊号)核心期刊:是指某一学科中高水平、高影响力的期刊。(2)报纸(Newspaper)是指以刊载新闻和评论为主的连续性出版物,出版周期短(日、隔日、周报、旬报)有年、月、日顺序。(3)年度出版物(annual,yearbook)汇集某领域年内重要资料,每年出版一次。它包括年报、年鉴及按年度出版、修订的百科全书等。3.特种文献(1)专利文献(2)标准文献(3)学位论文(4)科技报告(5)会议文献(6)政府出版物(7)产品资料(8)档案(三)按加工深度划分1.零次文献指未经公开发表或未交流于社会的文献。如:私人笔记、设计草图、实验记录、论文草稿、会议记录、书信2.一次文献一次文献也称原始文献,是指人们根据自己的科学实验、生产实践的成果而撰写的文献,一般指期刊论文、科技报告、会议论文、学位论文、专利等。3.二次文献二次文献也称检索工具,是指对一次信息加工、整理后形成的各种检索工具,如目录、题录、文摘等,它不对一次信息提供评论,仅仅提供一次文献的检索线索,也就是说,二次文献是把一次文献从分散、无序的状态变成集中、有序化的状态,供人们迅速、准确地查询所需信息。4.三次文献三次文献是指在利用大量一次文献的基础上,对其内容进行综合、分析、研究和述评而撰写出来的文献。分为综述研究类和参考工具类两种类型。前者如动态、综述、学科总结、专题述评等;后者如百科全书、年鉴、手册、科技词典、名录、手册等。三次文献源于一次文献,又高于一次文献,是一种再创性文献。一次文献、二次文献、三次文献之间的关系:从一次文献到二次文献、三次文献是一个由博到约、由分散到集中、由无组织到系统化的过程,也是科技文献资源的层次结构由无序走向有序、由一种有序结构演变为另一种完善的有序结构的过程。四、网络信息资源迄今为止,对于“网络信息资源”尚没有统一的定义,类似的名称也很多,如“电子信息资源”(ElectronicInformationResources)、“因特网信息资源”(InternetInformationResources)“联机信息”(On-lineInformation)、“万维网资源”(WorldWildWebResources)等。有关其定义也多种多样,如有人提出“电子信息资源是以电子数据的形式将文字、图像、声音、动画等多种形式的信息存放在光磁等非印刷纸质的载体中,并通过网络通信,计算机或终端等方式再现出来的信息资源”。网络信息资源,从字面上可以理解为“通过计算机网络可以利用的各种信息资源的总和”;从目的上看是“为了提高信息系统效率,实现资源共享而采用计算机网络整理、传递、获取的各种信息”;在范围上它不仅包括Internet上的信息资源,也包括各种局域网、城域网和广域网上的信息资源。(一)按照网络信息的内容划分1.网络数据库数据库亦称文献库、资料库,是发展最早、影响最广的一种主要电子信息源。脱离单机或专门的检索终端,与网络相结合,借助网络而提供服务的数据库即为网络数据库。网络数据库主要包括联机数据库和光盘数据库。2.联机馆藏目录库图书馆作为信息的集散地,在网络的影响下纷纷向着数字化、网络化方向发展,为了使更多的读者充分利用图书馆资源并实现资源共享,众多图书馆建立了馆藏机读目录数据库并通过网络提供OPAC(OnlinePublicAccessCatalo)服务。3.电子出版物网络上出现了越来越多的电子出版物,包括电子图书、电子期刊和电子报纸等。4.政府机构信息政府机构以政府信息服务系统向公众提供信息。包括有关组织机构的宗旨、业务范围、人员、出版物、最新消息发布、各种法律、法规或相关政策信息等,内容相当广泛。5.休闲娱乐信息这类资源较多,且大多免费提供给用户,包括各种新闻、广告、讨论组以及各种软件(二)按照所采用网络信息的协议不同划分1.基于超文本传输协议(HTTP)的信息资源万维网(WorldWideWeb,简称)信息资源是一种典型的基于HTTP的网络信息资源。Web建立在超文本、超媒体基础上,集文本、图形、图像、声音为一体,并以直观的图形用户界面(GUI)展现和提供信息的网络信息资源形式。由于其使用简单、功能强大,自20世纪90年代问世以来,成为发展最快、信息最丰富的一种网络信息资源形式。2.基于文件传输协议(FTP)的信息资源FTP协议的主要功能是完成从一个系统到另一个系统完整的文件复制,即在网络的联网计算机之间传输文件。通过FTP可以获得的信息资源类型很广泛。广义地说,任何以计算机方式存储的信息均可通过FTP协议获取,包括书籍、图像、声音、多媒体、一些书籍的电子版、电子期刊、某些政府机构发布的信息、大量的免费与共享软件等。3.基于远程登录(Telnet)的信息资源这是指通过Telnet协议所访问到的网络信息资源。其实现方法为在远程计算机上登录,使自己的计算机暂时成为远程计算机的终端,进而可以实时访问、使用远程计算机中对外开放的资源。这些资源包括硬件资源,如超级计算机,精密绘图仪,高速打印机,高档多媒体输入、输出设备等;也包括软件资源,如大型的计算机程序、图形处理程序以及大型数据库等信息资源。第三节我国文献信息的主要收藏及服务系统一、图书馆系统(1.公共图书馆系统2.高校图书馆3.科学研究系统图书馆)二、国家科技信息系统;三、专利文献系统;四、标准文献系统;五、档案系统第二章信息检索技术与策略第一节信息存储的基本知识信息存储是指利用一定的科学规则和方法,通过对信息的特征进行分析、表征和提炼,并按给定的参数和序列公式排列、存储在相应载体上,组织成系统化的具有检索功能的系统过程。一、信息筛选信息筛选是对原始信息的挑选和鉴别,是建立信息资源检索系统的基础和保障。信息筛选原则:针对性、系统性、预见性、科学性、计划性和及时性。信息筛选方法:直观判断法、分析法、集体讨论法、专家裁决法、数学核算法、现场核实法等。二、信息描述信息描述是指根据信息组织和检索的需要,依照一定的科学规则和技术标准,对信息的外部特征、物质形态和内容特征进行全面描述并给予记录的过程。(一)信息外表特征的描述信息的外部特征是指信息的物理载体直接反映的信息对象,构成信息的外在的、形式的特征,它包含信息载体的物理形态、题名、加工者、出版或发表日期、流通或传播的标记等。期刊论文的外表特征:文献的题目、著者、著者的工作单位、文献的出处(刊名、年卷期、起止页码)、语种、参考文献及图表的数量。图书的外表特征:书名、著者(或编者、译者)、出版项(出版社、地点、时间)、稽核项(价格、页数、参考文献)、书号不同的检索系统(数据库)所描述的项目与标识符有所不同。(二)内容特征的描述信息的内容特征就是