信息检索与分析讲稿(1)课程目录第一章信息检索与分析理论基础(4次)第二章文献信息源及其数字化发展(4次)第三章网络资源与搜索引擎(4次,其中2次上机;内容包括网络免费资源的获取和搜索引擎知识的介绍和运用)第四章中文数据库的使用(6次,其中2次上机;主要以本馆数据库为讲授对象)第五章外文数据库的使用(6次,其中2次上机;主要以本馆数据库为讲授对象)第六章基于图书情报平台的信息检索(4次,其中2次上机;)第七章文献信息的分析与利用(2次)第八章个人文献信息管理软件介绍与利用(4次;其中2次上机)第九章知识汇总与考试准备(2次)考试方式:统一考试(笔试、闭卷)+作业网上学习方式:下载课件和讲义的地址推荐网站:1、哈尔滨工业大学信息检索研究室2、中国科学院现代信息检索(ModernInformationRetrieval)3、吉林大学《信息检索与利用》网络课程4、复旦大学《信息检索与利用》5、中文Web信息检索论坛(北京大学)6、大连理工大学信息检索研究室7、云南大学精品课程《信息检索》网站8、南京大学精品课程《信息检索》网站9、华东理工大学精品课程《文献检索》经典网站:1、中国国家图书馆2、中国科学院国家科学图书馆3、北京大学图书馆网站4、上海图书馆5、浙江大学图书馆6、中文维基百科7、温州大学图书馆网站:参考文献:1.叶继元.信息检索导论.北京:电子工业出版社,2003年2.黄如花.网络信息的检索与利用.武昌:武汉大学出版社,2002年3.叶鹰.信息检索:理论与方法.北京:高等教育出版社,2004年4.焦玉英等.信息检索.武汉:武汉大学出版社,2002年5.马费成.信息管理学基础.武汉:武汉大学出版社,2002年6.沈固朝.信息检索(多媒体)教程.北京:高等教育出版社,2002年7.王知津.科技信息检索.天津:南开大学出版社,2002年8.信息检索与利用,鄢春根主编,人民邮电出版社,2008年9.信息检索与利用,洪全主编,清华大学出版社,出版时间:2007年10.信息资源检索与利用(第2版),林豪慧,孙丽芳主编,电子工业出版社,2007年导言信息检索与分析解析一、对本课程的理解和解释:《信息检索与分析》1、信息检索课程的出现信息、能源和材料,并称为现代社会的三大支柱。20世纪以来,人类创生的信息量高速增长,浩如烟海。信息检索,就是从浩如烟海的信息海洋中查找出所需信息的过程。为实现这个过程是需要适当理论和方法的,信息检索课应运而生。2、信息检索(InformationRetrieval)作为一门学科,信息检索历史可追溯到19世纪下半叶。但在20世纪中期以前,信息存储和传播主要以纸质为载体,信息检索活动也是围绕和文献的获取和控制展开的,因此,信息检索研究关注的是如何检索利用文献中记载的信息,文献检索一度成为信息检索的同义词。现代意义的信息检索作为一个独立的领域,是1946年计算机出现后在国际上逐步得以确立的。3、信息检索教育教育部(当时是国家教委)1984年发出的“高教一字004号”文件——要求在高等教育院校开设“文献检索与利用”课程。20余年来,文献检索教育尤其是手工检索教育方面已取得了很大的成绩。然而随着计算机、多媒体等信息技术的发展,以多种载体多种记录方式的非纸信息急剧的增加,靠“手翻、眼看、大脑判断”的手工检索模式已经难以适应信息社会的发展要求,计算机信息检索应运而生;以Internet为代表的全球性计算机网络迅速发展和普及,更进一步的推动了信息检索的发展,使得网络化信息检索逐渐成为信息检索的主流。、和信息检索相关的几个术语的解释和理解1、信息定义——物质存在的一种方式,一般指数据、消息中所包含的意义。可以使消息中所描述的事件的不定性减少。(*注:中国《情报与文献工作词汇基本术语》(GB48944-85)有关信息的定义。据不完全统计,信息的定义有100多种,至今仍无法统一,为各界普遍认同。这种情况主要是由于信息本身的因素,以及认识层次上的差别造成的。不同的学科,从不同的角度对信息这个概念有不同的解释。经济学、心理学、新闻学和哲学的定义不同于图书情报学对信息的定义。控制论专家N?维纳(N.NorbertWiener)从信息自身具有的内容属性给信息下定义被许多研究所引用。信息论的创始人申农(C.E.Shannon)1948年在《通信的数学原理》一文中将信息定义为“两次不定性之差”。国内在这方面也有许多争论。信息的定义之所以呈现多样化,主要原因有三:第一,信息本身的复杂性,它是一个多元化,多层次、多功能的综合物;第二,信息科学是一门新兴学科,它的许多分支学科仍在随着社会、经济和科学技术的发展而发展,其内涵和外延不很确切;第三,人们出于不同的研究和使用目的,从不同的角度或层次出发,对信息概念就会作出不同的解释。因此,许多学者建议将信息的要领分为不同的层次来解释。在诸多层次中,最重要的是两个层次:一是没有任何约束条件的本体论层次,即信息是一种客观存在的现象,是事物的运动状态及其变化方式的表征,不受主体意志的影响。不停运动着的事物不断产生本体论意义上的信息;二是受主体约束的认识论层次,即信息就是主体所感知或所表述的事物运动状态及其变化方式,是反映出来的客观事物的属性。例子:信息的要领是十分广泛的,世间万物的运动,人间万象的更迭,都离不开信息的作用。据说上古时期,诺亚的方舟在洪水中飘荡许久,当放出的飞鸽衔回一束橄榄,意味着带回了洪水已退的信息。那么李太白的诗“日照香炉生紫烟,遥看瀑布挂前川,飞直下三千尺,疑是银河落花流水九天。”给我们带来的显然就是庐山瀑布的信息;苏东坡的词“大江东去,浪淘尽,千古风流人物。……”给我们传递的是赤壁怀古的信息。从自然界角度看,表征物质的属性:地球昼夜的变化是一种信息,它反映出地球绕太阳自转的运动特性和状态;山的高度是一种信息,它反映出山的空间特性;树干的年轮是一种住处它反映了树木成长的时间特性——树龄;闪电是一种信息,它反映了云层中所含能量的不知所云性;花的香味也是一种信息,它反映了花分子结构的化学特性等等。)2、知识是人类的主观世界对客观世界概括和反映,是大量有组织的信息,是关于事实和思想的有组织的陈述。提供某种经过思考的判断和某种实验的结果。(1)知识的分类根据国际经济合作与发展组织(OCED)出版的《以知识为基础的经济》报告:第一类“知事(Know-what)”,指关于事实方面的知识,也可理解为Know-when、Know-where;即在什么样的时间(Know-when)、什么样的地点或条件下(Know-where)能解决什么样的问题第二类“知因(Know-why)”,指自然原理和规律方面的科学理论,知识的生产是在专门研究机构如实验室和大学完成的;第三类“知道怎样做的知识(Know-how)”,指做某些事情的技艺和能力,被称为技术情报和商业秘密,其典型是企业开发和保存于其内部的技术诀窍或专有技术;第四类“谁以及是怎样创造知识的(Know-who)”侧重创造思想、方法、手段、过程以及特点等的了解。还有一种分类:把知识分为显性知识(ExplicitKnowledge)和隐性知识(TacitKnowledge)。所谓显性知识是指经过人的整理和组织后,可以编码化和度量,并以文字、公式、计算机程序等形式表现出来,还可以通过正式的、系统化的方式(如出版物、计算机网络等)加以传播,便于其他人掌握的知识。典型的显性知识主要是指以专利、科学发明和特殊技术等形式存在的知识,它是有载体的、可以表达的,“知因(Know-why)”;隐性知识是与人结合在一起的经验性知识,识往往是个人或组织经过长期积累而拥有的知识,很难编码化,并将其文字化或者公式化,它通常不易用语言表达,也不们本质上以人为载体,因此难以通过常规的方法收集到它,也难以通过常规的信息工具进行传播。隐性知OECD的分类中“知事(Know-what)”和可能传播给别人或传播起来非常困难。例如:技术高超的厨师或艺术家可能达到世界水平,却很难将自己的技术或技巧表达出来从而将其传播给别人或与别人共享。隐性知识对应的是OECD中的关于Know-how和Know-who的知识,其特点是不易被认识到、不易衡量其价值、不易被其他人所理解和掌握。(2)知识的来源第一类是人脑之中,以主观意识存在,只有当以一定的形式,通过一定的载体表达时,才能为其他人所感知;第二类是存在于实物之中,如古文物、样品、样机、物品等。人们可以通过研究实物而获得某种知识;第三类是用文字、图形、代码、符号、声频、视频等技术手段记录在一定的载体之上,例如刻在甲骨上、印在纸张上等,这就是文献。3、文献是记录有知识的一切载体。(*注目前有关文献的较权威的定义主要有两个,一是《文献情报术语国际标准(草案)》(ISO/DIS5127)的定义,“为了把人类知识传播开来和继承下去,人们用文字、图形、符号、声频、视频等手段将其记录下来,或写在纸上,或晒在蓝图上,或摄制在感光片上,或录到唱片上,或存贮在磁盘上。这种附着在各种载体上的记录统称为文献。”另一个是中国的国家标准。是各种媒介和形式的信息集合,包括文字、声像印刷品、电子信息、数据库等。文献的构成要素(1)文献信息是文献的内容(2)符号系统是信息的携带者(*注:文字已不再是表达思想的唯一手段,图形、声频、视频等同样成为表达思想、传递感情的重要手段。总的说来,文献中的符号系统指图画、文字、公式、图表、编码、声像和电磁信息等。)(3)载体是符号赖以依附的“寄主”(*注:随着生产力的发展,存贮和表达人们思想的物质载体不同了,从金石、竹简、羊皮、丝帛、纸张发展到用感光介质和磁性介质。从非人工材质的泥版、岩石、石板、兽骨、木板、竹片、兽皮、树叶、桦树皮等到各种人工材质,如无机材质(陶、砖瓦、瓷,玻璃等)、金属材质(青铜、铁、铝、金银等)、高分子材质(帛、纸、胶片、醋酸纤维等)、复合材质(磁带、光盘等)。纸质文献已经多得不便于快速传输信息、高效查阅和高密度存贮了,于是其他介质的文献应运而生,这些文献主要包括:纸质文献具有价格低廉、质地柔软、易于书写、携带和收藏等其它一些载体所无法比拟的性能而成为文献家族的主干。)(4)记录方式是将文献的符号进入载体的方法和过程(*注:按记录方法分可有手工记录、机械记录、光记录、电记录、声记录和磁记录。其中最常见的是印刷。随着科技的发展,文字记录可以转变为数据记录,并用电子方法存贮到磁介质上去。此外,还有光学字符识别(OpticalCharacterRecognition,简称OCR)技术就代表了这种崭新的技术,它通过光学方法对字符、标记表示的书面数据进行自动识别,转换成机器可以处理的信息,这样就实现了纸质文献信息向电子信息的转换,而且可以通过不同接口装置向不同设备输入数据,这些设备进而与通信网络相连,实现远距离数据传送。))4、信息、知识与文献的关系(1)区别信息,有形的、独立于行动和决策、经过处理改变形态、物质产品、与环境无关、可以复制;知识,无形的、与行动和决策相关、经过处理改变思维、精神产品、环境改变涵义、经过学习才能转让、无法复制。”(2)联系知识是有组织的大量的信息,获得知识有赖于获得信息;信息是知识得以形成和传播的中介,有用信息,是人类对信息加工处理后的产物;并非所有信息都可成为知识,在信息时代,源于众多复杂客体的大量信息,现代化的信息手段,并通过掌握现代信息科学技术的认知主体,才能真正转化为知识。(*注:例如,人们对于卫星照片,气象云团的识读能力是不同的,所获得的信息的量和质将会有差别。)只有借助于而不是知识本身,知识是经过精心研究、领会后的信息、知识与文献的关系关系示意图5、信息素质信息素质(informationliteracy)是一个综合性的概念,包含信息意识,信息技能,信息道德。信息社会人们必须具备的素质,也是当今素质教育一个重要方面。(1)信息意识――是人们利用信息系统获取所需信息的内在动因,力和消化吸收能力。(*注:同样重要的信息,有的人善于抓住,有的人却漠然视之。这是由于各人的信息意识强弱不同。信息技能的掌