第一节数字信息资源检索概念与类型数字信息资源概念狭义地讲,可称电子资源,指一切以数字形式生产和发行的信息资源。所谓数字形式,是以能被计算机识别的,不同序列的“0”和“1”构成的形式。数字资源中的信息,包括文字,图片,声音,动态图像等,都是以数字代码方式存储在磁带,磁盘,光盘等介质上,通过计算机输出设备和网络传送出去最终显示在用户的计算机终端上。数字信息资源的特点存储介质和传播形式发生变化将文字,图像及各类音像资料中的声音动态图像结合在一起,利用数字技术进行制作存储在光盘,磁盘,硬盘等载体上以多媒体作为内容特征集文本图片,动态图像,声音超外国投资等多种形式为一体信息资源类型多种多样包括数据库,电子期刊,电子图书,电子报纸,专利等正式出版物,以及学位论文,教学课件等灰色文献多层次的信息服务功能检索功能,学科导航,分类主题指南,网上讨论等数字信息资源的特点更新速度快,时效性强具备检索系统不受时间,地域限制。数字信息资源的产生与发展1960年代初,“化学题录”和“医学索引”1965年以后,数据库联机检索开始出现,最著名的如DIALOG,MEDLINE等,1980年以后,由于卫生通信技术,光纤通信技术,个人计算机的产生和发展,数据库数量已达到3600个。数据库的类型也由书目,文摘,索引数据库发展为全文数据库及数值,指南数据库20世纪90年代以后,网络和信息处理技术的发展,使得基于互联网开发的数字资源及其检索系统有了突飞猛进的增长数字信息资源的类型按照数字资源的性质和功能分一次文献:原始文献,指反映最原始思想,成果,过程以及以其进行分析,综合,总结的信息资源二次文献:对一次文献进行加工,整理便于利用一次文献的信息资源,如网络资源学科导航,分类指南等。二次文献可以把大量分散的一次文献按学科或主题集中起来组织成无数相关信息的集合。三次文献:指对二次文献进行综合分析,加工,整理的信息资源,如专门用于检索搜索引擎的搜索工具按照数字资源的生产途径和发布范围划分商用电子资源:也称正式电子出版物网络公开学术资源:半正式出版物,包括各种学术团体,行业协会,政府机构,商业部门,教育机构等在网上正式发布的网页及其信息特色资源:也属于半正式出版物,主要基于各教育机构,政府机关,图书馆的一些特色收藏制作。按照数字资源的载体划分光盘数据库网络数据库联机数据库等按照数字资源的学科划分如农业,人类学,天文学,艺术,航空航天等主要信息资源类型•参考数据库•全文数据库•事实数据库•搜索引擎/分类指南•网络学术资源学科导航•FTP资源•其他主要信息资源类型指包含各种数据、信息或知识的原始来源和属性的数据库。数据库中的记录是通过对数据、信息或知识的再加工和过滤,如编目、索引、摘要、分类等,然后形成的。参考数据库主要包括:书目数据库:主要是针对图书进行内容的报道与揭示的,如各图书馆的馆藏机读目录数据库;文摘和索引数据库:对期刊论文、会议论文、专利文献、学位论文等进行内容和属性的认识与加工,如“科学引文索引”(ScienceCitationIndex)、“化学文摘“(ChemicalAbstracts)、“工程索引”(EngineeringIndex)等数据库。1.参考数据库:主要信息资源类型2全文数据库收录有原始文献全文的数据库,以期刊论文、会议论文、政府出版物、研究报告、法律条文和案例、商业信息等为主。主要信息资源类型事实数据库指包含大量数据数据、事实,直接提供原始资料的数据库,又分为数值数据库、指南数据库、术语数据库等,相当于印刷型文献中的字典、辞典、手册等。数值数据库:指专门以数值方式表示数据,如统计数据库,化学反应数据库等;指南数据库:如公司名录、产品目录等;术语数据库:即专门存储名词术语信息、词语信息等的数据库,如电子版百科全书、网络词典等。主要信息资源类型搜索引擎/分类指南搜索引擎主要是使用一种计算机自动搜索软件,在互联网上检索,将检索到的网页编入数据库中,并进行一定程度的自动标引,用户使用时输入检索词搜索引擎将其与数据库中的信息匹配,然后产生检索结果。例如常用的Yahoo,Hotbot,AltaVista,Excite,Google,天网,悠游等分类指南是将搜索到的网页按主题内容组织成等级结构(主题树),用户按照这个目录逐层深入,直到找到所需文献。通常搜索引擎与分类指南是结合在一起的,例如:Yahoo,新浪,悠游等。主要信息资源类型网络学术资源学科导航将互联网上的开放信息加以甄别、筛选和科学整理,按学科组织起来构成完事的学科导航系统,为教学、科研、技术人员提供各类学术信息。与搜索引擎/分类指南不同的是,网络学术资源的学科导航库通常是由图书馆单独或联合建设的。主要信息资源类型•FTP资源FTP含义是FileTransferProtocol,意为文件传送协议,是互联网上最早应用的协议之一,它可以使用户远程登录到远端计算机上,把其中的文件传回到自己的计算机上,或把自己计算机上的文件传到远端计算机系统上。所谓FTP资源,是指互联网上的FTP站点,这些站点允许用户登录上去,从中下载各类数据、资料、软件等。有些搜索引擎,如天网(),可以专门用来检索网上的FTP站点。其他:如网站,BBS,新闻组等,也可以给用户提供一些有用的知识或动态信息。第二节数字信息资源的检索数字信息资源检索的概念是指通过检索系统,采用一定的技术手段,根据一定的准则,在数据库或其他形式的网络信息资源中自动找出用户所需相关信息。简单地说,是一个信息存取的过程,是人、计算机和网络共同作用下自动完成的。数字信息资源检索系统的构成从物理构成来讲,检索系统由硬件、软件、数据库三部分组成•硬件:也可以说是硬件环境,是和计算机检索有关的各种硬件设备的总称,如大型计算机主机,存储器,网络,输入输出设备,计算机终端或个人计算机。•软件:与计算机检索有关的数据库系统软件及相关应用软件。包括:信息采集、存储、信息标引加工、建库、词表管理、用户检索界面、提问处理、网络发布、数据库管理等模块。•数据库:数据库是指按一定方式,以数字形式存储,可通过计算机存取、相互关联的数据库集合按照功能划分,又可以分为以下几个模块A信息采集模块:本模块的任务是连续、快速地采集各类信息,为数据库提供充足的数据来源。•B信息存储模块:对数字资源进行存储和管理,数字资源按•照不同类型,如文字、声音、图像、数字等,按不同的格•式被存储在不同的数据仓库中。C标引著录模块:对信息的内容和特征进行分析,然后给予一定数量的标识,作为信息组织、存储与检索的基础。例如信息的名称、创作者、主题、分类、出版/生产时间、出版/生产者、关键词等,都可以作为信息的描述性标识。D规范模块:指对信息特征和用户提问的语言形式做出规定,如主题词表、人名规范、地名规范、时代名称规范等。目的在于:一是使用户的检索更具准确性;二是逐步形成一个知识网络,通过相关信息的提供,使用户的检索更为完整。E.内容发布模块:将数据库内容传递到网络上,让用户以常规手段查询浏览。F.检索模块:即狭义的检索系统,即将用户的需求进行分析,并和数据库中的信息匹配运算,再反馈给用户所需的检索结果。G.服务模块:这是在传统检索系统基础上发展起来的新功能,即不仅向用户提供检索,也在信息资源基础上,根据用户需求,为用户提供一些可定制的服务,以及由系统主动向用户提供新的服务内容。H.管理模块:主要指管理客户端,即对用户和用户行为进行管理和调查分析。包括三个部分:一是对用户的管理;二是运用数学和统计学方法对用户行为的各种相关信息进行累积、加工、分析,生成各种状态报告,提供给数据库生产者、系统开发者和用户,以便对数据库及其系统进行修改、完善,使其不断得到提高;三是监控系统使用情况,如观察用户有无违反版权规定、恶意下载现象,并对违法用户进行相应处罚。第三节常用检索途径•题名•作者姓名•分类•主题•关键词检索•顺序号检索