第一篇信息技术与计算机数字图书馆概述1数字图书馆的应用2超星数字图书馆及其检索3第四章数字图书馆4.1.1数字时代的图书馆所谓数字图书馆,就是利用现代信息技术对有高度价值的图像、文本、语音、音响、影像、影视、软件和科学数据库等多媒体信息进行收集,组织规范性的加工和压缩处理,使其转化为数字信息,然后通过计算机技术进行高质量保存和管理,实施知识增值,并通过网络通讯技术进行高效、经济地传播、接收,使人们可以在任何时间、任何地点,都能从网上得到各种服务,为公民的终身学习机会做出贡献,成为国家的知识基础设施。同时,数字图书馆工程建设还包括知识产权、存取权限、数据安全管理,加强研究机构、商业机构、政府和教育团体之间的联系与合作等内容。“数字图书馆”在概念上存在多种解释,这从一个侧面证明了它是一个新生事物。“数字图书馆”一词,源于1993年由美国国家科学基金会(NSF)、美国国防部尖端研究项目机构(DARPA)、国家航空与太空总署(NASA)联合发起的数字图书馆创始工程(DigitalLibraryInitiative)。以后“数字图书馆”一词迅速被全球计算机学界、图书馆界及其他相关领域所使用。通俗地讲,数字图书馆就是数字化的信息资源库(或者叫信息数据库),它应有以下几个特性:①可以不断扩展。②可以在统一的网络平台上运行;③分散的、但在统一的标准下建设;1945年,美国著名科学技术管理学家布什(V.Bush)先生在《大西洋月刊》上发表了《诚如我们想象的那样》(AsWeMayThink)一文。文中,他首次提出将传统的图书馆馆藏文献的储存、查找机制与计算机结合起来,构思并描述了他所设想的一种Memex装备机械化的个人文档与图书馆,即台式个人文献工作系统,能存贮书、记录和通讯的装置。1948年,美国数学家维纳(N.Wiener)成为第一个指出电子计算机将能够在图书馆运作中大显身手的学者。1978年,美国著名图书馆学家兰卡斯特(F.W.Laneaster)发表了《走向无纸的时代》和《电子时代的图书馆员》两部论著,第一次向世人详细描述了电子图书馆的前景。1979年,英国不列颠图书馆的哈利(A.J.Harley)提出了“虚拟图书馆”的概念。1988年,美国国家科学基金会(NSF)的伍尔夫(W.Wulf)撰写国际合作白皮书,正式提出了数字图书馆的概念。与此同时,在一些发达国家,如英国、加拿大、日本等国也引起了极大关注。由于Internet的迅猛发展彻底地改变了传统信息服务的格局,引发了信息采集、加工、传输及获取方式的根本改变,使得从电子图书馆到虚拟图书馆再到数字图书馆应运而生。我国在1999年也将数字图书馆纳入国家、大学和科研机构的三至五年发展重点之列,并先后涌现出了一批重大成果。数字图书馆是运行在高速宽带网络上、分布式超大规模、可跨库检索的海量数字化信息资源库群。数字图书馆最大限度地利用各地已经搭建的软硬件环境,对信息资源进行接收、存储、服务。它需要拥有超大容量的分布式资源数据库群,要为用户提供可靠的信息就需要配置高性能的软、硬件基础设施。通过网络传输的信息资源是按统一标准规范加工整合过的数字化信息资源,它包括:图书、戏曲、音乐、舞蹈、电影、文化旅游、农业科技、科普知识、法律知识、文化新闻等。它超越了人们意识中图书的概念。数字图书馆是一门全新的科学技术,也是一项全新的社会事业。简而言之,就是一种拥有多种媒体内容的数字化信息资源,能为用户方便、快捷地提供信息的高水平服务机制。虽然称之为“馆”,但并不是图书馆实体。通俗地说,数字图书馆就是虚拟的、没有围墙的图书馆,是基于网络环境下共建共享的可扩展的知识网络系统,是超大规模的、分布式的、便于使用的、没有时空限制的、可以实现跨库无缝链接与智能检索的知识中心。数字图书馆既是完整的知识定位系统,又是面向未来互联网发展的信息管理模式,可以广泛地应用于社会文化、终身教育、大众媒介、商业咨询、电子政务等一切社会组织的公众信息传播。下图(图4-1数字方舟数字图书馆的主页)是数字方舟信息技术有限公司建立的数字图书馆的主页。4.1.2数字阿图书馆的类型1.未来的数字图书馆“当你想重新温习一下《红楼梦》的时候,你只需进入图书馆的网址,找到《红楼梦》并选择下传,这时你就可以在家享受这本书了。而当你想到图书馆借书时,你会发现在图书馆你拿到的会是一张光盘,里面有你需要的图书。把图书变成数字形式,从而最大化地挖掘图书的利用率是数字图书馆建设的原因。”这席话是中国数字图书馆发展战略组组长、数字图书馆国际论坛常委副主席徐文伯在闭幕时说的。徐文伯说:“数字资源是人类社会的共同财富,将成为21世纪人类社会发展最重要的战略资源。数字图书馆国际论坛的宗旨,就是要在中外相关企业界、学术界和政府之间搭建一个相互交流的平台。通过交流和研讨,吸取国外先进科研成果和经验,促进我国数字资源建设的技术创新和体制创新。”有代表性的数字图书馆是考虑到用户使用实体图书馆的习惯或体验来设计其导航系统的,如目录系统、参考咨询台、按主题排列的数字化工具书、阅览室或馆藏资源等。2.国外数字图书馆国外数字图书馆大致可有如下类型:(1)以传统期刊的对应电子版为主体。(2)书目服务服务器。(3)联合体结构。(4)电子出版物存储库。上述各种数字图书馆在类型的划分上并不都是单一的,不少数字图书馆实际上采用了程度不等的混合形式,如既采用集中处理电子产品的办法,也提供书目式工具联结各地的资源;或者将NCSTRL式的开放且可扩充的结构与存储库式的集中管理结合起来,使许多地方馆藏得以挖掘和利用。•美国数字图书馆先导研究计划第一期的成功和第二期的实施,对美国国内乃至世界各国的数字图书馆的建设起到了极大的推动作用。近几年各国数字图书馆的研究开发高潮迭起,通过因特网可以查到的有关项目、课题有数百个之多。数字图书馆领域的研究开发是体现数字图书馆理念最好实例:充分利用因特网的便利条件,信息公开,依靠技术提高信息的可获得性。该领域的绝大多数研究资料都可以通过因特网直接得到,包括许多会议论文(例如IEEE的早期数字图书馆会议录全文),部分可能要通过付费方式,例如ACM(AssociationforComputingMachinery,实际上的美国计算机协会)的技术报告等。•根据我们分析,国外目前数字图书馆计划和项目大致可分为三种类型:技术主导型、资源主导型和服务主导型,基本区分见下表:•类型内容特征举例技术主导型以涉及数字图书馆资源获取、存储、组织、检索、发布和版权管理等方面的技术创新和开发为目标,资源库通常作为测试环境或副产品。求得某一方面的技术进展,成果为技术报告,资源库只作为测试环境(Testbed)DLI1、DLI2项目资源主导型以资源数字化为目标,借助一定的技术手段(不一定是最先进的),提供因特网浏览和检索可以是资源网站,任何商业机构、个人都可以开发建设,很多项目属于传统图书馆资源的数字化。“美国记忆”项目,纽约公共图书馆历史收藏项目,UNCOVER等服务主导型以各类型资源库的整合和系统服务为目标,结合各种先进的服务手段,如个性化服务、自动定制等,并常常用到各种电子商务手段,如用户认证、付费管理等。深层次的情报服务,常常是传统图书馆向数字图书馆转型期的必然选择加里福尼亚数字图书馆项目、大英图书馆项目•上述分类反映了目前数字图书馆研究的丰富性,所有这些相关努力带来了数字图书馆的繁荣,每一个具体的组织机构都站在它的角度、以它自己的理解进行研究或开发,涓涓细流汇成大海。数字化图书馆从一开始就不局限于一个行业或学科领域,它不仅仅是数字化资源的集合,而是数字化资源与服务,以及一系列工具的有机组成,数字图书馆的建设也不仅仅是技术问题,而是一系列目标与政策的合力。•4.1.3数字图书馆的教育特点•1.数字图书馆教育的特点•(1)数字图书馆教育是一门跨学科的综合性课程,它涉及图书、情报学、计算机、网络、法律、经济、行为学、伦理学等学科和领域。•(2)它又是一门理论和实践性紧密结合的课程,课程不仅在理论上涉及面广,而且在实践操作方面对学生提出了较高的要求。•(3)数字图书馆教育是一门动态的课程。•①它需要根据不同的受教育者施行不同层次的教育内容;•②随着数字图书馆理论和实践研究的不断深入而要对课程内容进行更新。••2.数字图书馆教育的目的•(1)让学生了解和掌握数字图书馆各类知识;•(2)让学生掌握通过网络检索各类资源的基本技能;•(3)帮助学生选择最合适的信息检索工具;•(4)引导学生利用网络重组信息资源和完成相关或非相关的研究任务;•(5)指导学生对各类信息进行合理利用和正确评价;•(6)提高学生的社会意识、法律意识和心理行为意识。4.2数字图书馆的应用4.2.1数字图书馆的应用技术当今科学技术日新月异,以现代信息技术,尤其是以计算机技术、高密度存贮技术、通讯技术、网络技术和多媒体(超媒体)技术为基础的数字图书馆得到飞速发展。数字图书馆的实质是利用计算机网络存储和发布大量数字化的信息系统,面对可管理的数字对象和服务的集合,实现它的存储、发现、检索、保存、获取和传递功能。而诸功能的实现则要依赖应用技术的挖掘与发展。下面就数图资源的应用技术类型及发展趋势进行简单介绍。1描述类技术数字图书馆提供的信息资源广泛,但信息的精准率却往往达不到要求,主要原因是信息提供者片面重视信息资源内容而忽视了信息资源的描述、组织和管理。数字图书馆的简易性取决于所提供的信息资源的描述型类型和质量。标准的描述技术是实现资源共享的要求,也是数字图书馆发展的迫切需要。在数字图书馆建设中,主要指描述性元数据的建立。元数据又称为“描述数据”,是关于数据的数据,是对数据内容的描述。2.存储类技术网络存储是目前国际上一个较新的研究课题,而附网存储和存储局域网的研究在网络存储中占有重要地位,技术比较成熟,应用越来越广泛,也是数字图书馆建设的主要支柱技术之一。(1)附网存储(NetworkAttachedStorage,即NAS)NAS实际上是一个带有称之为“瘦”服务器(ThinSever)的存储设备。让服务器脱离文件处理任务,从而提高网络性能。在NAS存储结构中,存储系统不再通过I/O总线附属于某个特定的服务器或客户机,而是直接通过网络接口与网络相连,允许客户机与存储设备间进行直接的数据访问,使用TCP/IP等网络协议,通过LAN实现数据交换和存储管理。其主要特征是把存储设备与网络接口集成在一起,直接通过网络存取数据。(2)存储局域网(StorageAreaNetwork,即SAN)它是独立于服务器网络系统之外几乎拥有无限存储的高速存储网络,它以光纤通道作为传输媒体,以光纤通道和SCSI的应用协议作为存储访问协议,将存储子系统网络化。3.检索类技术(1)全文检索技术全文检索(Full-TextRetrieval)是以文本数据为主要处理对象,根据数据资料的内容而不是外在特征来实现的信息检索手段。全文检索技术是信息检索的一个分支,它的出现导致了信息检索领域的一场革命。与以前的情报检索相比,全文检索提供了全新的、强大的检索功能。全文检索系统主要包括两方面的核心技术,一个是如何建立和维护全文检索的索引数据库,另一个是如何提供快速有效的检索机制。其中索引数据库是一个全文检索系统实现的基础,它的体系结构和组织方式直接决定了检索算法和检索效率。全文检索是一个很成熟的技术,它能够解决对网页细节的检索问题。从理论上说,只要网页上出现了某个关键词,就能够使用全文检索用关键词匹配把该网页查出来,因而它是网络资源深度开发、虚拟馆藏信息资源建设的有效技术。(2)信息定制技术信息定制技术的本质就数字图书馆而言,就是采用自有的软件技术优势,按照使用者的特定需求,包括使用者自己提交的检索策略,形成使用者自己的描述文件,为其制作出个性化的使用界面,动态即时地为使用者搜集和组织数字化信息。(3)信息抽取技术信息抽取作为一项日渐成熟的技术,在信息处理自动化中具有重要地位。在数字图书馆中,运用信息抽取技