世界数字图书馆(WDL)现状与发展分析摘要:本文通过对世界数字图书馆项目的深入剖析,结合笔者参加该项目年度会议的心得,阐述了该项目的现状,并对该项目的未来发展从创新资源存储和组织策略、资源主题的扩展、加强互动性、加强参与性、开发移动应用等方面进行了详细分析,最后总结了国内数字图书馆合作项目可以借鉴之处。关键词:世界数字图书馆;WDL合作伙伴会议;少数民族数字图书馆随着数字图书馆理念深入人心,技术越来越成熟,资源量也不断增加,各国国家图书馆都或多或少地开展了数字图书馆项目,对反应本国特色的资源进行了数字化,这些资源代表了各国的文明,体现了本国的文化,因此,通过在一个统一平台上展示这些代表性的数字资源显得意义重大,影响深远,文明的融合交流将对促进世界文明的发展具有重要作用,在这样的背景下,世界数字图书馆(WorldDigitalLibrary,简称WDL)项目应运而生。1WDL项目现状2005年6月,美国国会图书馆馆长詹姆斯H林顿(Billington.J.H)在一次讲话中向美国教科文组织全国委员会建议设立WDL,基本思想是建立一个以互联网为基础的,易于访问、收集有世界各国文化财富,突出所有国家和文化之成就的数据库,从而促进各国文化间的认识和理解[1],该提议得到了联合国教科文组织(UnitedNationsEducational,ScientificandCulturalOrganization,简称UNESCO)的支持,决定由几个图书馆建立一个公开、可供自由访问的WDL网站。2009年4月,WDL网站向全世界推出,内容涵盖了联合国教科文组织的每一会员国,现已经有77个国家的165个伙伴成员为该网站提供了各类数字资源,给世界人民提供了一个共享的平台。WDL建设的主要目的[2]包括:1)促进国际和文化间的相互理解;2)增加互联网上文化内容的数量和种类;3)为教育工作者、学者和普通观众提供资源;4)加强伙伴机构的能力建设,以缩小国家内部和国家之间的数码技术鸿沟。1.1WDL官方网站()WDL官方网站界面十分简洁,但功能相当完善,包括以下四个部分:1)资源揭示WDL网站的资源揭示包括三种方式,即浏览、搜索和年代轴,浏览方式提供地点、时间、专题、资源类型和机构五种模式,世界各国读者可以从各个角度来获取资源,但WDL为了让资源的获取更加直观化、立体化,利用了年代轴方式,结合资源的年代和世界地图,让读者在拖动时间轴拨杆时,能看到北美、欧洲、中亚与南亚、东亚、拉丁美洲和加勒比海地区、中东与北非、东南亚、非洲、大洋洲和太平洋地区的资源图像随年代变化而变化,如同欣赏一条世界历史的长河,长河的头源于公元前8000年,而这条河在不断延伸,让世界人民共享历史文化的财富。2)最新信息为了让世界人民随时了解该项目资源建设的最新进展,最新信息模块以列表形式将最近新增或更新的资源展现出来,并显示WDL最新独特信息,便于让人们了解WDL的动态发展情况。3)资源展示WDL收集和发布资源,从一开始就相当强调元数据和标准规范的建设,资源展示界面是标准规范建设的成果。展示界面首先让读者看到资源图片,并提供PDF或者图片格式的文件下载,然后在右侧用统一的元数据对资源进行揭示,其元数据元素根据不同的资源而略有不同,WDL为所有需要提交资源的机构制订了标准的元数据集,共有17个元素,包括标题、描述、贡献者(包括作者、摄影师等)、出版社、出版地、创建日期、语言、地理位置(资源描述的地方)、时间、主题、资源类型(图书、手稿等)、附加主题、备注、物理描述(例如页数、大小等)、丛书题名、机构、资源在线网站等,同时这些元数据的内容通过超链接进行了关联,通过这17个元素的描述,读者对于WDL展示的资源就有了全面的了解。4)语言选择WDL网站具有七种语言来展现世界文化,包括阿拉伯语、汉语、英语、法语、俄语、西班牙语和葡萄牙语,除了葡萄牙语,其他6种语言都属于联合国官方语言,葡萄牙语则是世界语言中,应用较多的语言之一。为了提高翻译效率,工作组还使用了一个集中的翻译记忆工具,它避免了翻译人员重复翻译同样的单词或短语。另外,特别值得一提的是,WDL七种语言朗读的贴心设计,通过引入强大的语音朗读引擎,WDL的资源显示页面内容能够被朗读出来,人们不用看网页内容,只需要听即可,同时还提供了该网页朗读的语音下载,笔者聆听了某一中文简体的网页,朗读效果均属上等水平,抑扬顿挫基本符合了中国人的习惯,朗读速度也有快中慢三档选择,可见WDL项目在攻破语言障碍方面下了很大功夫。1.2WDL项目进展概况WDL项目组专门制作了项目网站[3],以方便项目相关信息的发布,同时为了加强沟通,根据WDL章程的规定[4],该项目组每年都会举办一次“WDL合作伙伴会议和执行委员会会议”,所有参与国均派出代表参会,在会上,对项目的进展进行回顾和总结,对未来的发展进行展望。笔者有幸于2012年12月5日至6日与国家图书馆魏馆长、文化部徐副调研员共同参加了在美国国会图书馆举行的2012年WDL合作伙伴会议和执行委员会会议,获取了WDL进展的第一手资料。WDL给全体会议参与者的印象是:一年来WDL项目有较大进展,项目组做了不少工作。详细总结如下:1)成员机构增加截止到2012年11月,已经有77个国家的165个成员加入了WDL项目,其中在WDL网站上发布内容的有46个国家的89家机构,并且机构在不断增加,在将来的数月里将增加10-12家机构来提供资源。2)内容提升截止到2012年11月,在WDL上发布的资源达到了6,588件,包含了319,340幅图片,比2011年的成员会议以来增加了2,508件,增长率达到了50.3%,年底将再增加134件。而且在资源较少而意义较大的高关注度领域有了关键性进展,这些领域包括阿拉伯科学手稿、中国古籍和手稿、来自中世纪和文艺复兴时期欧洲的各类珍藏、美索美洲的法律文件等。可见在发布内容上,不管是数量还是质量,都有较大的提高。3)帮助发展中国家的数字图书馆建设在WDL建立的时候,就倡导建立数字转换中心,以帮助发展中国家生产高质量图像的资源,便于WDL的展示,多年来,美国国会图书馆已与在巴西、乌干达、埃及、伊拉克和俄罗斯的合作伙伴建立了数字转换中心,2012年,WDL工作人员在帮助完善某些国家的因特网方面得到了成功,例如乌干达国家图书馆,其网络的完善才能让这些发展中国家的资源更快地在WDL网站上进行呈现。为了提高发展中国家信息工作者的信息素养,同时还尝试在卡塔尔国家图书馆建立了培训工作室,以期为中心培养更多的人才,为WDL资源建设提供更好的素材,为发展中国家数字图书馆水平的提高起到了重要作用。初步展示了WDL能协助发展中国家建立知识架构和资讯能力,以缩小“数字鸿沟”的功能。4)工作流的完善WDL的工作流是以编目为中心,对各机构提供的各种资源,依次进行内容选择、转换、处理、资源描述、元数据抽取和项目翻译并发布的全过程,工作流分别由四个相应工作组完成,即内容工作组、描述工作组、元数据工作组和翻译工作组[5],作为需要各国共同参与的巨大工程,其工作流的完善对该项目的运转起到至关重要的作用。成员提交资源的工作流包括内容提交、内容审核、元数据审核、发布等工作,2012年,也进行了卓有成效的工作。(1)资源提交内容提交过程包括资源提交和元数据提交,对于资源提交,进一步强调了成员在提交资源时,对所提交内容的简单介绍,以利于工作人员对资源进行快速梳理,提高了由资源提交到资源发布的效率,并有利于WDL工作组有针对性的建设重点资源等。2012年引入了新的资源提交方案,改变了过去成员以提交硬盘、光盘为主的方式,引入了Amazon公司的简单云存储设备(AmazonS3)方案,通过该方案,各成员实现了资源的自助提交、自助管理等功能。(2)资源审核资源审核是对成员所提交资源的内容和元数据的审核,目前增加了提交资源的审核预览功能,WDL制作了专门的资源预发布平台[6]供成员查看其提交的资源在WDL呈现的模样,当发现所提交的资源显示或者描述等有问题时,可以进行更改,这样可以提高资源的提交正确率,推动评审进程,提高WDL网站发布资源的效率。2WDL未来发展在本次会议上,项目成员对WDL的未来发展提出了很多建议,笔者在结合相关建议进行了归纳和分析的基础上,对WDL的未来发展提出如下思考。2.1创新资源存储和组织策略WDL项目的资源是通过各成员提交资源而得到的,所有资源都存储在WDL本地,成员负责提交资源的描述、元数据和对象数据,这种方式构建的是本地资源仓储,优点是质量较好、标准统一、访问速度最快,但缺点是资源增长较慢、对WDL项目工作组的压力过大,各成员提交资料的积极性参差不齐,另外这种方式下,只培养了伙伴机构的资源数字化能力,而其资源组织能力没有得到培养,因此笔者提出一种创新的资源采集策略,即云计算策略。充分利用云计算分布式存储和分布式部署的特点,WDL项目工作组可以协助各机构建立资源存储和管理平台,通过建立全球唯一标识符系统来实现对日益增加的机构资源平台的管理,所有的资源均分布存储在各机构中,WDL制定资源的加工组织管理标准,并为有需要的机构员工提供资源加工、组织、管理和发布的专业培训,保证每个机构都能构建本地的WDL资源平台供本地民众查看,同时WDL工作组也能够通过统一接口采集各机构的资源的元数据,元数据必备元素包括资源的缩略图和链接到对象数据的超链接,再将元数据集成到WDL主页上,这种整合方式在保留了原WDL的资源展示风格的基础上降低了存储消耗,具体优点如下:1)促进资源的快速增长。由于是各机构自主创建数据库,且资源不用实际的提交到WDL项目的服务器中,一定程度上消除了各机构对于资源流失的担忧,各机构在满足WDL要求的同时也建设了自己的资源库,从而大大提高了机构建设资源库的积极性,资源量定会得到快速增长。2)降低成本。在存储成本方面,资源都存储在不同机构的服务器上,WDL需要投入的存储资源较少;在沟通成本方面,之前的模式,WDL需要督促各机构提交资源,检查资源的质量,并需要反复审核,时间周期较长,成本较高,而若采用云计算分布式模式,WDL只需要制定统一的资源展示标准,并和各机构沟通资源链接接口,WDL项目定期自动从各机构获取最新的资源即可。3)提高伙伴机构的资源建设能力。WDL的目的之一是加强伙伴机构的能力建设,以缩小国家内部和国家之间的数码技术鸿沟。通过培训各伙伴机构建立自己的资源仓储库和发布平台,可以快速地提高其资源建设能力,推动各国数字资源建设的发展,以产生更多的资源,吸引更多的机构,扩大WDL的影响力。这种方式也有不足之处,首先,网络环境影响很大,由于WDL保存在本地的仅仅是元数据,对象数据需要链接到各个伙伴机构的对象数据上,网络的好坏直接影响到用户的体验效果,因此需要制定网络环境的标准,并帮助发展中国家来搭建良好的网络环境。其次,不同的国家和机构,设备和技术条件相差较大,例如落后国家的机构,没有数字化的设备、服务器等基础设施,很难短时间内搭建一个平台来提供服务。建议结合现有模式和云计算服务模式,扬长避短,优劣互补,推动WDL馆事业的发展。2.2资源主题的扩展在2009年发布的WDL内容选择指南[7]中,指出WDL所收集的资料包括各国重要文史原始资源及相关元数据的数字版本[8],可见WDL收录文献主要以收录文史方面的原始资料为主,在这次会议上,与会者对资源选择的问题进行了讨论,WDL项目主任、美国国会图书馆乌登那仁先生就指出,“现在正是需要对2009年发布的WDL内容选择指南进行再次审视的时候了[9]”。WDL在逐步实现展示各国历史文化的基础上,可以尝试全面展现各国现代文化的发展成果,如具有历史意义的科技成果、各国旅游文化等,吸引更多的读者在WDL项目上找到兴趣点、学习点,让WDL真正成为一个全面展示各国文化的重要窗口。2.3加强互动性WDL项目已经引入了web2.0的一些社会网络应用,例如wiki和twitter,各国读者都可以通过这两个应用关注和了解WDL,并与WDL进行互动,但是从WD