试论电子印本文库的功能张耀坤*(华中师范大学信息管理系武汉430079)摘要电子印本文库为预印本交流提供了一个开放、可靠的平台。促进预印本交流是电子印本文库最基本的功能。除此之外,电子印本文库的功能也得到了扩展,包括改革传统学术交流模式的功能、提升学术影响力的功能、保存科研智力产出功能、实现全球范围内科研资源共享的功能等。关键词预印本电子印本文库功能非正式科学交流开放存取资源共享分类号G356.1OnTheFunctionsofE-printArchiveZHANGYaokunXIANanqiang(DepartmentofInformationManagement,CentralChinaNormalUniversity,Wuhan430079)Abstract:E-printarchiveprovidesanopeningandreliableplatformfore-preprintcommunication,thuspromotingpreprintcommunicationbecomesthebasicfunctionofE-printarchive.Inaddition,e-printarchivealsohaslotsofextendedfunctionssuchasreformingthetraditionalscholarlycommunicationpattern,enlargingthescholarlyinfluence,preservingtheoutputofscientificresearchandsharingthescientificresourcesglobally,etc.Keywords:preprint;e-printarchive;function;informalscientificcommunication;openaccess;resourcesharing随着计算机及Internet的日益普及,科学交流的形式发生了巨大的变化。尤其是科学交流的非正式过程,以其固有的优点如具有最短的情报间隔时间、具有高度的选择性和针对性等[1],在网络环境下正显现出无比强劲的发展势头。电子印本文库即为网络环境下一种有效的非正式科学交流系统。电子印本文库是一种促进研究成果及时发布的网络学术交流平台,它通过作者自存档方式收集各种形式的学术论文的电子版本,经由互联网提供全球用户开放存取,并利用《开放存取计划》实现系统互操作,向信息增值服务提供商提供所收录电子印本的元数据记录,使其能够基于元数据开发各类信息增值服务项目。[2]乔冬梅先生下的这个定义较为详细地指出了电子印本文库的功能、实现方式及增值服务模式,但将增值服务模式也作为定义的一部分,似乎有些不妥。我们认为:电子印本文库就是通过作者自存档(self-archiving)方式收集并存储有各种形式的电子预印本(pre-print)和后印本(post-print),向全球用户提供开放存取服务的在线数据库。网络环境下,电子预印本取代了传统环境下以纸张为载体的预印本。它继承了纸质预印本的非正式科学交流功能并极大地增强了这一功能。电子印本文库则集成了众多的电子预印本,为电子预印本交流提供了一个开放、可靠的平台。依靠电子印本文库,预印本交流的效果有了显著的提高。随着建设理念和技术日趋成熟及影响力的不断增长,电子印本文库除了拥有最基本的促进预印本交流的功能外,它的功能也延伸和扩展到了众多方面,包括改革传*E-mail:yaokunzhang@yahoo.com.cn1统学术交流模式的功能、提升学术影响力的功能、保存科研智力产出功能、实现全球范围内科研资源共享的功能等。1基本功能——促进预印本交流传统环境下,科学交流可以分为正式和非正式两个过程,而非正式科学交流过程由于其固有的一些优点为广大科研工作者所青睐。利用预印本进行非正式交流是比较常见的做法,如科学家将论文手稿在正式刊物上发表之前,会将论文预印本以各种方式分发给其他同行以获取宝贵的意见;会议主办机构在会议召开之前,也会将会议论文预印本事先分发给与会代表;等等。这种预印本交流针对性极强,参与交流的学者局限在一个小圈子里,即所谓的“无形的集体”之中,交流的范围是相当狭窄的。为了扩大交流的范围,就势必要增加这一“集体”的成员数量。一旦此数量达到临界极限,由于应当分发的文件数量增多,这种渠道就不再能用有限的费用去保证足够迅速地传递科学情报。于是,“无形的集体”就会解体,而为了传递在其内部交流的科学情报,就会出版新的杂志。[1]在这种情况下,预印本的非正式科学交流功能是极为有限的。也因此,J.M.齐曼指责道:“关于发展‘交换预印本’的建议,即打算把这一自发的过程变为行之有效的机构的建议,是绝对错误的。建议的设想是这样的:每一位作者把手稿的打字本寄给某中心,在那里把手稿复印出来散发给一切有关人士。”[3]今天,重新审视一下J.M.齐曼所指责的所谓的建议,可以发现,这一建议实际上已经付诸实践并已有效地运行了十几年(如果把1991年PaulGinsparg创建arXiv伊始看作是这个建议付诸实践的话)。这一建议的实践是这样的:科学家将论文的电子版本以各种方式(如E-mail、ftp、WWW等)提交至电子印本文库(如arXiv.org),在那里论文的电子版本可免费地供一切有关人士浏览、获取。作为预印本交流平台的电子印本文库,至少在以下两个方面取得了较大的成功:第一,预印本交流的范围。电子印本文库的建立使得预印本交流第一次可以如此便捷并且如此大规模地进行。它为全球的科研工作者提供了一个开放的学术交流平台,任何人任何组织机构都可以平等地参与这个过程。如果说早期的预印本交流只局限在狭小的“无形的集体”之中,那么电子印本文库则使得这一“无形的集体”变得巨大无比,全球的科研工作者都是这一集体的组成人员,预印本的非正式科学交流功能正变得越来与强大。事实也证明了这一点。自2000年年初到2004年年底,arXiv共收到来自113个国家与地区的论文提交[4],这一数字还在增大。第二,预印本交流的透明化。传统环境下,预印本交流处于相对隐蔽的状态。电子印本文库的建立使得预印本交流从相对隐蔽逐渐转向相对透明,这主要表现在两个方面:首先,电子预印本本身是对外界透明开放的。电子预印本一旦上传到文库,就可以免费地供任何人浏览、获取、评价等,不会因为身份等条件的不同而有所限制。并且,电子印本文库对每个提交的预印本都赋予唯一的标识加以保存,用户通过此唯一的标识即可获取该预印本。这一举措也增强了预印本的透明度。其次,交流的过程是透明的。作者一旦提交预印本后,便不可避免地要接受其他用户对文章的评价,作者可以对这一评价做出回应并适当地对预印本做出修改,系统对修改后的预印本也会自动给予标识。所有这一系列的过程都是公开进行的,用户可以获知交流的每个细节。值得强调的是,米哈依洛夫所认为的“既然在定义上是非正式,就不可能成为特有的或严整的”的观点,抛开米氏对科学交流正式与非正式过程加以区别的局限性,仍然是正确的。电子预印本没有经过严格的同行评审,所执行的仍是非正式科学交流的功能。虽然电子印本文库促进了预印本交流,使得预印本交流的效果有了一个很显著的提高,但无论如何,电子印本文库都没有改变电子预印本非正式科学交流的实质。盲目地夸大电子印本文库的此项功能将有可能导致整个科学交流系统的巨大损失。22扩展功能之一——提升学术影响力与商业出版领域的作者不同,科研工作者发表论文并非出于经济目的,而是为了最大限度地提升自己在学术界的影响力。[5]电子印本文库较好地满足了此类需求。科学家的学术影响力首先来自于对科学发现优先权的确认。科学发现优先权是指科学共同体对科学家所做出的独创性发现所给予的承认。[6]科学家力求在第一时间内将成果公诸于世以获取科学发现的优先权,而传统的期刊并不能满足这一要求,这主要是因为期刊发表的时滞性所造成的。科学家要达到这一目的,必然要寻求其他的途径。电子印本文库即为网络时代的有效途径之一。电子印本文库的开放交流机制使得科学家的成果能够在第一时间内为业内学者所知晓,并且能够提供有力的证据来佐证科学发现的优先权。学术影响力的提高其次来自于论文的更大范围传播及被引用。网络环境下,科学家除了以在传统期刊上发表论文的方式传播自己的研究成果外,也乐于将文章放到网上供他人开放获取以尽可能地扩大自身的学术影响力。这一行为是基于以下假设的:开放存取文章比非开放存取文章影响度要高。对此进行的研究也证实了这一假设。SteveLawrence通过对可免费获取的计算机科学会议文献的影响因子进行统计,证实其影响因子确实要高于非免费在线获取的文献。[7]CristinaAntelman对数学、电气电子工程、政治学及哲学四个学科的开放存取文章影响力的研究完善了Lawrence的结论。[8]TimBrody等通过对ISI@CD-ROM*引文数据库(1991-2001)中7000份主要期刊及arXiv.org中的物理学文献进行分析,结果表明在物理学领域OA与非OA文章被引用比例高达2.5~5.8。[9]这一比例随学科和领域的不同有所不同,但总的说来,OA文章比非OA文章的影响力要高出许多。将论文预印本提交至电子印本文库免费供同行浏览、下载,从而大范围地提升自己的学术影响力便是其中的方法之一。由于电子印本文库大多具备良好的系统构架,有专人对资源内容进行管理、维护,且一个以学科为单位的电子印本文库,往往能成为该学科领域交流的集中地。因此,科学家普遍都愿意采取此种方式以提高自己的学术影响力。电子印本文库除了提供文章的免费浏览、检索和下载机制之外,也采取了多种措施来提高库内文章的能见度以最大限度地提高影响度。如采用元数据收割协议(OpenAccessInitiativeforProtocolMetadataHarvesting,OAI-PMH)。[10]遵循OAI协议的电子印本文库能够以数据提供者的身份被OAI服务提供者收割其元数据或被通用搜索引擎所遍历,用户通过常见的检索途径即可获取预印本资源,这也大大地增强了电子印本文库的此项功能。对于机构而言,学术影响力是评估其综合实力的主要指标之一。与个人情况类似,机构也希望能最大限度地提升本机构的学术影响力。因此,建设机构层面的机构电子印本文库便成为目前诸多大学的通行做法。如加利福尼亚大学的eScholarshipRepository[11],MIT的DSpace[12]等。机构电子印本文库与学科电子印本遵循同一理念。所不同的是,机构电子印本文库以机构为单位,一般而言只收录本机构成员的预印本,且涉及的学科较为广泛,资源较为分散,难以形成特色优势。因此,机构电子印本文库要扩大资源被利用率,势必要广泛地开展合作。3扩展功能之二——保存科研智力产出如前所述,机构建设电子印本文库的主要目的之一是为了提升本机构的学术影响力。与此同时,保存本机构的智力产出也是其主要功能之一。科研机构是智力产出的主要机构,有责任对这些智力成果进行保存。英国下议院科技委员会曾针对高等教育之机构典藏提出过相关报告,并建议所有的机构针对该单位的智力产出,皆应设置一保存机制管理维护。[13]机构电子印本文库即为此种保存机制。由于机构电子印本文库以机构为最小单位,在政策制定和运行模式的选择方面更为灵活。如机构电子印本文库可以以行政方式干预本机构成员对其智力成果的自存档行为,而且机构电子印本文库3也拥有较好的经济保障等。拥有诸多优势的机构电子印本文库在保存机构智力产出这一功能上能表现得更为出色。同时,以机构为单位,开展全国范围内的机构电子印本文库合作对保存国家科研智力产出也有着重大的意义。例如e-printUK项目。该项目由英国联合信息系统委员会(JISC)资助,旨在通过OAI-MPH收割机构和学科电子印本文库的元数据以建立一个全国性的OAI服务提供者。[14]对于学科电子印本文库而言,情况略有不同。此类型的文库除了反映最新的学术文章外,对“历史性资料”进行保存也是其最为有用的一面。