高校图书馆国内电子书采购风险及对策吴云珊广西师范大学图书馆541004[摘要]针对目前国内电子书市场存在的问题,以数字图书馆为研究对象,从数字版权、图书质量、使用功能、盈利模式、价格机制、业务规范等六个方面阐述并分析采购国内电子书存在的风险,并从高校图书馆数字资源采购实践出发,总结经验,提出相应六方面风险应对策略,以期为高校图书馆采购人员提供业务参考,规避国内电子书采购风险。[关键词]电子书;数字版权;数字图书馆;盈利模式;价格机制;统一检索;[分类号]G251.5RiskandCountermeasuresofDomesticE-bookPurchaseinUniversityLibraryWuYunshanGuangxiNormalUniversityLibrary[Abstract]Accordingtotheexistingproblemsofdomestice-bookmarket,takingdigitallibraryastheresearchobject,theriskofpurchasingdomestice-booksisexpoundedandanalyzedfromsixaspectsofdigitalrights,e-bookquality,functionofuse,profitmodel,pricemechanism,standardsofpractice.Proceedingfromthepurchasingpracticeofdigitalresourcesintheuniversitylibraryandsumminguptheexperienceofit,sixcountermeasuresareproposedinthehopeofgivingpurchasinglibrarianssomeprofessionalproposalsforreferencetoavoidthepurchasingriskofdomestice-books.[Keyword]E-book;DigitalRights;DigitalLibrary;ProfitModel;PriceMechanism;One-stopSearch;电子书,指以电子技术存储、显示、传播的拥有内在系统性和连贯性的文字组成的信息,即电子化的图书。[1]国内电子书,指中国国内出版制作的中外文电子图书。从20世纪80年代初出现至今,国内电子书已拥有网络原创、UGC、数字图书馆、转载网站、专业图书搜索和图书聚合等多种商务模式。[1-2]中国图书商报社和读吧网联合发布的《2008年度中国电子图书发展趋势报告》显示,数字图书馆2006-2008三年销售收入占电子书市场总收入的比率分别是74.3%、71.4%和53.9%,是国内电子书的主要盈利模式,而数字图书馆的主要客户是图书馆等机构用户,机构市场的销售收入占比达70%以上。因此本文择其主体,从高校图书馆采购数字图书馆的实践出发,对国内电子书采购风险及对策进行分析研究。1采购风险1.1版权风险“数字版权即作者享有的以数字化方式保存、复制、发行作品的权利。”[3]这是一种习惯称法,不是法律概念。若作品以二进制形式通过光盘等物理介质出售,法律上对应的是“发行权”;若作品以信号形式通过互联网络传播,法律上对应的则是“信息网络传播权”[4]。无论数字图书馆以包库还是镜像形式出售,其收录的图书都应有数字版权。数字图书馆在高校校园IP段内是完全开放状态,师生可以免费阅读、下载里面的电子书。如果这些书没有数字版权,即使只在校园网上传播,高校图书馆也不在法律免责范围内。中国人民大学和北京交通大学等高校在2005年曾因其图书馆所购数字图书涉嫌侵权被起诉。[5]虽然最后以庭外和解而告终,但给高校图书馆敲响了警钟:电子书采购必须警惕版权问题!然而许多高校图书馆为能在短期内用较少经费解决馆藏不达标的问题,一般都是几十万册地集中采购价格低廉的电子书来充实馆藏,不仅难以确保版权,还隐藏了巨大的赔付风险——因为采购数量和赔付金额成正比,买得越多,一旦涉嫌侵权,需要赔付的金额就越大。既然数字版权如此重要,那么国内电子书商解决版权的方式能否让图书馆高枕无忧呢?国内数字图书馆中的电子书一般有两种:直接以电子版形式出版发行的原生书和把已出版发行的纸质书数字化而形成的再生书。原生书只需向著者或其委托的机构取得数字版权,版权解决方式比较简单。而目前国内数字图书馆中大部分都是扫描制作的再生书,需要取得著者和原纸书出版社的双重授权。因为出版社对原纸书拥有“版式设计的专有权”[4],即便是诸如古籍、名著等超出版权保护时效的图书也不例外,除非电子书商放弃扫描,重新设计版式,否则只获得著者授权就拿纸书扫描成电子书同样违法。电子书商处理出版社授权相对容易,因为和著者数量相比,出版社数量并不算多,可以一一洽谈合作细节,但前提是著者在与出版社签订的出版合同中已明确将作品网络传播和数字出版的使用权、及转售权和代理授权授予出版社,否则出版社只能洽谈版式设计权问题,不能商谈数字版权授权问题。[6]电子书商处理海量个人著者授权相对困难些,主要方式有:一、预留版税,先制作再授权。先扫描并预留适当比例版税,如果著者有异议,与著者商谈并取得授权;如果著者不同意,支付已使用版税并将其作品撤除。[7]该做法虽然预留了版税交由专门机构全权代理支付著者稿酬,但侵权在先的事实难以回避。二、直接取得著者授权。无论是签作品授权协议,还是签著者授权协议,一对一的授权模式需要投入巨大人力物力,成本极高,难以适应我国一年出版几十万种图书的现状。三、授权要约。著者发表版权声明,以要约方式规定公众能以何种条件、何种方式使用作品。任何个人或机构只要愿意接受该条件即可自动达成与著者的合同关系获得授权,并按照约定方式合法使用作品。该方式免除了与著者洽谈,提高了授权效率,但“理想主义色彩甚浓,其效果也可见一斑”[8]。四、拿使用权置换数字版权。以免费使用数字图书馆资源作为交换条件获取著者授权。这种置换方式可以节省巨额授权费,但对作品数量不同的著者在使用权限上却一视同仁,显得有失公平,若个别洽谈权限细节,又难以落实。五、取得出版社或版权代理机构的授权,著者授权由出版社或版权代理机构负责解决。该方式简便、省时,对新书非常有效,但对旧书效果一般。因为2001年10月27日新修订的《著作权法》才给著者增加了信息网络传播权,在这之前出版社在出版合同中不可能涉及这项权利的授权规定,虽然之后很多出版社和著者补签了信息网络传播权的授权协议,但大多数出版社仍未把这项权利纳入到出版合同中来。[9]此外,有些著者担心作品数字化后的保密问题,并不愿意签数字出版授权协议。至于版权代理机构授权,以中国文学作品著作权集体管理组织为例,其成立后虽然对版权实行了集体管理,但注册作者数量有限,授权规模非常有限。因此2001年之前的电子书在数字图书馆中并不占少数,但其数字版权解决却并不彻底。综上可见,国内电子书制作商处理版权的方式存在隐患,高校图书馆在采购时必须谨慎应对。1.2质量风险1.2.1追求数量扩张谁的电子书数量大、价格低,谁就能迎合买方口味、控制市场。为迅速占领市场、谋取利润,国内电子书商不惜一切代价追求数量扩张。一、拆书制作扩充数量。原本不是多卷书的图书,人为在原书名后增添“上、中、下”,或“1、2、3”来进行差异标识,造成多条记录的ISBN、作者和出版社相同,但书名却不完全相同:既有原书名,又有在原书名后增加了“(上)”、“(一)”、“1”等标识的一批书名。将同一本书分成几本制作甚至多次拆分,例如:先按上下册分,再按1、2、3册分,数量一下就多了五条。造成无论用“书名+ISBN完全匹配”还是用“书名完全匹配”查重,都无法剔除同一本书的重复数据。而如果用“ISBN完全匹配”查重,又担心将真正的多卷书剔除掉。二、内容选择上没有原则。制作电子书应该考虑图书本身的价值,例如像手册、丛书、工具书,百科全书等有多年使用意义的书才有制作成电子书的必要。而当前国内电子书商为迅速扩充数量,有的甚至把电话号码本、广告、宣传册等毫无制作价值的印刷品也拿来充数。三、精减流程加速制作,工艺粗糙。《中国数字图书馆标准规范建设》项目虽已由科技部立项并先期启动了“数字资源加工规范”等项目,但目前电子出版物的生产仍没有统一的生产标准,包括工艺标准、元数据标准、数据质量标准等。造成电子书生产质检无据可依,有的干脆省掉校对环节。常发现电子书只有封面无内容、目录树指示错误或干脆没有、没去噪点导致电子显示页面肮脏、扫描遗漏造成电子书缺页、扫描粗心造成文字显示歪斜或显示不全等。四、图片格式电子书居多。电子书格式很多,大体可以分为两类:图片格式和文本格式。图片格式电子书的文字需要OCR技术转换成文本格式才能利用,检索手段不强,文件占用空间大,显示和传输速度慢,服务器负荷重,网络易拥挤,阅读和使用效果差,但原文准确率达100%,制作只需扫描即可,制作时间短、成本低。文本格式电子书的文字可以直接拷贝,深度检索,清晰度高,文件占用空间小,服务器负荷轻,网络传输速度快,但制作需要人工录入校对,难免出现与原书的误差,而且制作时间长、成本高。目前国内数字图书馆主要以图片格式电子书为主,其中一重要原因是用扫描方式制作电子书可以大大节省制作时间和成本,达到迅速扩张数量的目的。1.2.2书目不规范由于没有著录标准和监查机制,电子书商的书目存在各种问题。一、ISBN字段数位不足或过长、混有汉字或标点等非数字符号、甚至干脆缺失(ISBN出现之前的早期图书除外)。二、分类混乱。各公司都有各自的一套分类标注方法,采购人员无法根据书目中的分类标识判断电子书类别,只有等安装好以后,在数字图书馆主页上才看得到图书聚类。即使都按中图法分类,电子书分错类的现象依然普遍,例如,将计算机类书分成文学类等等,因此为防止误剔,采购人员一般不能按类别剔除书目记录。三、信息错误或不完整。电子书目录是技术筛查和采编选购的依据。用不准确的书目查重,得到的结果势必不准确;看错误的书目选购,采购人员势必会误选。笔者就曾遇到过书目标明是1999年,实际为80年代的书。四、重复著录。之前提到的拆书现象造成看似一批不重复的书目实际都是一本书。1.2.3存储格式不统一国内电子书存储格式有SEP、CEB、PDF、CHM、EXE、TXT、PDG、JAR等二十余种,由于没有行业通用标准和格式,导致各制作商都推出自有标准,使用自家特定格式,如:超星是PDG格式,书生是SEP格式、方正是CEB格式……加上电子书版权解决不规范,造成同一纸质图书可能被不同制作商数字化成不同格式的电子书的情况非常普遍。图书馆如果购买多家数字图书馆,必须对其各自收录的不同格式的电子书进行对比剔重,否则重复购买率很高。1.3使用风险1.3.1检索阅读不便捷首先,检索平台无法相通。各数字图书馆都有自己的检索平台,且相互之间没有异构查询通道,不利于内容的交换和整合,无法进行“一站式统一检索”。造成读者在查询时,必须一个一个平台地查询,极其不便捷。其次,阅读软件无法兼容。之前提到各公司的电子书都是本公司特有格式,造成读者必须下载该公司的特定阅读软件才能阅读该公司的电子书,电脑里常常安装了好几个阅读软件,增加了读者阅读的繁琐性。1.3.2数据库功能性不强与一些优秀的国外数据库相比,国内数字图书馆的功能性差了很多。检索一般只有书名、作者、年代检索,少数有ISBN、出版社检索。高级检索也只能在几个字段间操作,一般都没有布尔语句检索框。有些电子书只有上下页按钮,没有页码定位,翻页不方便。个性化功能也比较落后,虽然可以申请个人帐号,但没有检索式收藏及订制、RSS推送等功能。由于没有进行编目纳入到图书馆馆藏系统中,很难与纸质馆藏互通有无。虽然可以在纸质检索系统中增设查询电子图书的通道,但无法做到唯一指向性,往往按书名一链接过去,出现一大堆和该纸书书名相近的电子图书书名列表。1.3.3恶意下载互联网的开放性、易复制性和易传播性使电子书的知识产权受到挑战,这也是出版