11机构知识库的发展现状及其分析陈亚宁(台湾)中研院计算中心2007年4月5日2发言提纲‧缘起背景‧定义‧类型‧查阅以及访问途径‧建设方案‧发展现状‧核心问题‧建设程序‧相关問題‧应用情况‧个案研究‧其他与总结23发展背景4数据来源:Mogge,1999,p.2335ARL图书馆服务的发展趋势,1991-2005数据来源:YoungandKyrillidou,20066数据来源:YoungandKyrillidou,2006ARL图书馆图书和期刊的订阅费用情况,1986-200547数据来源:YoungandKyrillidou,2006ARL图书馆的供需情况,1986-20058数据来源:YoungandKyrillidou,2006ARL图书馆费用支出发展趋势,1986-200559数据来源:YoungandKyrillidou,2006ARL大学图书馆学生用户人均拥有资源量,1986-200510数据来源:YoungandKyrillidou,2006购买电子资源和所有资源的费用平均年增长率对比分析表,1993-2005611期刊危机的形成因素•AnnOkerson(1989)在参与ARL期刊价格调研项目撰写的研究報告中指出:–消费问题–学术传播系统問題–经济问题•Frazier(2001)提出大型交易(thebigdeal)的概念与现象12诱发动机学术出版危机期刊价格危机/期刊危机学术交流危机信息鸿沟713开放存取的先驱•PaulGinsparg(1991)与arXive•StevenHarnad(1994)与SubversiveProposal•HaroldVarmus(1999)与E-BiomedProposal14开放存取的定义•布达佩斯宣言BOAI(2002)–金科/金色之路开放存取期刊(open-accessjournals),系学者利用相关工具创立的新型期刊,为用户提供开放、自由的信息存取服务。–玉律/绿色之路自行典藏﹙self-archiving﹚,系学者將本身发表的期刊论文存储在开放知识库/电子档案库,包括基于个人、机构与学科等三种主要类型。815重要的宣言文件•1995—SubversiveProposal•2000—TempePrinciples•2001—DeclaringIndependence•2001—OpenLetter•2001—OAI-PMH•2002—BOAIStatement•2002—BethesdaStatement•2003—PrinciplesandStrategiesfortheReformofScholarlyCommunication•2003—IFLAStatementonOpenAccesstoScholarlyLiteratureandResearchDocumentation•2003—SaboBill•2003—BerlinDeclarationonOpenAccesstoKnowledgeintheSciencesandHumanities•2003—UNWSISDeclarationofPrinciples•2004—WashingtonDCPrinciplesforFreeAccesstoScience•2004—OECD’sDeclarationonAccesstoResearchDatafromPublicFunding•2004—TheConservationCommons•2004—ScientificPublications:FreeforALL•2004—EnhancedPublicAccesstoNIHResearchInformation•2004—Library-relatedPrinciplesfortheInternationalDevelopmentAgendaoftheWorldIntellectualPropertyOrganization•2005—NIH’sPublicAccessPolicy•2005—WellcomeTrust’sopen-accessmandate•2005—ScienceCommons•2005—OpenContentAlliance•2006—Elsevier’sSponsored-Articlehybridjournalmodel16SubversiveProposalTempePrinciplesDeclaringIndependenceOpenLetterOAI-PMHBOAIStatementBethesdaStatementReformofScholarlyCommunicationSaboBillIFLAStatement规模国际级国际级年份19952000200120022003BerlinDeclarationUNWSISDeclarationofPrinciples2004DCPrinciplesOECD’sDeclarationonAccesstoResearchDatafromPublicFundingTheConservationCommonsScientificPublicationsEnhancedPublicAccesstoNIHResearchInformationLibrary-relatedPrinciplesfortheInternationalDevelopmentAgendaoftheWIPO917宣言文件的共性及其重点•出版是属于研究的必要过程之一。•保留应有的自我存档(Self-archiving)与合理使用(FairUse)等相关知识产权。•鼓励数据、信息与知识的共享。•ICT(信息和通讯技术)主要目的是用來促进知识的利用、创新与传播,而不是阻碍或控制。18定义1•Lynch,2003–大学中的机构知识库是大学为其成员提供的一套服务,用户管理和传播由各个部门及其成员创建的数字资源。–机构知识库由一系列信息技术做支撑…致力于提供知识库服务。–从本质上讲,这是机构承诺对数字资源开展的相关工作,包括数字资源的长期保存,数字资源组织和检索,以及数字资源的传播等。1019定义2•Lynch,2003–一个发展成熟的机构知识库将收录师生的智力产品-研究成果和教学资料,除此之外,同时也收录记录机构本身相关活动和重大事件的文档资料。–通过机构知识库,大学的学术成果和重要事件将以数字形式得以表现、记录和共享。大学的一项主要职责是对这些资源进行处理,一方面要使他人容易获取这些资源,另一方面也要对它们进行长期保存。–机构知识库是构建大学对世界重要贡献的一种新的渠道,同时也引起对这种关系在政策和文化层面上的重构。20定义3•Crow,2002–为重组和改善学术交流体系提供关键的组成要素—该要素将扩展对研究成果的访问、重申由研究团体掌握对研究成果的控制权,打破期刊的垄断地位,减少财政方面的压力,同时,突出支持学术机构和图书馆工作的其他相关因素。–将作为衡量大学学术质量的一个有形指标,展示其研究活动对科学、社会和经济发展的作用,进而提高其社会地位和公众价值。1121定义4•机构层面上的界定–是对学术机构的学术成果和重要事件的历史反映。–可以用作主要的质量过滤器。(Crow,2002,pp.16-17)•学术内容–可能包括学生个人电子信息、教学课件、机构年度报告、视音频资料、计算机程序、数据集、照片以及艺术作品等。–可能包括预印本和其他尚未正式出版的文章,同行评审文章、专著、教学素材、数据集和其他辅助研究资料、会议论文、电子学位论文以及灰色文献等。(Crow,2002,p.17)22定义5•累积性和永久性–不管机构知识库规定的内容提交标准是怎样的,数字资源一旦提交,就不能撤掉。–机构知识库旨在长期永久地保存数字资源并提供访问服务。(Crow,2002,pp.18-19)•开放性和互操作性.(Crow,2002,p.19)1223类型‧个人型‧机构型‧学科型‧国家型‧国际型24个人型-黃鴻珠馆长1325个人型-Dr.CarolTenopir26机构型1-DSpace1427机构型1-DSpace28机构型2-CDLeScholarship1529机构型3-GlasgowePrints30学科型1-arXiv1631学科型2-CogPrints32学科型3-ResearchIndex1733学科型4-E-LIS34学科型5-DLIST1835国家型1-ARROW36国家型2-DARE1937国家型3-FAIR38国际型-OAF2039查阅以及访问途径•OpenDOAR—开放存取知识库目录指南•ROAR—开放存取知识库登记表•Google40OpenDOAR2141ROAR42Google12243Google244Google32345建设方案•自己设计开发•利用开放源码软件机构知识库软件指南-由OSI颁布•租用商业资料库软件–ProQuestDigitalCommons–ExLibrisDigiTool开放源码软件2447482549发展现状•学术机构知识库:在13个国家的发展情况(截至2005年中)•OpenDOAR5013Nations1•机构知识库的数量:305•所占比例–有些机构有多个机构知识库.–有些机构同时也建立了针对某一特定类型文献信息的机构知识库,比如学位论文、工作文档和视音频资源。–因此,一个机构可能会拥有多个机构知识库,分别针对不同的文献类型。–有些学术研究机构(比如大学)由不同的院系组成。–有些国家在统计机构知识库数量的时候,只是统计覆盖了整个学术研究机构的知识库。265113Nations2•信息对象的数量–机构知识库收录的记录(或对象)数量从几条到几十条、甚至到几万条。–目前全世界范围的机构知识库的平均收录记录数量在几百条。–荷兰:机构知识库的平均收录记录数量是12,500.–有些收录的记录只是提供元数据,有些则提供全文,比如论文、图片和数据集。.–计量单位:十亿字节或者千兆字节。5213Nations3•信息对象的类型–类型•文章•图书•原始数据•视频资料和音乐等其他视音频资料•课件•其他–目前机构知识库收录的资源主要是文本信息资源。275313Nations4•基于信息对象类型的观察–除了澳大利亚和美国之外,目前机构知识库收录传统的学术出版物和灰色文献。–对于这些国家来说,开放存取问题应该是建设机构知识库的关键驱动力,至少在短期看来是这样的。5413Nations5•学科覆盖范围–社会科学和人文科学–生命科学–自然科学–工程学–表演艺术•利用的软件–在这些国家应用最广泛的是EPrints和DSpace.285513Nations6•参与的研究人员–从整体上来看,参与的研究人员比例仍然非常低。–荷兰:40%,德国:2%-62%–基于国家层面的研究成果产出•荷兰:25%•法国和比利时:人文科学33%,生命科学39%,自然科学16%,工程学11%–在大多数的情况下,都是由中介机构和人员,比如图书馆和图书馆员,从事这方面的存储工作的。5613Nations7•联邦和跨库服务–联邦检索(也称为:跨库检索或元检索等)–按需印刷–可以将元数据和/或全文从一个系统自动复制到另一个系统中(系统之间的数据迁移)–OAI-PMH协议和SRU/SRW/Z39.50协议295713Nations8•基于国家和机构层面的政策和组织–尽管现在颁布的国家政策为数不多,但在相当于国家层面上或由几大高等教育机构联合颁布的报告、宣言、政策的数量正在日益增多。–在部分国家(比如英国和荷兰),已经启动了全国性的大型项目,用于推