北京大学机构知识库建设构想2010年12月16日上海〃复旦大学要点•机构知识库概述•国内外机构知识库现状•北京大学机构知识库建设方案•实施构想机构知识库概述•机构知识库的由来–起源于“草根”,最初由学者将成果发表在个人或系部或专业的网站上,以加快学术交流和增加学术影响力。很快由于其生命力而得到重视并快速发展。–纸质资源价格上涨及商业出版的版权限制和时效性差引起学术交流不畅。–研究人员对科研资源需求迫切,开放获取运动兴起,要求免费共享学术资源。–计算机、网络、数字化技术发展,数字化学术资源的集中保存、有效管理、便于检索和传播使用成为重要问题。–机构知识库有固定的实体和资源,从技术和组织上能够解决上述问题。•机构知识库的定义–机构知识库又称为机构仓储、机构典藏库等,英文为InstitutionalRepository,简称IR。对机构知识库没有统一的定义,最经典的是RaymCrow和CliffordA.Lynch分别从资源和服务角度的定义。–资源角度:机构知识库是学术机构为捕获并保存本机构的智力成果而建立的数字资源仓库(RaymCrow,2002)。–服务角度:机构知识库是数字时代学术研究的基础设施,一个大学的机构知识库是学校为师生员工所提供的一系列服务,服务的目的是用于管理和发布由本机构及其成员所创造的数字资源(CliffordA.Lynch,2003)。•机构知识库的特点–机构性:基于一个大学或研究机构所界定的知识库(有别于学科知识库)。–综合性:资源类型和数量多,全面系统反映机构的教学和科研成果。–学术性:只进行学术资源的收集、存储和发布。–动态性:可以随时修改、更新自己的最新研究。–累积性:研究成果的发布和保存具有累积性和长期性。–网络性:资源的收集、保存、管理以及检索、利用都依托网络环境。–开放性:基本可以随时随地、不受限制进行合理利用。–互操作性:可与网络上其他知识系统集成,方便学术资源的搜索利用。•机构知识库对于大学或研究机构的意义:–对机构内学术产品进行统一分类、标引、加工、存储、检索和利用,进行全面长期地集中管理和保存。–促进学术活动的交流与沟通,提高科学研究效率及科研成果的应用效率。–分析和评价机构的研究方向、过程、趋势和结果,实现对科研人员的科研业绩管理,便于学校从宏观上把握和管理教学研究活动。–提升机构的学术地位和价值,吸引更多的研究基金和师源、生源。•机构知识库对于研究者的意义:–增加个人研究成果可见性,提高学术影响和论文被引用率。快速传递研究成果,进行学术交流和知识共享。–知识资源集中管理,永久保存提交的研究成果。通过固定的URLs避免对工作的无效链接。–便于个人成果的积累、评价、申报奖项和学术年谱编撰国内外机构知识库现状国外对于IR的研究和建设始于20世纪末,近年来一直处于线性增长趋势根据OPENDOAR的统计结果(截止2010年6月21日),世界范围内在此网站上注册的机构知识库数量已达1375个洲或地区欧洲北美洲亚洲澳大利西亚南美洲非洲加勒比海地区中美洲数量(个)67731520275613744百分比49%23%15%5%4%3%0%0%大学建立49728517369483244百分比73%90%86%92%79%86%100%100%从国别来进行分析,拥有机构知识库数量前八位的国家分别是美国、英国、德国、日本、澳大利亚、西班牙、意大利、加拿大。我国大陆及港澳台地区在该网站上注册的机构知识库数量有42个,其中台湾有34个。国家美国英国德国日本澳大利亚西班牙意大利加拿大其他数量(个)2631271267761514745578百分比19%9%9%6%4%4%3%3%42%哈佛大学、麻省理工大学、剑桥大学等世界一流高校以及香港大学、香港科技大学、台湾大学、清华大学、厦门大学、中国农业大学、中国人民大学和中国科学院部分机构等都已经建立了机构知识库,将研究者的智力成果进行集中保存,供分享、交流、参考利用,促进了跨院系、跨学科的合作。从内容来看,收录期刊文章的机构知识库最多,占机构知识库总数的65%,学位论文次之,占58%,未出版报告和工作论文都占40%。OpenDOAR网站收录1375个机构知识库,涉及到29个学科。其中多学科机构知识库有957个占机构知识库总数的69%。学科数量学科数量学科数量多学科957生物/生物化学38机械工程/材料23健康/医学79生态学/环境科学36农业/食品/兽医22自然科学75人文科学34化学/化工22工程技术67地理/区域研究34语言文学20计算机/信息技术61物理学/天文学33电学/电工19商业/经济60哲学/宗教30地球科学18历史/考古55教育学30心理学13社会科学51数学/统计学29建筑学9法律/政治40表演艺术29土木工程9图书馆/信息科学40经营/管理25在平台软件方面,使用最多的是DSpace和Eprints,数量和占机构知识库的比例分别为535,39%和227,17%DSpaceEprints编程语言JavaPerl适用操作系统UNIX/MacOSX/WindowsUNIX/GNU/Linux/Solaris数据库PostgreSQL/OracleMySQLWeb服务器ApacheApache客户端任意浏览器Netscape、Mozilla、IE、Lynx用户管理有,支持自动注册脚本、系统指派密码、密码遗忘功能。有,支持自动注册脚本,无系统指派密码功能,有密码遗忘功能数据组织方式Dspace系统=社区(对应于大学或其他研究机构内部的实验室、研究中心或院系)。Eprints=Eprint(对应系统内的一条记录,它由一些文档和元数据组成)。内容管理支持所有格式文件上传下载支持所有格式文件上传下载元数据限定的Dublin核心元数据Dublin核心元数据用户界面允许修改允许修改全文检索是否浏览功能支持按社群、作者、题目、出版日期、主题等分类浏览支持按作者、题目、出版日期、主题等分类浏览搜索结果分类不支持支持数据的保存制定数字保存战略、支持元数据的保存没有制定数字保存战略,不支持元数据的保存系统支持提供系统指南,程序缺陷追踪提供系统指南综述三个界面,分别服务于资源提交者、查找信息的终端用户和系统管理员,具有很强的灵活性和可定制性。支持以学术团体为基础的内容管理政策与资料提交过程,可以改编系统。自动完成提交资源的完整性检验,并备有缓冲区,使提交的资源在正式进入知识库前受到编辑的检验。机构库的三层架构北京大学机构知识库建设方案•作为百年名校,长期以来各类学术科研成果斐然,除了正式发表和出版的论著外,还有大量的科技报告、工作报告、科学数据、多媒体资料、科研项目申报材料、博士后出站报告、学生毕业论文等各种极具学术科研价值的灰色文献,但这些科研成果大多分散在科研人员个人手中,没有得到广泛的利用和共享•科研管理部门(如科研部、社科部)每年有学术成果统计,积累了很多资料,但以项目申报为主,不够完整齐全。北京大学数字图书馆经过十余年的建设,已经取得了丰硕的成果。累计完成数字化采集和加工的资源有:学位论文近3万种北大讲座/学术会议1600多种(3000多小时)北大名师资料233人(含文献5600种、照片4200幅、多媒体资料8种)总体目标•以北京大学各种类型的学术成果资源为收录对象,通过图书馆、科研部、社科部、信息办、研究生院等各相关部门通力合作,建立一个基于全校学科体系的、完整、统一、权威、开放存取的学术资源网络平台,为校内外用户提供多层次的丰富的服务。具体建设目标成为北京大学学术资源收集、展示、共享、管理和保存的平台,全面揭示北大的学术成果资源,促进北大科研成果的传播与交流。成为师生科研成果管理的空间,发布、保存、管理、维护个人的学术成果资源,获得图书馆提供的文献收录与引用、课题咨询和科技查新、馆际互借与文献传递、实时咨询等各项服务。开展学术竞争力和发展趋势分析服务,对北大的重点学科、专业、以及科研人员的学术影响力进行统计和分析,提交科研发展态势监测报告和学科竞争力报告,为校领导和科研管理部门决策提供及时而全面的科研成果评价信息。为图书馆馆藏资源建设提供支持数据。根据北大科研成果情况分析文献资源保障率,以便更加有针对性地加强馆藏建设。建设内容资源收集按照学科/院系/研究机构为单位进行分类收集和管理校史上学术大师的学术资料在校教职员工的科研成果交流学者在北大工作期间的科研成果北大科研人员与校外人员合作的科研成果优秀博硕士研究生的研究报告资源类型北京大学学术会议论文北京大学博硕士学位论文北京大学预印本和未出版报告北京大学博士后出站报告北京大学科研数据北京大学工作报告北京大学程序和软件北京大学老教授口述史北京大学精品课程北大讲座北京大学科研人员正式出版的期刊和图书……服务提供集成学校综合服务平台的认证系统控制用户使用权限以院系/研究机构、学科等组织浏览检索方式进行成果查询应用web2.0的理念和技术进行成果利用与多种学术评价数据库及图书馆的咨询服务集成运行维护管理机制:建立学校各部门、院系/研究机构、科研人员的层级式管理体系。政策机制:由学校相关部门制定北京大学知识库成果提交政策。激励机制:制定北京大学知识库的评估体系,采用一定的奖励制度鼓励科研人员贡献和共享成果。宣传机制:由图书馆联系部分科研人员做试点推广,帮助他们将研究成果通过北京大学知识库发布;主动向师生宣传北京大学知识库,例如编印宣传小册子、定期发送电子邮件等,宣传知识库的意义与作用。版权政策:对期刊、图书根据出版商政策提供不同版本的全文或链接服务;对未出版物等灰色文献,签订著作权声明和版权许可协议,推进创作共用协议的使用,鼓励科研人员在最大范围内公开学术成果的全文或详细内容。系统结构实施构想继续已有的数字资源采集工作充分利用国内外数据库广泛查找所发表的成果以个案和实例推动领导决策从个别院系开始突破,取得成绩全面推广•Webelievethatinstitutionalrepositoriesareapractical,cost-effective,andstrategicmeansforinstitutionstobuildpartnershipswiththeirfacultytoadvancescholarlycommunication.——RichardK.JohnsonEnterpriseDirector,SPARC.D-LibMagazine,November2002•我们确信,对于学术机构来说,机构知识库是建立与教学研究人员的合作、促进学术交流的切实可行的、高费效比的和战略性的途径。