2001-2010年国内情报学研究回顾与展望*——基于知识图谱的当代学科发展动向研究宗乾进/袁勤俭/沈洪洲/舒小昀2012-9-2110:16:47来源:《情报资料工作》2012年01期【英文标题】ReviewofInformationScienceResearchinChinafrom2001to2010andProspectsforFutureResearch:AStudyofContemporaryTrendsintheKnowledgeMapping-basedDiscipline【作者简介】宗乾进,男,1982年生,南京大学信息管理学院博士研究生,江苏210093;袁勤俭,南京大学信息管理学院教授,博士生导师,江苏210093;沈洪洲,南京大学信息管理学院博士研究生,江苏210093;舒小昀,南京大学历史学系教授,硕士生导师,江苏210093【内容提要】文章基于CSSCI数据库,利用Netdraw、Citespace和VOSviewer,分别来构建2001-2010年中国情报学研究主题演变(含热点、前沿)、知识来源谱系、机构合作网络的可视化知识图谱,对近十年我国情报学的研究热点、研究前沿领域、知识基础、研究机构间合作情况进行了归纳和分析。ThispaperusesNetDraw,CitespaceandVOSviewertoanalyzetheresearchpapersofinformationscienceinCSSCI,anddisplaystheevolutionofresearch,knowledgesources,andcooperationofinstitutionsinrecent10yearsbymappingknowledgedomains,andanalyzestheresearchfocuses,theresearchfrontiers,theknowledgesourcesandthesituationofthecooperationofinstitutions.【关键词】情报学/信息计量/知识图谱/社会网络分析/VOSviewer/研究热点informationscience/informetrics/mappingknowledgedomains/socialnetworkanalysis/VOSviewer/researchfocus1、引言科学研究所取得的成果,除了能被直接应用于生活与生产实践之外,还以文献的形式被记录下来供后人使用。文献作为知识的载体,在人类文明不断向前发展的过程中,起到了巨大的推动作用。文献计量学自诞生以来,其所提供的相关理论与方法,为挖掘文献信息,发现文献中所包含的各类知识提供了可能。特别是近年来信息技术的飞速发展,信息可视化技术为传统文献计量学提供了新的活力与发展动力。然而,当前文献信息计量可视化工具多为国外机构(人员)开发,在中文数据处理等方面存在诸多问题。这一问题在很大程度上影响到了国内学者对中文文献信息的利用,缺乏对文献信息的深度挖掘。本研究利用自编程序对文献信息进行预处理,然后结合NetDraw、Citespace、VOSviewer等软件,基于CSSCI中2001-2010年间的情报学研究文献,从近十年情报学研究热点的主题演化、知识来源、机构合作网络三个方面,展示国内情报学十年来的研究全景。2、相关理论与方法2.1社会网络分析80多年来,经过社会学、统计学等领域几代学者的努力,社会网络分析已经成为一种比较成熟的社会科学研究范式。社会网络分析中,用节点来表示行动者,节点与节点之问的连线则代表行动者之间的关系,可以表示为:G=(N,E,W)(1)其中,,为节点的有限非空集合;E={(i,j)|i∈N,j∈N},是边(有向边或无向边)的集合;W为边集权重。时至今日,社会网络分析方法已经被广泛应用于各研究领域,相关的社会网络分析工具亦应运而生。NetDraw[1]是当前社会网络分析中应用较为广泛的绘图工具,本研究拟采用该软件来构建近十年情报学研究热点演变图谱。2.2知识图谱知识图谱以科学知识为研究对象,综合应用了数学、可视化等理论与方法,并与文献计量学、科学计量学相结合,以可视化图谱的形式来展示学科研究的总体图景、亲缘关系和演化历程等,为把握学科发展动态、选择研究方向提供帮助。用于知识图谱分析的工具软件很多,每款工具软件也是各具特色。Citespace[2]在引文可视化等方面提供了较强的分析功能。VOSviewer[3]是由荷兰莱顿大学科研人员开发的一款免费软件,它在图谱展现等方面有其独特优势,被广泛应用于各类“共现”分析。本文采用Citespace和VOSviewer来分别构建情报学机构合作和知识来源图谱。3、情报学研究知识图谱核心期刊被认为是学科研究的重要期刊,具有载文质量高、权威性、前瞻性等特点。本文以南京大学CSSCI作为数据来源。检索表达式为:LY01,LY02,LY03,LY04,LY05,LY06,LY07,LY08,LY09,LY10,:XW=120502$,一共获取8290篇记录,并利用自编程序对文献信息进行预处理,以便绘制主题演化等知识图谱。3.1情报学研究热点主题演化图谱关键词是对文献主题和内容的浓缩,是文献的精髓所在,通过共词分析,能够把握学科研究热点与前沿。通过对关键词进行统计,共得到关键词33460个,去重之后得到13610个关键词。其中频次2次及以上的占比24.2%,只出现1次的占75.8%。学科研究的主题演化主要是基于纵向时间维度来展开的。本研究在构建“年份—关键词”演化图谱基础上,分析情报学研究热点演化路径、热点研究领域、重点研究领域以及前沿领域。对原始文献信息进行处理,将其导入Netdraw,生成“年份—关键词”图谱,如图1所示。图1中,大的圆环为年份、小的圆环为关键词;圆环与圆环之间的连线表明圆环之间曾经共现过,本研究中则表示某年份出现了某研究主题;连线的粗细与共现频次成正比,连线越粗,共现频次越高,具体到本研究中则表示某年份中关注某主题越多;连线的密集度与关键词的数量成正比,如连线越密集,则在本研究中表示某年份关注的主题领域越多。为了方便理解,本研究对图谱进行了标注,其标注规则如下:以K开头来命名的虚线框表示为主题域,K后的数字与年份对应,如K5-6表示2005-2006年间的研究主题域;本文以关键词分布以及连线等情况对近十年进行了划分,以Y开头命名的虚线框标示为时间区间;以A开头来命名的虚线框是主题域,表示2001-2010年期间均关注的主题。本文认为:除2010年,近3年来的研究主题是本学科研究的热点领域;近10年以来一直关注的主题则是本学科研究的重点领域,也是热点领域;2010年的研究主题则可以看做是本学科研究的前沿领域。本文将按以下思路对情报学研究主题演化进行分析:以时间为主线,对Y1、Y2、Y3(研究热点领域)、Y4(研究前沿领域),最后对重点领域(A主题域)进行分析。(1)Y1时间域Y1时间域的起止年为2001-2004年。由图1可见,其研究主题集中在K1、K2、K1-4。从上述3个主题域中,可以看出这一时间区间的显著特点之一是情报学开始关注现代信息技术与网络技术的发展,并将它们引入情报学研究中。1987年,钱天白教授发出了中国第一封电子邮件,由此拉开了中国互联网发展的序幕。中国互联网开始普及与应用始于新世纪初的2000年、2001年。这两年,我国相继出台了一系列与信息、互联网相关的政策法规,大大促进了互联网的发展。信息与网络技术也开始进入情报学研究领域,这或许是我国情报学研究在2002年和2003年中涌现出大量信息(网络)技术相关研究领域的直接原因。K1主题域中的信息化、信息产业等,K2主题域中的信息安全、信息等,以及K1-4领域中的Internet(互联网)、web等,这些与信息技术,特别是与互联网密切相关的研究领域开始得到广泛关注。此外,2001-2004年间,检索(K1-4主题域)是继信息技术与互联网之后的又一大研究领域。除了传统的文献检索之外,检索这一研究领域在2001-2004年期间大多是基于信息技术。有关检索系统的研究也开始得到关注,SCI、全文检索、全文数据库等是较为热门的研究主题。信息检索的理论研究(检索语音、自然语言、检索模型等)和应用研究(全文检索、检索策略、检索方法、情报检索、图像检索等)在这一时期得到了普遍关注,为日后信息检索研究奠定了强有力的基础。(2)Y2时间域Y2时间域的起止年为2005-2006年,这一时间区间的研究关注点主要集中在网络信息和语义本体两大研究领域。网络信息相关的研究领域在图1中为K5区域。由图可见,这一区域中的研究主题多与网络有着极为密切的联系,也可以看做是Y1时间段中研究热点的延续。其中网络信息检索、网络信息(资源),特别是网络信息资源这一研究领域直到今天依然方兴未艾,一直是情报学研究的焦点所在。K5主题域中,另一个与网络相关的重要领域是网络(信息)计量学。在网络与信息技术这一新环境下,情报学传统研究领域的文献计量学并没有停止发展的脚步,而是派生出信息计量学、网络计量学等,从而进一步拓展了情报学研究的深度与广度。K5-6中聚集了大量语义本体的研究,可见2005-2006年间,语义本体是最为热门的研究领域之一。本体论、语义网以及与之相关的技术,如xml、信息可视化等,均在这一时间区间内得到了广泛关注。语义检索、本体映射、OWL、本体构建、语义相似(关)度、跨语言信息检索等一直是研究关注的热点。(3)Y3时间域Y3时间域的起止年为2007-2009年,其主题集中在K7、K8、K9-1、K9-2。这4个主题域构成了我国情报学研究热点,具体来说集中在社会(人际)网络、企业(技术)竞争情报、文本挖掘(分类)、信息抽取、信息资源与信息服务、图书馆等方面。社会网络理论及方法在近年被引入情报学研究,2.1小节已做介绍,不再赘述;技术竞争情报与企业竞争情报是企业技术创新活动不可或缺的重要组成部分,对提升企业竞争力有重大影响,这一点已经得到了学术界和企业界的认同;文本挖掘是从非结构化文本信息中获取用户感兴趣或者有用的模式的过程,与之相关的文本分类、信息抽取等研究领域一直是情报学研究的热点;信息资源与信息服务向来是情报学研究关注的重点,与之相关的信息资源共享、个性化信息服务等值得关注;情报学与图书馆学之间长久以来具有不可割裂的联系,K9-1很好地印证了这一点,开放存取、开源软件等是较为热门的研究主题。(4)Y4时间域Y4时间域为2010年,其研究主题是情报学研究的前沿领域,与之对应的是K7-10、K10。可以将K10细化为产业竞争情报、研究方法、知识转移与共享、评价等研究前沿。产业竞争情报从产业全局的角度出发,通过对不同国家、地区间的相同或相似产业所处的产业竞争环境的实时监测,及其对影响该产业领域发展的相关情报要素进行搜集、整理、加工、分析,在此基础上制定出相应的产业竞争战略,从而最终为该国或地区整体产业竞争力的提升而服务[4]。入世以来,我国市场进一步开放,企业竞争开始逐渐走向全球化,产业竞争情报如何更好地服务企业与社会,依然需要各界人士的共同努力,其相关研究仍需进一步深入。K7-10、K10中包含多个与研究方法相关的主题词,如定量分析、共词分析、实证研究、科学计量学、社会网络分析、聚类分析等。可见我国情报学研究越来越注重方法的科学性与前沿性,特别是定量研究与实证研究已经得到重视。研究方法的科学性与创新性,无疑能够促进学科与研究的发展,因此,相关研究方法的掌握与应用值得研究人员关注与学习。知识共享是知识管理中的核心环节,能够将个体知识扩散到组织内外的各个层面,扩大知识利用价值;而知识转移中,隐性知识转移最为隐晦但又最为重要,知识转移的成功与否很大程度上取决于隐性知识转移效率的高低[5]。如何促进知识共享与转移,仍然是一个需要学者继续研究的领域。近年来,评价研究得到关注。2005年,美国J.E.Hirsch教授提出h指数,目前已广泛应用于学术评价领域中,如期刊