如何可视化分析文献信息刘玉婷图书馆信息咨询部提纲•背景概念•理论方法•工具介绍•注意问题背景信息爆炸时间有限科学计量学理论方法信息可视化技术发展相关概念•信息可视化将抽象数据用可视的形式表示,用于知识发现、决策制定、文献信息分析等领域。•科学知识图谱(MappingKnowledgeDomain)又称知识图谱、知识地图。用数学、图形学、信息可视化技术、信息科学等学科的理论与方法与计量学引文分析、共现分析等方法结合,用可视化的图谱形象地展示学科的核心框架、发展历史、前沿领域以及整体知识架构的多学科融合的一种研究方法。信息获取知识挖掘可视化科学知识图谱科学知识历史研究热点、前沿、趋势相邻学科间关系研究人物、机构提纲•背景概念•理论方法•工具介绍•注意问题理论方法1.引文分析法2.共被引分析法3.多元统计分析方法4.词频分析法5.社会网络分析方法理论方法1.引文分析法CitationAnalysis尤金•加菲尔德EugeneGarfield引文分析方法的创立者SCI之父HistCite的发明者利用各种数学及统计学的方法和比较、归纳、抽象、概括等逻辑方法,对科学期刊、论文、著者等各种分析对象的引用与被引用现象进行分析,揭示其数量特征和内在规律的一种文献计量分析方法。——邱均平《文献计量学》青蒿素研究引文编年图理论方法2.共被引分析法co-citationAnalysis文献共被引分析是计量文献之间关系的一种新方法。即2篇文献共同被1篇文献引用,这2篇文献就构成共引关系。共被引频率定义为这2篇文献一起被引用频次——马沙科娃·斯莫尔(苏联、美国科学记录学家)citingpapercitation理论方法3.多元统计分析方法对若干相关的随机变量观测值的分析,包括:因子分析、多维尺度分析和聚类分析。这些方法将在关系矩阵上运算。如某领域文献群组的共被引矩阵。——埃格赫《信息计量学导论》国际科学学主流领域图。刘则渊,陈悦,侯海燕,等.科学知识图谱:方法与应用[M].北京:人民出版社,2008.沈建通,姚乐野.多元统计与社会网络分析法在知识图谱应用的实证研究[J].情报杂志,2009,(8).理论方法4.词频分析法齐普夫GeorgeKingsleyZipf齐普夫第一定律fr*r=C在文献中,不同词汇的使用与出现频率是有一定规律的。按词频高低进行统计以供分析——齐普夫计量学传统方法。理论方法5.社会网络分析方法SocialNeworkAnalysis将社会结构界定为一个网络,网络由成员之间的联系进行连接,社会网络分析更多地聚焦于成员之间的联系而非个体特征,并把共同体视为“个人的共同体”,即视为人们在日常和生活中所建立、维护并应用的个人关系的网络——Wetherell等提纲•背景概念•理论方法•工具介绍•注意问题工具简介HistCiteBibexcel、SATI、ThomsonDataAnalyzerCiteSpacePajekUcinetVosviewerSPSSAureka……CiteSpace美籍华人陈超美德雷塞尔(Drexel)大学信息科学与技术学院~cchen/citespace/基于JAVA的可视化文献分析软件能够显示一个学科或知识域在一定时期发展的趋势、动向及热点,形成若干研究前沿领域的演进历程。~cchen/bio.htmlCiteSpace•研究前沿(ResearchFronts)普赖斯最早提出“研究前沿”的概念,某个领域的研究前沿是由科学家积极引用的文章所体现的。大概由40~50篇最近发表的文章组成。Citespace定义研究前沿是正在兴起或突然涌现的理论趋势和新主题,代表一个研究领域的思想现状。•知识基础(IntellectiveBase)在科学文献中(即由引用研究前沿术语的科学文献所形成的演化网络)的引文和共引轨迹。CiteSpace的概念模型~cchen/citespace/CiteSpace的安装是否安装JAVA开机进入网站:~cchen/citespace/OR离线开启下载JAVA并安装否是Citespace的操作步骤•确定数据库和检索词•收集数据•提取研究前沿术语•时区分割•阈值选择•精简和合并•可视化显示•图表解读、验证downloadxx.txt格式选择数据分析年代选择数据切分年代突现词来源选择节点类型阈值调节C引文数量、CC共被引频次、CCV共被引系数三个层次设定阀值,其余的由线性内插值决定。选择数据分析年代选择数据切分年代突现词来源选择节点点类型阈值调节剪切连线1、寻径2、最小生成树3、修剪切片网4、修剪合并网可视化显示保存图谱/图像图谱背景色寻找聚类寻找最佳聚类用term标记聚类用keyword标记聚类用摘要词标记聚类图谱大小调谐年代色标按年显示频次中心性调谐term字体、节点大小调谐node字体、节点大小聚类视图时间视图时区视图调谐图谱颜色、亮度、透明度、显示速度等阿尔茨海默早期诊断研究国家提纲•背景概念•理论方法•工具简介•注意问题注意问题•安装软、硬件条件•数据清理•有些聚类效果不理想(时间视图)•图谱的判读•其他工具方法的扩展bnuliuyuting@126.com