科学知识图谱方法及应用.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

工欲善其事,必先利其器第六科学知识图谱方法及应用杨思洛信息管理学院2课程考核:相关的课程论文,6月1号前交信息管理学院336办公室。包括学号、姓名、联系方式3引言对学科(领域、主题)过去、现状、前沿、热点、趋势的把握可通过什么方法手段?4引言的重要性!文献是记录有知识的一切载体文献是科学交流的主要途径与手段了解领域历史、现状热点、前沿趋势选题,寻求切入点和突破点寻求新的研究方法和有力的论证依据避免重复劳动网络环境,大数据。。。5如果说我比别人看得更远些,那是因为我站在了巨人的肩膀上。我不知道在别人看来,我是什么样的人;但在我自己看来,我不过就象是一个在海滨玩耍的小孩,为不时发现比寻常更为光滑的一块卵石或比寻常更为美丽的一片贝壳而沾沾自喜,而对于展现在我面前的浩瀚的真理的海洋,却全然没有发现——牛顿6目录1知识图谱概述234知识可视化概述知识图谱绘制方法知识图谱绘制工具5CiteSpace简介与操作6知识图谱应用案例7知识语言文字肢体其它图像1.知识可视化概述一图展春秋,一览无余;一图胜万言,一目了然——大连理工大学教授刘则渊8知识可视化实质知识可视化形式图解促进传播创新百闻不如一见、一图胜万言!纽约大学心理学专家吉米·布洛诺(JeromeBruner)在实验中发现,人们能记住10%听到的东西,30%读到的东西,但是却可以记住80%看到的东西1.知识可视化概述9101.知识可视化概述科学计算可视化(VisualizationinScientific;Computing)、数据可视化(Datavisualization)、信息可视化、知识可视化、知识域可视化。“InformationVisualization”术语是由斯图尔特•卡德、约克•麦金利和乔治•罗伯逊于1989年创造出来的;美藉华人陈超美1999年率先发表了该领域的第一部专著《信息可视化》,创办了国际期刊《Informationvisualization》。111.知识可视化概述知识可视化发展时间很短,正式起源于2004年,M.J.Eppler和R.A.Burkhard共同发表论文(knowledgeVisualization-TowardsaNewDisciplineanditsFieldsofApplication)。Eppler认为:知识可视化主要研究视觉表征的使用,主要目的是改进两人或多人间知识的创造与转移;知识可视化是指能用来构建和传递复杂观点和内容的所有图形手段和方式。121.知识可视化概述信息可视化知识可视化知识图谱可视化对象非空间数据人类的知识科学知识可视化目的从大量抽象数据中发现新的信息促进群体的知识创新和传播展示学科,促进科学发展可视化方式计算机图形图像绘制草图、知识图表、视觉隐喻多维图表、视觉隐喻交互类型人-交互人-交互人-交互131.知识可视化概述概念图知识可视化工具及其教育学习应用概念组成设计制作教育应用思维导图此外,在科研写作中也需要绘制图表,呈现知识14关于“概念图”的概念图1515子题6子题7子题5子题4子题3子题2子题1主題思考的主题思维导图:用于放射性思考1616阅读下面黑体的词汇,然后立刻闭上眼睛,持续30秒,思考它。水果17182.知识图谱概述——基本概念知识是一个内涵非常丰富的概念;知识广泛存在于社会各个领域。科学知识图谱广义上包括:生物的基因图谱、教育教学中的认知地图、探索太空的天体图、描绘地形的GIS、模拟人脑的神经网络图、各种金属图谱等。科学知识图谱是以科学知识为对象,显示学科的发展进程与结构关系的一种图形,具有“图”和“谱”的双重性质与特征。192.知识图谱概述——基本概念科学知识图谱是显示科学知识的发展进程与结构关系的一种图形以科学知识为计量研究对象,属于科学计量学范畴在以数学模型表达科学知识单元及其关系基础上进而以可视化形式绘制成二维或三维图形,即知识图谱202.知识图谱概述——基本概念①较形象、定量、客观、真实地显示学科结构、热点、演化与趋势,是学科基础研究新视角。②知识图谱可发现、描述、解释、预测和评价科学知识。③对图书情报学科具有更重要意义,也有助于信息检索、信息分类与信息服务等。耗时、费力、难以重复、较主观盲人摸象212.知识图谱概述——基本概念222.知识图谱概述——基本概念上世纪50年代,加菲尔德创制SCI,并以编年体形式手工绘制引文网络图谱;随后“文献耦合”(Kessler,1963),“科学引文网络”(Price,1965),“同被引”(Small,1973)、“共词”(Callon,1983)、“引文可视化”(White,1998)相继提出基本原理是分析知识单元(科学文献、科学家、关键词等)的相似性及测度。采用不同的方法和技术绘制不同类型的图谱。科学知识图谱232.知识图谱概述——发展历程传统的科学图谱以简单的二维、三维图形(如:柱形图、线性图、点布图、扇形图、平面图等)表示科学统计结果051015202530354045501234010203040501234系列1系列30501001502001234某学科某结构三维图文献摘要或关键词纪录比例图X论文增长趋势线型图242.知识图谱概述——发展历程1987年,美国基金会发表研究报告《科学计算中的可视》,开始长期资助科学可视化(scientificvisualization)研究1987年,著名计量学家克雷奇默创立“三维构型图谱”threedimensionalconfigurationmap之后出现“多维尺度图谱”multi-dimensionalscalingmap20世纪20、30年代英国人类学研究提出“社会网络分析图谱”socialnetwortanalysismap卡尔提出“自组织映射图谱”self-organizingmap实例:某学科期刊高频关键词共词网络2个知识群实例:某学术群体知识图谱252.知识图谱概述——发展历程PFNET算法根据经验性数据,对不同概念或实体间联系的相似性或差异程度做出评估,然后引用图论中的基本概念或原理生成特殊的网状模型1990美国心理学家斯克沃斯兹恩巴克提出“寻径网络图谱”pathfindernetworkscalingmap,PFNET将数据以及数据间关系表达成一个图,图中节点表示数据,线表示数据间关系运用较小生成树法及复杂连接删除算法,删除网络中大部分连接,保留最重要连接,最大限度简化网络262.知识图谱概述——发展历程用克林伯格跳变算法和共生词分析法和图示技术,研制主要主题和复杂趋势的发现地图印第安纳大学KetanKMane和泊尔纳提出“PNAS主题爆炸图谱”,用以发现主要主题和复杂趋势•网络中各节点代表高频词和爆炸词•节点大小代表该词达到最大爆炸水平•颜色代表词常用和达到最大爆炸水平的年代272.知识图谱概述——发展历程利用地理信息系统的可视化信息,地理地图的自然组织框架,构建隐含大量信息的可视化主题地图有维斯(J.Wise)等提出“信息地图”informationlandscape应用案例:期刊文章的数量与资助基金间的动态关系图谱282.知识图谱概述——发展趋势随计算机处理能力日益提高、文献数字化,知识图谱工具在模拟人类信息分析等方面,可帮助人类进行某些领域的判读、搜索、决策、预测……IN-SPIRE发现工具可整合交互式信息可视化与询问功能利用专利分析工具形成的专利知识图谱论文的最小生成树图谱最小生成树导航图谱293.科学知识图谱的绘制方法步骤303.1样本数据获取主要数据来源:WebofScience科学文献数据:(SCI)(SSCI)专利文献数据:德温特创新索引DII国际会议文献数据:(CPCI)另外还有Scopus,ScienceDirect,L国内数据库:CNKI、CSSCI、CSCD、万方等网络数据源:GoogleScholar、arXiv、CiteSeerX313.2样本数据清洗基于文献数据库进行知识可视化的质量、合理性和可靠性很大程度上依赖于所用数据的精确性和全面性,不准确或不全面的数据往往造成不精确甚至错误的结果。即使目前最权威、公认质量最高的WoS,也存在数据著录格式(如人名和地名的不统一)和遗漏的问题。改正字符错误,统一或增补分时段有代表性的抽取323.3选择知识单元知识单元是知识处理的基本单位:关键词、题名、作者、机构、刊名、分类号、学科等等。目前也扩展到摘要、参考文献和全文。多种结合。333.4构建知识单元关系引文分析理论与方法1、说明科学知识和情报内容的继承和利用2、标志科学的发展34耦合35文献共被引分析是计量文献之间关系的一种新方法。即2篇文献共同被1篇文献引用,这2篇文献就构成共引关系。共被引频率定义为这2篇文献一起被引用频次——马沙科娃、斯莫尔(苏联、美国)知识单元的共被引关系36CR2001,NYTIMES1226,B2*AMPSYCHASS,1994,DIAGNSTATMANMENT*DEPHLTHHUMANSE,1999,MENTHLTHREPSURGG*USBURCENS,2000,STF3ADEPCOMMBURCBLAZERDG,1994,AMJPSYCHIAT,V151,P979EATONL,2001,NYTIMES1116,A1FOTHERGILLA,1999,DISASTERS,V23,P156FULLERTONCS,1999,AVIATSPACEENVIRMD,V70,P902GINEXIEM,2000,AMJCOMMUNPSYCHOL,V28,P495GOENJIANAK,2001,AMJPSYCHIAT,V158,P788GREENBL,1990,JAPPLSOCPSYCHOL,V20,P1033HANSONRF,1995,JCONSULTCLINPSYCH,V63,P987HARVEYAG,1999,JCONSULTCLINPSYCH,V67,P985KAWACHII,2001,JURBANHEALTH,V78,P458KESSLERRC,1995,ARCHGENPSYCHIAT,V52,P1048KILPATRICKDG,1987,CRIMEDELINQUENCY,V33,P479MADAKASIRAS,1987,JNERVMENTDIS,V175,P286MAZURECM,2000,AMJPSYCHIAT,V157,P896NORTHCS,1999,JAMA-JAMMEDASSOC,V282,P755ORTEGAAN,2000,AMJPSYCHIAT,V157,P615POLEN,2001,JNERVMENTDIS,V189,P442RESNICKH,1999,JANXIETYDISORD,V13,P359RESNICKHS,1993,JCONSULTCLINPSYCH,V61,P984ROTHBAUMBO,1992,JTRAUMASTRESS,V5,P455RUBONISAV,1991,PSYCHOLBULL,V109,P384RUEFAM,2000,CULTURALDIVERSITYE,V6,P235SHAHB,1997,SUDAANUSERSMANUALSHALEVAY,1998,AMJPSYCHIAT,V155,P630SHALEVAY,2000,JCLINPSYCHIATS5,V61,P33SHERBOURNECD,1991,SOCSCIMED,V32,P705SHOREJH,1989,JNERVMENTDIS,V177,P681TUCKERP,2000,JBEHAVHEALTHSERR,V27,P406documentco-citationauthorco-citationjournalco-citationACA/DCA/JCA373.5数据分析——数据标准化为便于可视化,对简单地频次计算的单元数据,标准化常常通过数据间的相似度测量。主要有两大类:一是集合论方法(Set-theoreticmeasures),包括Cos

1 / 110
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功