BIBEXCEL简单使用教程

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

BIBEXCEL简介福州大学情报学目录Content1工作界面2概述3数据准备4Pajek可视化发展简史Bibexcel是瑞典于默奥大学(UmeaUniversity)信息研究小组(TheInformationResearchGroup,Inforsk)欧莱·皮尔逊教授设计开发的一款软件。Bibexcel的设计宗旨是辅助用户分析书目数据,或者格式相近的自然语言文本,最终产生的数据可导出至Excel或其他采用【Tab】键隔开数据的程序中。主要用于文献计量分析,并可为Pajek、NetDraw软件提供绘图所用数据1概述主要特点Bibexcel是一款供学术非营利使用的免费软件,其主要特点是小巧实用、功能丰富。运行环境Bibexcel.exe软件可以从Bibexcel官方网站(网址:.se/inforsk)上进行下载。其帮助文档bibexcel.hlp和bibexcel.cnt也可以在该官方网站上进行下载。在Windows运行环境中,将下载后的EXE到任意目录下,双击即可运行。在安装过程中,如果提示需要安装附加内容,可按照提示在网上下载。主要功能Bibexcel软件主要功能包括文献计量、引文分析、书目耦合、聚类分析,为Pajek、NetDraw软件提供书目数据等。下载崔雷的博客工作界面文件位置栏划分方法栏状态栏列表框栏频数分布栏标签栏界面左上部分显示了文件名称和路径,默认的路径是bibexcel.exe程序所在的目录。选中某个文件,单击下方的Viewwholefile按钮,就会在界面右下部分显示文件内容。文件夹文件文件内容划分方法栏•CR表示参考文献•Any表示按;(分号)划分整个字段•JN-表示期刊•Blank表示按空格划分整个字段•Whole表示不进行具体的划分,整个字段是一个整体单元。频数分布栏•后面进行某一字段的具体分析时会用到这个部分•Sort表示降序排列•Remove表示去重•Make表示输出一个新的gut文件•Fractionalize表示用频率表示具体划分为很多字段,如所有字段、被引文献字段、被引作者字段、被引年字段、被引期刊字段等标签栏•后面产生具体某一字段的out文件时会用到这个部分,也可以在转换文件格式时产生的doc文件中查看所有的标签,如TI、AU、GD等等。•其中常用的标签有:•[TI]表示标题,•[AU]表示作者,•[CD]表示参考文献,•[DE]表示关键词。文件编辑doc文件编辑out文件增加数据类分析杂项图谱帮助BibexceJ有8个菜单File菜单-文件复制文件重命名删除文件新建目录删除目录某个文件合并到另一文件将所有被选择的文件合并到另一文件将列表保存到文件退出Editdocfile菜单-编辑doc文件生成新记录删除字段识别重复记录删除重复记录删除指定文字重命名字段标签将换行符替换成回车符从doc文件中选择文档号从out文件中选择文档号Editdoc-files菜单转换大小写创建多个out文件[压缩out文件(每字段一行)]转换以逗号分隔格式的地址压缩out文件压缩独立的空out文件删除低频项删除高频项从引文中抽取出版年给字符串编号增加分号保留0-9及A-Z的字符保留作者首字母保留前n个字符Levenshtein距离计算只列出out文件中的实词等Adddataclassify菜单给out文件添加分类一精确匹配给out文件添加分类一子字符串匹配给out文件添加分类一子字符串匹配给词频对文件添加分类利用Levenshtein距离添加分类为词频—文档号-文档号添加标签为文档号—文档号对添加标签二进制查找合并两个文件比较相似字符串将简写形式的期刊名与其全名进行匹配将简写形式的单词与其全名进行匹配在字符串中查找某个代码词在字符串中查找某个字符串在列表中查找某个单词Analyze菜单增加频次共现分析doc文件中的引用doc文件及单元格矩阵h指数成对单元格使用MDS生成矩阵生成包括零词对的词对列表从词对列表中选择词对选择最强联系共享单位/耦合每记录的单位词对的滞后年等Misc菜单-杂项转换格式解压csvall格式为Diva原始数据解压标签格式数据为Diva原始数据按ISSN号进行SherpaRomeo检索按期刊名称进行SherpaRomeo检索Mapping菜单生成net文件生成vec文件生成clu文件从net文件中生成vel文件合并net文件生成地理图谱Help菜单Help菜单可以调出Bibexcel的帮助文件帮助文件只有在—Windows7以下版本的机器上才能打开数据准备“共词分析法”属于内容分析法的一种,主要统计一组词中两两同时出现于一篇文献的次数,以这种“共现”次数反映这些词之间的关联程度,两个词的“共词强度”(指两个词同时出现于一篇论文中的次数)越高,则这两个词之间的关联越紧密。操作流程数据转换(.txt→.txt2→.doc)字段抽取(.doc→.out)共现分析(作者、关键词).coc→.ccc→.ma2可视化图谱Pajek、NetDraw1数据准备wos•Notexpress等文献管理软件•导出NE:导出题录(RIS格式)•AU、DE等,不能分析参考咨询CD字段1数据准备cnki2数据转换-转换tx2文件操作中如无说明,弹出对话框一律选确定或是2数据转换-转换doc文件.doc是Bibexcel可处理的格式•创建OUT文件是我们使用Bibexcel软件进行文献计量学分析的第一步。当我们创建OUT文件时,我们首先需要确定使用书目记录中的哪一个字段来创建OUT文件,也就是选择将要分析的字段(标识符)•第一步在文件管理系统中选择DOC文件;•第二步在“Oldtag”文本框中键入字段标识符,如AU、DE等。•第三步在“Selectfieldtobeanalysed”下拉框中,选择识别字段内容的操作,如“Any;separatedfield”等。•第四步点击“prep”按钮。就完成了OUT文件的创建。3字段提取-.doc→.out3字段提取-作者字段提取AU、TI、DE等字段以;隔开点击第一列文章编号第二列作者名3字段提取-参考文献字段提取重命名重命名3字段提取-标题字段提取空格切分后的标题词空格划分•第一步在文件管理系统中选择OUT文件。•第二步在“SelecttypeofUnit”下拉框中,选择计数单位,如“wholestrings”。•第三步在下方的多选框中,选择排序方式,如选择“Sortdescending”,即按降序排列。•第四步在下方的多选框中,选择计算方法,默认的计算方法是“wholecounts”,可以改变为“fractionalcounts”。•第五步点击“Start”按钮。将会生成*.cit文件。4共现分析-.out→.cit(频率计算)4共现分析-提取字段按降序排列选wholestrings并将序排列降序排列的作者数字是文章数量频数分布栏:分析作者共现,选择“Author”分析关键词共现,选择“wholestrings”分析机构共现,“wholestrings”分析被引期刊共现,“wholestrings”分析参考文献共现,“Citereference”•共现:两个或者两个以上标目在同一个字段中出现•第一步在“Selectfilehere”中选中cit文件,点击“Viewfile”按钮,在TheList中显示cit文件的内容。•第二步从cit文件列表中标记将要分析的单元,然后从菜单条中选择Analyze--Co-occurrence--Selectunitsvialistbox•第三步在“Selectfilehere”标记OUT文件。注意:不要在TheList中显示OUT文件。•第四步从菜单中选择Analyze--Co-occurrence--Makepairsvialistbox4标题词共现分析-.cit→.coc选频次10次以上共现标题词按频次降序排列生成coc文件4作者共现COC文件5共现矩阵构建-.coc→.ccc数字代表该词在.coc文件中出现的次数生成ccc文件5共现矩阵构建-.ccc→.ma2选中*.coc打开*.ccc5共现矩阵构建-.ccc→.ma2标题词共现的三角矩阵,可粘贴至EXCEL继续可视化5作者共现全矩阵•创建供pajek软件使用的文件•文件有三种类型:net、vec和clu6导出数据•创建net文件•第一步选择*.coc文件。•第二步从菜单条中选择Mapping--Createnet-fileforpajek...6导出数据6导出数据.net6导出数据•创建vec文件•第一步选择*.cit文件。•第二步从菜单条中选择Mapping--Createvec-file6导出数据.vecPajek可视化4Pajek可视化4Pajek可视化4示例总结•txt文件:从Wos中导出的数据文件;•tx2文件:转换txt文件格式第一步生成的文件;•doc文件:生成的Bibexcel可处理的文件格式;•out文件:抽取只包含需要分析的记录所生成的的文件;•oux文件:对out文件中记录去重后产生的新的文件;•cit文件:对out或oux文件内容按频数或者频率次序排列的文件;•coc文件:统计需要分析的记录共现次数生成的文件;•ccc文件:统计coc文件中需要分析的记录出现的次数生成的文件;•ma2文件:生成的需要分析的记录的共现矩阵文件。感谢聆听汇报人:周婷

1 / 55
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功