信息资源管理实验报告信息资源管理目录1、实验目的........................................................12、实验准备........................................................13、布拉德福定律的验证..............................................13.1布拉德福定律简介...........................................13.2云计算期刊列表.............................................13.3分区......................................................33.4结果验证..................................................33.5结果解释..................................................44、洛特卡定律的验证................................................44.1洛特卡定律简介............................................44.2洛特卡分布曲线的绘制.......................................55、普赖斯定律的验证................................................75.1普赖斯定律简介...........................................75.2验证过程.................................................86、文献资源的时间分布特征..........................................86.1.指数增长律................................................86.1.1普莱斯曲线............................................76.1.2生长曲线..............................................86.2.逐渐过时规律.............................................107、齐夫定律的验证.................................................117.1齐夫定律简介.............................................117.2.齐夫定律内容.............................................117.3验证手段..................................................12信息资源管理信息资源管理11、实验目的1、检验布拉德福定律,分别采用区域、图形表示法表示,并结合主题进行解释;2、统计作者、作者单位,获取核心或高产作者以及核心机构,检验洛特卡定律和普赖斯定律;3、绘制年度发文量曲线,获取文献资源的时间分布特征;4、选择论文,通过分词软件进行分词,再画出词频分布曲线,验证zipf定律或zipf修正定律,检验论文关键词是否为高频词,并进行解释。2、实验准备选择主题:云计算选择数据库:CNKI中国知网3、布拉德福定律的验证3.1布拉德福定律简介20世纪30年代,英国著名文献信息学家布拉德福提出了有名的“布拉德福分散定律”(Bradford’slawofscattering),简称布拉德福定律或布氏定律。该定律描述了文献分散和集中的经验定律,其主要内容是:如果将科学期刊按其刊载某个学科主题的论文数量以递减顺序排列起来,就可以在所有这些期刊中区分出载文率最高的“核心”部分和包含着与核心部分同等数量论文的随后几区,这时核心区和后继各区中所含的期刊数成1:a:a2的关系(a>1)。3.2云计算期刊列表云计算序号期刊名称文献量1LECTURENOTESINCOMPUTERSCIENCE21872电脑知识与技术9683PROCEEDINGSOFTHESPIETHEINTERNATIONALSOCIETYFOROPTICALENGINEERING9524PROCEEDINGSOFSPIE8365通信世界8176APPLIEDMECHANICSANDMATERIALS8157ARXIV7188通讯世界6929FUTUREGENERATIONCOMPUTERSYSTEMSTHEINTERNATIONALJOURNAL597信息资源管理2OFESCIENCE10FUTUREGENERATIONCOMPUTERSYSTEMS59611中国新通信58212ASTRONOMYASTROPHYSICS57813中国信息化57114PROCEDIACOMPUTERSCIENCE55415INTERNATIONALCONFERENCEONCLOUDCOMPUTINGTECHNOLOGYANDSCIENCE55016COMMUNICATIONSINCOMPUTERANDINFORMATIONSCIENCE54517ASTROPHYSICALJOURNAL54218JOURNALOFGEOPHYSICALRESEARCHATMOSPHERES51819计算机光盘软件与应用50220网络安全技术与应用49521IEEEINTERNATIONALCONFERENCEONCLOUDCOMPUTING48422IEEEACCESS46523ADVANCEDMATERIALSRESEARCH43324信息与电脑43125数字技术与应用41526IEEEINTERNATIONALSYMPOSIUMONGEOSCIENCEANDREMOTESENSINGIGARSS40527信息通信39828无线互联科技38829信息系统工程38730数字通信世界37831JOURNALOFPHYSICSCONFERENCESERIES37432PROCEEDINGSOFTHESPIE36633计算机与网络35634ADVANCESININTELLIGENTSYSTEMSANDCOMPUTING34935计算机科学34836Informationweek:Themagazineforinformationsystemsmanagement34537CONCURRENCYANDCOMPUTATIONPRACTICEEXPERIENCE34338电脑迷33539电子世界33540MONTHLYNOTICESOFTHEROYALASTRONOMICALSOCIETY33241CONCURRENCYANDCOMPUTATIONPRACTICEANDEXPERIENCE32242IEEETRANSACTIONSONPARALLELANDDISTRIBUTEDSYSTEMS31743JOURNALOFSUPERCOMPUTING31544信息安全与通信保密309表1期刊列表信息资源管理33.3分区将选取的论文按其总数23545除以3,得到平均数23545÷3=7848,计算得出核心区的期刊数为7种,论文数约为7293篇;相关区期刊数为15种,论文数约为8271篇;外围区期刊数为22种,论文数约为7981篇(详见表3)。其中核心区的期刊列表如下表所示:序号期刊名称文献量1LECTURENOTESINCOMPUTERSCIENCE21872电脑知识与技术9683PROCEEDINGSOFTHESPIETHEINTERNATIONALSOCIETYFOROPTICALENGINEERING9524PROCEEDINGSOFSPIE8365通信世界8176APPLIEDMECHANICSANDMATERIALS8157ARXIV718合计7293表2核心区期刊列表3.4结果验证(1)区域表示法:分区云计算期刊数量论文数量a(核心区)77293b(相关区)158271c(外围区)227981表3“云计算”主题论文的布拉德福分布根据期刊论文列表以及分区列表可得,三个区中的期刊数量有以下比例关系n1:n2:n3=7:15:22≈1:2:4(2)图形表示法:信息资源管理43.5结果解释各学科专业文献除了密集地登载于本学科的专业期刊,即“核心期刊”外,还登载于大量本专业的边缘期刊,即“相关期刊”,以及更一般化的其他学科的期刊上。由于后两者期刊的分散,难以查找特定专业的论文。此外,二次文献在摘录某一专业论文的时候,往往注重学科影响较大的“核心类”期刊,而忽视了非核心类的相关期刊,造成大量论文的重复摘录,因此,任何学科的绝大多数专业文献都集中于少数的本专业期刊内,但同时也散布于其他的相关期刊中,这是文献离散性的体现。而文献的集中性主要是由于“马太效应”,或者说是成功产生成功的原则:一种期刊的文献量越大、质量越高,作者就越愿意将自己的文章刊登在这些期刊上,形成了一种堆加效应。但是由于核心期刊发表文章的难度较大、各期刊文章数目众多,所以核心区、相关区、外围区的期刊数量才会在统计上呈现布拉德福所阐述的那种规律4、洛特卡定律的验证4.1洛特卡定律简介洛特卡定律是由美国学者A.J.洛特卡在20世纪20年代率先提出的描述科学生产率的经验规律,它描述的是科学工作者人数与其所著论文之间的关系:写两篇论文的作者数量约为写一篇论文的作者数量的1/4;写三篇论文的作者数量约为写一篇论文作者数量的1/9;写N篇论文的作者数量约为写一篇论文作者数量的1/n²……,而写一篇论文作者的数量约占所有作者数量的60.79%。该平方反比定律可表示为:(c为常数,约为60.79%)050001000015000200002500000.511.52R(N)lgn期刊累计数的对数布拉德福分散曲线信息资源管理54.2洛特卡分布曲线的绘制(1)以“云计算”为主题的论文数和作者数对应关系:具体数据如下表(表4)所示:论文数作者数15692267312846451069核心高产作者748592102111121131141161211221311表4论文作者对应关系(2)以论文数x的对数为横轴,以作者数Yx的对数为纵轴作图,我们可以得到洛特卡分布曲线如下图所示:0100200300400500600123456789101112131416212231论文数x(篇)作者数logYx(个)信息资源管理6(3)用最小二乘法计算拟合直线的斜率:xylogxlogylogx*logy(logx)2156902.7551120022670.3010299962.4265110.7304526740.09061905831280.4771212552.107211.0053946650.2276446924640.6020599911.806181.0874286990.3624762335100.69897000410.6989700040.488559067690.778151250.9542430.7425450020.605519368740.845098040.602060.5087997190.714190697850.9030899870.698970.6312328120.815571525920.9542425090.301030.2872556180.91057876710210.301030.30102999611111.041392685001.0844987251211.079181246001.1646321621311.113943352001.2408697921411.146