文献计量学什么是文献计量学科研论文作者信息分布规律——洛特卡定律主讲内容洛特卡定律形成的背景洛特卡定律的形成洛特卡定律的基本内容洛特卡定律的发展洛特卡定律的应用洛特卡定律的应用局限性洛特卡定律形成的背景一、科学发展的决定性因素1.社会的政治、经济的发展水平2.科研资金的投入量3.科研人员的数量与质量(具体包括?)4.科研设备状况5.信息保障与支撑作用洛特卡定律形成的背景二、科研工作者的界定观点从科学文献的角度来讲,科学技术领域的工作者在其一生中所从事的科研工作中至少发表过一篇学术论文才有资格被称为科学工作者,也就是科研人员。洛特卡定律形成的背景科学工作者是科学研究的主体,其科学活动的产物——科技文献——思想的重要结晶之一;科研工作者的集合,构成科学论文的“著作群体”,与科学的发展密切相关;该定律即以科研成果(科学论文)的数量作为评价科研工作者对科学做出贡献的大小。洛特卡定律形成的背景三、基本假设1.假定著者科学文献量多少是衡量科学贡献大小指标;2.在一定条件下,该假设成立:每篇科学论文对该学科的贡献的大小是一样的。在此假定条件下,我们就可以通过科学论文的数量来判断科学工作者对科学的贡献。洛特卡定律形成的背景19世纪末20世纪初,是科学发展史上的一个黄金时期。物理学和化学领域取得了革命性的进展,与之伴随的是文献领域科研人员和文献量的骤升。洛特卡注意到了这种情况,着手研究科研人员与其撰写的论著间的数量关系。对于该研究,洛特卡引入了“科学生产率”的概念来测量科研人员撰写科学论文的能力。科学生产率概念解读科学生产力的概念衡量一门学科的发展这门学科中所发表的文献研究者的著述规律及其与学术文献之间的数量关系科学生产力研究者在科学研究上表现出的能力和工作效果、通常用其生产的学术文献的数量来衡量衡量科学生产力的一项指标洛特卡定律的形成洛特卡定律的基本内容洛特卡定律的图像描述洛特卡其人洛特卡定律的创始人-洛特卡AlfredJamesLotka(1880-1949)美国的著名学者,擅长于统计分析Thefrequencydistributionofscientificproductivity.JournaloftheWashingtonAcademyofSciences,1926,16:317-323.洛特卡定律的形成数据源美国《化学文摘》1907~1916年10年累积索引中的部分作者,姓氏以字母A和B开头的6891位作者。分别列出发表过1篇、2篇,一直到346篇论文的人数。德国Auerbach《物理学史一览表》包括了1900年前物理学领域内出现的1325位物理学家及其论著,取其全部著者数据进行统计。洛特卡定律的形成频数频率洛特卡定律的形成洛特卡定律的形成以论文数(x)的对数为横坐标作者数(yx)的对数为纵坐标两组数据都是直线(如图所示)洛特卡定律的图形描述X:论文数的对数logxYx:作者数的对数logyx两组数据都是直线:虚线:《化学文摘》实线:《物理学史一览表》用最小二乘法计算拟合直线的斜率,近似为-2。logyx=a+blogx,b=-2Logyx+2logx=ayxx2=ayx=a/x2LogyxLogx10532151253010020洛特卡定律的基本内容揭示作者比率与文献数量之间的关系,描述科学生产力的频数分布规律f(x)=c/xnx:1,2,3,…,mF(x)xn=cf(x):写了x篇论文的作者占所有作者数的百分比科学生产力的“倒平方律”,洛特卡统计的数据,大约是n=2。C=f(1)f(x)=f(1)/x2两边同时乘以作者总数Y(x)=y(1)/x2y(x)写了X篇论文的作者数2xc)x(f洛特卡定律的基本内容(文字描述)2x)1(y)x(y•如果经统计得知某一学科领域内撰写1篇论文的作者数量,那么就很容易计算出写过2篇、3篇…论文的作者数量。•写2篇论文的作者数量大约是写1篇论文作者数的1/4。•写3篇论文的作者数量大约是写1篇论文作者数的1/9。•写k篇论文的作者数量大约是写1篇论文作者数的?洛特卡定律的基本内容(图像描述)利用图像描述了作者与论文之间的数量对应关系X轴:作者所写的论文数Y轴:写了x篇论文的作者的比率fx·xn=cLnfx+lnx=lnc与图中直线等价的数学表达式洛特卡定律的实质是Lnfx与lnx有直线关系洛特卡定律的基本内容(C值)洛特卡C值数学推导C=∏2/6=60.79%洛特卡定律的发展洛特卡定律研究的进展普赖斯定律洛特卡定律研究的进展洛特卡定律研究的三个方面对洛特卡定律一般公式的研究对洛特卡定律适用性的研究对洛特卡定律机制的研究洛特卡定律的研究对洛特卡定律一般公式的研究如何确定n和c的数值是洛特卡定律数据研究的重要任务和关键步骤洛特卡定律局限于指数(n)等于2的情形Vlachy的发现n等于2为一特例,n的取值要受到资料量的多寡、学科的性质和发展程度等因素的影响。不同的n值将产生一个显著不同的常数C,而且n值的较小的变化(特别是在n2时)就会引起c值的明显变化。洛特卡定律适用性研究(标志性事件:科尔-coile_K-s检验(1977年)一般认为,在一定统计条件下,洛特卡定律在大多数学科领域是适用的,能够描述科学文献作者分布规律和科学家著述的行为模式。洛特卡分布机制的研究学科特征对于理论科学领域,洛特卡定律n=2是合理的。对于技术科学、社会科学和人文科学,n值会增大(多产学者比例降低)。规模较大和科研合作程度较高的学科,n值就会变小。统计条件统计研究的时间跨度和作者数量统计的时间较长,作者集合较大,会得到较客观地应有的结论。研究方法对合著和高产作者群的不同处理会影响其研究结果合著者和截取高产作者数据是两个必须解决的问题普赖斯定律科学家总人数的开平方,所得到的人数撰写了全部科学论文的50%。两个重要推论:发表了篇以上论文的科学家们所发表的论文总数等于全部论文总数的一半。杰出科学家中最低产那位作家所发表的论文数,等于高产科学家发表论文数的平方根的0.749倍。)x(749.0max洛特卡定律的应用洛特卡定律的应用洛特卡定律的局限性及原因洛特卡定律的应用科研人员的著述状况和发表论文数量测定具有不同数量论文的作者之分布规律揭示科学工作者生产科学文献的能力分析每一篇论文的作者数量阐明完成一篇科学论文要“占用”多少作者洛特卡定律的具体应用在信息科学、图书馆学方面测定各学科的“平均文献作者数”,合理编制著者索引、规划检索刊物体系的参考价值和指导意义。在预测科学方面预测文献数量的增长速度和文献流向的动向预测科学家数量的增长和科学发展规模在科学学和人才学方面科学家的活动规律、研究著述特征,便于科学学的理论研究和科学史的探讨。洛特卡定律的局限性与研究的学科领域有关洛特卡定律本身的局限性洛特卡的倒平方经验法则只是对两个学科领域抽样的简单推广而建立起来的一个通式,并非精确的统计分析统计数据的局限研究时间跨度够长,作者数目大,才能够近似地表是为平方反比率。谢谢