EXCEL在医学统计学中的应用(一)——概述本课程所需所有EXCEL示例程序,请下载:一般函数解释.xls,统计函数解释.xls,统计分析工具解释.xls,统计程序设计解释.xls,EXCEL实用临床统计程序.xls。统计学是医学科学的基础学科,对临床医学和实验研究有重要的指导价值[1]。对大多数临床医师而言,在正确应用统计分析和计算时常感力不从心。为此,早在十几年前,就有统计学工作者应用BASIC语言编写统计程序[2],以后随着微机的软件和硬件技术的发展,为统计学计算带来了飞跃发展,但建筑在DOS操作系统和数据库基础上的统计软件包需要培训,故其普及和推广应用受到一定限制[3]。近年来,建筑在Windows操作平台的OFFICE软件得到迅速普及,其中EXCEL优越的数据处理性能和强大的统计计算功能开始为大家所熟悉,在国外有许多医院和实验室已经用EXCEL进行医学数据资料的统计计算的报道[4],国内也有这方面的报道[5],经推广使用和《好医生》网站交流,颇受欢迎。EXCEL不仅具有现有的的强大的编程和统计功能,更有利于医学资料和统计资源的共享。EXCEL是一个很有发展潜力的软件,其宏命令和VBA(VisualBasicforApplication)更为EXCEL扩展功能提供了界面,以编程方式对数据分析功能的访问是所有表处理软件中最高级的;EXCEL提供了电子邮件的内部特性的功能,使创建的文件可以和INTERNET上其他人提供的文件进行联接,下载工作簿到用户计算机,也可上载工作簿到FTP(文件传输协议)站点,其数据交换和网络通讯,为统计学工作者数据资料的收集、处理和统计分析提供了更广阔的范围。EXCEL在医学统计中的应用在电子表格上,编制了一些常用的医学统计程序,经实际使用以及和SAS、SPSS对比,计算结果一致。现把如何应用介绍如下:进入统计程序每一张电子表格是一个统计程序,当进入EXCEL,打开卫生统计工作簿时,用鼠标点开标签,则该统计程序的电子表格就显示在屏幕上,就可直接使用该统计程序。常用统计程序2.2.1计量资料的统计程序U检验、t检验、几何均数t检验、配对t检验、t'检验、方差分析(三样本)、配伍方差分析、方差分析(四样本)、随机区组方差分析、拉丁方设计方差分析、无重复试验的两因素方差分析、重复试验的两因素方差分析、几个处理组均数与一个对照组均数比较、多个样本两两比较(Newman-Keuls法)、例数相等协方差分析、例数不相等协方差分析、2X2析因方差分析、2X2X2方差分析、直线回归与相关。详细请见EXCEL实用临床统计程序.xls2.2.2计数资料的统计程序卡方检验有:基本公式、四格表专用公式、2X2等列联表和四格表的确切概率法。RXCG检验等。(详细请见EXCEL实用临床统计程序.xls)2.2.3非参数的统计程序秩和检验:配对秩和检验、成组设计两样本比较的U秩和检验、等级资料的两样本秩和检验、成组设计两样本比较的秩和检验、成组三样本秩和检验(Kruskal-Wallis法)、成组四样本秩和检验(Kruskal-Wallis法)、成组秩和检验(Kruskal-Wallis法)、多个样本两两比较的秩和检验、RIDIT分析、配对资料的符号检验、样本与总体中位数比较的符号检验、升降趋势的符号检验(Cox-Stuart)等。(详细请见EXCEL实用临床统计程序.xls)2.2.2其他统计程序均数的抽样、样本均数与总体均数比较(或配对比较)、两样本均数比较、多个样本均数比较、率的抽样、两样本率的比较、配对分类资料比较、多个样本率比较。标准化率:直接法计算疾病标准化死亡率(1/10万)、间接法计算疾病标准化死亡率(1/10万)。寿命表及其应用:简略寿命表、研究肿瘤(或其他慢性疾病)生存率的改进寿命表法,n月生存率方差、标准误和95%可信区间的计算;完全数据的队列寿命表法、被随访者同时进入随访队列的寿命表、被随访者随时进入随访队列的寿命表、随访资料中被随访者尚有生存者并有失访者的常见队列寿命表、用寿命表方法计算概率病死数等。(详细请见EXCEL实用临床统计程序.xls)使用方法和注意要点2.3.1对初学者而言,先打开统计程序后,就可看到电子表下面的标签内容,有使用说明、U检验、成组T检验、配对T检验、几何T检验……。只要求使用者根据自己想解决的问题,正确选择统计方法和相应的统计程序,选择所需的工作表后,将统计资料输入到原始数据输入区,即红框内就完成操作;就可举重若轻地解决烦琐的计算问题,得到统计结果。2.3.2数据输入当样本资料超过资料框时,可先进行插入行操作,再输入资料数据即可,但不能作列插入,否则无法进行统计计算。有的数据插入后,其右边单元格中公式需要复制,如配对设计t检验、几何均数比较的t检验、配伍组设计方差分析等,复制时只要将上面有公式的单元格复制框向下拖动即可。整批样本资料数据(千万注意不要将格式和公式一起复制)用复制方式输入数据,复制后须将指示框移开。重新计算,一定要将资料样本区的上一批数据全部清除,否则会影响本次计算结果。计算迅速精度高,同时显示出各统计步骤的中间结果,便于核对和查找存在的问题。计算结果的精度可达小数点后12位,满足统计计算的要求。这些程序自98年编写以来,不断改进,并不断有新的实用程序与大家见面,对临床医学和实验研究起到了重要的指导作用。但另一方面,EXCEL虽有分析工具的现成统计软件供大家使用,但尚有许多有用的统计方法没有提供,如二二比较、2X2X2设计资料的方差分析、秩和检验、配对资料的符号检验、样本与总体中位数比较的符号检验、升降趋势的符号检验(Cox-Stuart)、标准化率、寿命表及其应用等。本文目的在于抛砖引玉,希望统计学工作者能用EXCEL编写出更多更实用的具有中国特色的统计程序,更希望有更多的统计学工作者和临床医师结合起来,设计出更多符合实际需要的统计程序,能使大家能从繁琐的计算中解放出来,让电脑代替人脑,使人们的精力更多地集中在科研设计和创造性的思维中去。参考文献1.方积乾,徐勇勇,余松林。医学统计学与电脑实验。上海:科学技术出版社,1997:2~3。2.毛宗秀。BASIC语言常用数理统计方法程序汇编。浙江:科学技术出版社,1979:1~1723.俞顺章,俞国培。疾病数据的管理和分析。上海:上海医科大学出版社,1992:2~54.Kokol-P.Atoolforsoftwareandhardwareevaluation.J-Med-Syst.1966Jun;20(3):167~1725.董大钧,张宝珍等。利用Excel进行医学统计t检验分析。中国卫生统计,1999,16(3):184~185EXCEL在医学统计学中的应用(二)——应用EXCEL统计函数公式进行统计分析本课程所需所有EXCEL示例程序,请下载:一般函数解释.xls,统计函数解释.xls,统计分析工具解释.xls,统计程序设计解释.xls,EXCEL实用临床统计程序.xls。应各位医生、其他专业的朋友和网友的要求,现将EXCEL在医学统计学中的应用的原理和方法介绍如下:资料主要根据高等医药院校教材《卫生统计学》[1]、上海第一医学院卫生统计教研组编写的《医学统计方法》[2]、《中国医学百科全书医学统计学》[3]、《医用数理统计方法》[4]和《临床统计学》[5]《寿命表及其应用》[6]等书中有关统计公式和例题进行编程。编程软件2.1统计函数:示例详见统计函数解释工作簿(请下载)。1)求集中趋势的统计函数:AVERAGE(number1,number2,...)等,详细请见统计函数解释工作簿的集中趋势的统计函数工作表。2)求离散趋势的统计函数:AVEDEV(number1,number2,...)等,详细请见统计函数解释工作簿中的离散趋势的统计函数工作表。3)求频数分布的统计函数:FREQUENCY(data_array,bins_array)等,详细请见统计函数解释工作簿中的频数分布的统计函数工作表。4)正态分布的统计函数:NORMDIST(x,mean,standard_dev,cumulative)等,详细请见统计函数解释工作簿中的正态分布的统计函数工作表。5)总体均数估计和假设检验的统计函数:TTEST(array1,array2,tails,type)等,详细请见统计函数解释工作簿中的总体均数估计和假设检验的统计函数工作表。6)方差分析的统计函数:FTEST(array1,array2)等,详细请见统计函数解释工作簿中的方差分析的统计函数工作表。7)X2检验的统计函数:CHIDIST(x,degrees_freedom)等,详细请见统计函数解释工作簿中的卡方检验的统计函数工作表。8)秩和检验的统计函数:RANK(number,ref,order)等,详细请见统计函数解释工作簿中的秩和检验的统计函数工作表。9)回归与相关:CORREL(array1,array2)等,详细请见统计函数解释工作簿中的回归与相关工作表。2.2常用数学、逻辑和查找函数:省略,见EXCEL使用指南详细请见一般函数解释工作簿。应用EXCEL进行统计分析的方法用EXCEL进行统计分析有四种方法来实现:1直接应用EXCEL统计函数公式;2应用EXCEL分析工具库;3应用EXCEL电子表格和函数编制应用程序;4应用EXCEL统计宏。其中统计宏的编制需要一定软件基础,难以展开讨论,以下对其他三种方法结合实例分析。3.1应用EXCEL统计函数公式进行统计计算EXCEL函数公式不但有强大的科学运算函数和财务分析函数,而且还有丰富的统计函数,这些统计函数可直接对电子表格上指定区域内数据进行统计计算。以两个样本的均数T检验为例:3.1.1TTEST求两个样本的均数t检验TTEST判断两个样本是否可能来自两个具有相同均值的总体。语法TTEST(array1,array2,tails,type)Array1为第一个数据集;Array2为第二个数据集。Tails指明单尾或双尾检验。如果tails=1,函数TTEST使用单尾检验。如果tails=2,函数TTEST使用双尾检验。Type为t检验的类型。1成对检验方法;2等方差双样本检验;3异方差双样本检验。例1.某单位研究饮食中缺乏维生素E与维生素A含量的关系,将同种属的大白鼠按性别相同,年龄、体重相近者配成对字,共8对,并将每对中的两头动物随机分到正常饲料组和维生素E缺乏组,过一定时期将大白鼠杀死,测得其肝中维生素A的含量,见表,问不同饲料的大白鼠肝中维生素A含量有无差别?操作步骤:(1)在J44:J51区域内输入正常饲料组维生素A含量,(2)在K44:K51区域内输入维生素E缺乏组维生素A含量,(3)在I44格中输入=TTEST(J44:J51,K44:K51,2,1)。(4)输入回车键后,I44格就显示P值结果:0.004001。推断分析:因为P值0.05,故可认为两种饲料组所得肝中维生素A含量的差别有显著性意义,即维生素E缺乏对大白鼠肝中维生素A含量有影响。详细请见统计函数解释工作簿中总体均数估计和假设检验的统计函数工作表例2.某克山病区测得11例克山病患者与13名健康人的血磷值(mmol/L)如下,问该地急性克山病患者与健康人的血磷值是否不同?患者X1:0.841.051.201.201.391.531.671.801.872.072.11健康人X2:0.540.640.640.750.760.811.161.201.341.351.451.87操作步骤:(1)在J28:J38区域内输入患者血磷值;(2)在K28:K40区域内输入健康人血磷值;(3)在I28格中输入=TTEST(J28:J38,K28:K40,2,2);(4)输入回车键后,I28格就显示P值结果:0.019337。推断分析:因为P值0.05,故可认为该地急性克山病患者与健康人的血磷值不同有显著性意义,患者较高。详细请见统计函数解释工作簿中总体均数估计和假设检验的统计函数工作表。例3.从A、B两个总体内各取一个随机