医学统计学原理及SPSS应用医学统计学原理一、几个概念1、总体(population):根据研究目的所划定的具有某种共同性质的全部个体值的集合。2、样本(sample):根据随机的原则,从总体中抽取比较少的个体所组成的小的集合3、误差(error):观察值与真实值之差4、抽样误差(samplingerror):有抽样带来的误差。特点:不可避免,但有规律5、变异(variation):在同一总体内各个体间所表现出的参差不齐性6、概率(probability):对随机现象发生可能性大小的度量。其取值范围为0—1,习惯上将P0.05或P0.01的现象称做小概率事件,即统计学认为不可能发生的事件二、统计描述1、计量资料(measurementdata)的统计描述⑴.算术平均数(arithmeticmean):用µ(总体)和X(样本)表示,计算方法:X=∑x/n⑵.标准差(standarddeviation):描述一组数据离散趋势和变异大小的指标。用于比较不同组数据间变异的大小。用σ(总体)和s(样本)表示计算方法s=(∑x2-(∑x)2/n)/n–1例:三组同性别同年龄儿童的体重如下:A组2628303234X=30kgSa=3.16B组2427303336X=30kgSb=4.74C组2629303134X=30kgSc=2.92用均数和标准差两个指标才能全面的描述一组计量资料,即X±s。A组30±3.16B组30±4.74C组30±2.92院前救治对重型颅脑损伤治疗结局的影响.doc2、计数资料(countdata)的统计描述率(rate):用于描述某种现象发生频度的指标,用R表示。计算方法:R=发生某种现象的观察值/可能发生某种现象的全部观察值×100%,1000‰等。注意死亡率与病死率;发病率与患病率之间的区别!三、统计推断——假设检验例1:A、B两种药治疗感冒,将200例患者随机分为A、B各100例,A组治愈时间平均为5.2±1.8天,B组为6.5±2.3天。A药比B药好吗?例2:A手术治愈率86%,B手术治愈率70%,A手术比B手术好吗?院前救治对重型颅脑损伤治疗结局的影响.doc1、两个小样本均数比较的t检验2、两个样本率的比较的χ2检验3、相关分析4、逻辑(logistic)回归SPSS应用一、SPSS简介SPSS(StatisticalPackagefortheSocialScience)社会科学统计软件包是由美国斯坦福大学20世纪80年代初研制的它与SAS和BMDP共同组成世界上三大流行统计分析软件广泛适用于自然科学和社会科学的各个领域SPSS在国内已逐渐流行起来现更名为:StatisticalProductandServiceSolutons(统计产品和服务解决方案)特点:功能强大、容易操作、易学易用二、SPSS应用举例1.t检验例1:将27例确诊为肠憩室患者随机分为两组,分别给予甲、乙两种饮食,观察饮食排出时间(小时)结果如下,试问两种饮食对肠蠕动效果有无差别?甲饮食组7675445551666968526071627075n=14乙饮食组977479839510198955264688883n=13A、数据录入。B、分析Analyze→比较平均数法CompareMeans→独立样本T检验Independent-SamplesTTest→主对话框。C、把排除时间送入检验变量框↓把分组送入分组变量框↓定义组别↓按“选项”按钮↓次级对话框。D、输入置信区间(95%)↓按“继续”按钮↓返回主对话框。GroupStatistics1463.857110.11362.70301382.846215.00474.1616分组甲饮食组乙饮食组排出时间NMeanStd.DeviationStd.ErrorMeanIndependentSamplesTest1.659.210-3.88225.001-18.98904.8911-29.06-8.92-3.82720.837.001-18.98904.9623-29.31-8.66EqualvariancesassumedEqualvariancesnotassumedFSig.Levene'sTestforEqualityofVariancestdfSig.(2-tailed)MeanDifferenceStd.ErrorDifferenceLowerUpper95%ConfidenceIntervaloftheDifferencet-testforEqualityofMeansE、在主对话框中按“确定”按钮→产生结果(见上图)。论文\Chiarimalformation\ChiariI型畸形微创后颅窝减压术.doc上表是分组描述性统计结果,下表t检验结果:院前救治对重型颅脑损伤治疗结局的影响.doc2.四格表资料的X2检验例2:某医师对性乱者和献血员分别检测抗—HCV,结果见下表,试问两组抗—HCV检测阳性率是否有差别?——————————————————————————分组阳性阴性合计阳性率(%)———————————————————————————性乱者18(a)190(b)2088.65献血员2(c)105(d)1071.87———————————————————————————合计202953156.35———————————————————————————A、数据录入。B、资料data↓观察值加权weightcases↓产生次级对话框(原始数据表不需要加权!)。点击“加权”项目→把“频数”送进加权变量框→按“确定”按钮。C、分析Analyze→描述性统计DescriptiveStatistics→交叉表Crosstabs→主对话框。D、把行送进上变量框↓把列送进直行变量框。E、→按“统计量”、“格”、“格式”按钮→次级对话框→对需要的项目进行选择按→“继续”按钮→返回主对话框。选择卡方统计量:选择实际值和行的百分比:行*列Crosstabulation21051071.9%98.1%100.0%181902088.7%91.3%100.0%202953156.3%93.7%100.0%Count%within行Count%within行Count%within行献血员性乱者行Total阳性阴性列Total行*列CrosstabulationCount21051071819020820295315献血员性乱者行Total阳性阴性列Total列联表:F、在主对话框中按“确定”按钮→产生结果(见下图)。Chi-SquareTests5.470b1.0194.3881.0366.6021.010.026.013315PearsonChi-SquareContinuityCorrectionaLikelihoodRatioFisher'sExactTestNofValidCasesValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)Computedonlyfora2x2tablea.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis6.79。b.上表是卡方检验结果(注意结果的应用条件):论文\Chiarimalformation\ChiariI型畸形微创后颅窝减压术.doc3.四格表资料的X2检验(校正公式):例3:某医院进行肿瘤手术切除分析,资料见下表,试问两组切净率是否有差别?———————————————————————————肿瘤性质切净例数残留例数合计切净率(%)———————————————————————————良性26(18.44)1(8.56)2796.30恶性2(9.56)12(4.44)1414.29———————————————————————————合计2813416.35———————————————————————————分析:本例一个理论值均小于5,应采用四格表校正公式。操作方法:与例题2完全一样,不在重复(下同)。理论值的计算公式TRC=nRnC/NnR为行的合计nC为列的合计N为总例数行*列CrosstabulationCount1221412627132841恶性良性行Total残留切净列TotalChi-SquareTests28.636b1.00024.9741.00031.1831.000.000.00041PearsonChi-SquareContinuityCorrectionaLikelihoodRatioFisher'sExactTestNofValidCasesValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)Computedonlyfora2x2tablea.1cells(25.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis4.44。b.列联表:卡方检验结果:4.四格表资料确切概率法:(T<1或N≤40)例4:某医师对20例急性心机梗死并发休克患者分别采用西药和中西药结合方法抢救,结果如下表,试问两组疗效有无差别?———————————————————————————分组有效无效合计有效率(%)———————————————————————————西药6(8.25)5(2.75)1154.55中西药9(6.75)0(2.25)9100.00———————————————————————————合计1552075.00———————————————————————————本例N≤40,应采用四格表确切概率法(Fisher法)。行*列CrosstabulationCount56119951520西药中西药行Total无效有效列TotalChi-SquareTests5.455b1.0203.3001.0697.3351.007.038.03020PearsonChi-SquareContinuityCorrectionaLikelihoodRatioFisher'sExactTestNofValidCasesValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)Computedonlyfora2x2tablea.2cells(50.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis2.25。b.列联表:卡方检验结果:相关与回归分析相关分析医学上,许多现象之间都有相互联系例如:身高与体重、体温与脉搏、产前检查与婴儿体重、乙肝病毒与乙肝等在这些有关系的现象中,它们之间联系的程度各不相同体温和脉搏的关系就比产前检查与婴儿体重之间的关系密切得多而体重和身高的关系则介与二者之间乙肝病毒和乙肝之间是因果关系有的现象之间因果不清,只是伴随关系,例如丈夫身高和妻子的身高之间,就不能说有因果关系相关就是用于研究和解释两个变量之间相互关系的复件第四脑室形态对判断小脑出血手术指征的价值.doc•1078对父子的身高•用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高•1078个点所形成的图形是一个散点图•它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆相关的类型相关系数相关系数r的值在-1和1之间,可以是此范围内的任何值正相关时,r值在0和1之间,散点云图是斜向上的,这时一个变量增加,另一个变量也增加负相关时,r值在-1和0之间,散点云图是斜向下的,此时一个变量增加,另一个变量将减少r的绝对值越接近1,两变量的关联程度越强,r的绝对值越接近0,两变量的关联程度越弱。一般说来,当样本量较大(n100),并对r进行假设检验,有统计学意义时r