1研究生《医学统计学》第六节有序分组资料的线性趋势检验胡志坚制作2004年10月1日福建医科大学流行病与卫生统计1、双向无序R×C表①若研究目的多个样本率(或构成比)的比较,可用R×C表χ2检验②若研究目的为分析两个分类变量之间有无关联性以及密切程度时,可用R×C表χ2检验以及Pearson列联系数进行分析2、单向有序R×C表①分组变量有序,指标变量无序,可用R×C表χ2检验②指标变量有序,分组变量无序,可用秩和检验一、R×C表的分类及其检验方法的选择2004年10月1日福建医科大学流行病与卫生统计3、双向有序R×C表R×C表中两分类变量皆为有序且属性相同。宜用一致性检验(Kappa)4、双向有序R×C表R×C表中两分类变量皆为有序且属性不同。①若分析不同年龄组患者疗效之间有无差别时,选用秩和检验②若两个分类变量之间有无相关关系,宜和等级相关或Pearson积矩相关分析③若研究目的为分析两有序分类变量间是否存在线性变化趋势一、R×C表的分类及其检验方法的选择2004年10月1日例7-13某研究者欲研究年龄与冠状动脉粥样硬化等级之间的关系,将278例尸解资料整理成表7-13,问年龄与冠状冠状动脉粥样硬化等级之间是否存在线性变化趋势?二、有序分组资料的线性趋势检验2004年10月1日年龄(岁)冠状动脉硬化等级合计-++++++20~7022429830~2724936340~162313759≥50920151458合计122894126278表、年龄与冠状动脉硬化的关系下一张下二张4325.711582614...9889229812270278122222crnnAn2004年10月1日假设检验过程1.建立假设:H0:年龄与冠状动脉粥样硬化等级之间无线性关系H1:年龄与冠状动脉粥样硬化等级之间有线性关系2.确定显著性水平,取0.05。3.计算统计量:本例最小的TRC=T44=5.42①χ2总=71.4325,ν总=(4-1)(4-1)=9将χ2总分为线性回归分量与偏回归分量②Χ2回归=b2/Sb2;ν回归=1b=lXY/lXX;Sb2=lYY/(n×lXX)③计算偏离线性回归分量Χ2偏Χ2偏=χ2总-Χ2回归,ν偏=ν总-ν回归表2004年10月1日189,2525.81800.634325.711;1800.630026.04053.00026.06727.3672789748.263,4053.06727.3670324.1490324.1499748.2636727.367278633180922222222222回总偏回归总偏回归回归XXYYbXXXYXYYYXXlnlSllbffYfXfXYlffYfYlffXfXl表lXXlYYlXY2004年10月1日4.做出推论:线性回归分量有统计意义,偏离线性回归分量无统计意义,可以认为年龄与冠状动脉硬化之间不仅存在相关关系且为线性关系变异来源χ2νP总变异71.43259<0.005线性回归分量63.18001<0.005偏离线性回归分量8.252580.25~0.5表χ2分解表如果两个都有意义,说明存在相关关系,但关系不是简单的直线关系下一节2004年10月1日年龄fXfxx2fx220~9819819830~632126425240~5931779531≥5058423216928合计2786331809计算lxx计算表2004年10月1日等级fYfyy2fy2-12211221122+8921784356++4131239369+++26410416416合计2785271263计算lYY计算表2004年10月1日计算lxYfXYXYfxy70111702212244413312214482721254242249692365432482416313482332613813339117734128494143620428160154312180144416224合计1349计算表2004年10月1日年龄(岁)冠状动脉硬化等级合计-++++++20~7022429830~2724936340~162313759≥50920151458合计122894126278表、年龄与冠状动脉硬化的关系lXXlYYlXY13研究生《医学统计学》第七节频数分布拟合优度的χ2检验2004年10月1日例7-12观察某克山病区克山病患者的空间分布情况,调查者将该地区分为279个取样单位,统计历年累计病例数,问此资料是否服从Possion分布.2004年10月1日假设检验过程1.建立假设:H0:本资料服从Possion分布H1:本资料不服从Possion分布2.确定显著性水平,取0.10。3.计算统计量:4.确定P,做出推断:P0.10,不拒绝H0,服从Possion分布表527,05.2236.21279279/6862342,46.26862792342,686,279222TTAfXfXn方差均数68618...511260fx234218...5112602222fx2004年10月1日取样单位内病例数观察频数A概率P(X)理论频数T(A-T)2/T0260.085423.80.201510.210258.60.992750.258572.10.123630.212059.10.264380.130436.40.075170.064117.90.05650.02637.30.36730.00922.6≥810.0039*1.1合计279(n)1.0000279.02.05*X≥8概率:1-0.9961=0.0039表Possion分布的拟合与检验9上一张1146.2,!)(XeXPXT=nP(X)=279P(X)2004年10月1日