快速学会卡方检验.

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

`卡方检验快速学会简单清晰卡方检验基础四格表卡方检验配对卡方检验与一致性检验两分类变量间关联程度的度量分层卡方检验小结内容提要首先假设H0成立,计算出2值,它表示观察值与理论值之间的偏离程度。根据2分布,2统计量以及自由度可以确定在H0成立的情况下获得当前统计量及更极端情况的概率P。如果P很小,说明观察值和理论值偏离程度太大,应当拒绝原假设,表示比较资料之间有显著性差异;否则就不能拒绝原假设,尚不能认为样本所代表的实际情况与理论假设有差别。卡方检验基础2检验的基本思想当n比较大时,2统计量近似服从k-1个自由度的2分布。在自由度固定时,每个2值与一个概率值(P值)相对应,此概率值即为在H0成立的前提下,出现这样一个样本或偏离假设总体更远的样本的概率。如果P值小于或等于显著性水准,则拒绝H0,接受H1,即观察频数与期望频数不一致。如果P值大于显著性水准,则不拒绝H0,认为观察频数与期望频数无显著性差异。P值越小,说明H0假设正确的可能性越小;P值越大,说明H0假设正确的可能性越大。卡方检验基础-卡方分布检验某个连续变量的分布是否与某种理论分布一致,如是否符合正态分布,Possion分布等检验某个分类变量各类的出现概率是否等于指定概率检验两个分类变量是否相互独立,如吸烟是否与呼吸道疾病有关检验控制某种或某几种分类变量因素的作用之后,另两个分类变量是否独立,如上例控制年龄、性别之后,吸烟是否与呼吸道疾病有关检验两种方法的结果是否一致,如两种诊断方法对同一批人进行诊断,其诊断结果是否一致卡方检验基础-用途首先建立数据文件,如下。四格表卡方检验注意:由于上表给出的不是原始数据,而是频数表数据,应该进行预处理。四格表卡方检验选择加权四格表卡方检验选择加权点击频数变量,放入此框四格表卡方检验选择交叉表四格表卡方检验(交叉表对话框)将药物放入行变量框,疗效放入列变量框,分别选择按钮和按钮。结果分析表示药物加化疗与单用药物治疗某种癌症的疗效比较的行×列表,除了观察值以外,还有期望值和有效率。四格表卡方检验结果分析此为四格表2检验的结果,2=6.508,P=0.011,差异有统计学意义,即药物加化疗与单用药物治疗癌症的疗效有统计学差异。四格表卡方检验对频数变量加权选择加权(或选择工具栏中的天枰)在单元格对话框中选择期望值选择校正卡方配对卡方检验在Pearson卡方检验中,对行列变量的相关性作了检验,其中的行列变量是一个事物的两个不同属性。实际应用中,还有一种列联表,其中的行列变量反映的是一个事物的同一属性。例如把每一份标本分为两份,分别用两种方法进行化验,比较两种化验方法的结果是否有本质不同;或分别采用甲、乙两种方法对同一批病人进行检查,比较此两种方法的结果是否有本质不同,此时要用配对卡方检验。配对卡方检验配对卡方检验公式:22()=bcbc若b+c40,则用公式:若b+c≤40,则用公式:22(1)=bcbc例2某实验室分别用乳胶凝集法和免疫荧光法对58名可疑系统性红斑狼疮患者血清中抗核抗体进行测定,结果见下表,问两种方法的检测结果有无差别?免疫荧光法乳胶凝集法合计+-+111223-23335合计134558两种方法的检测结果配对卡方检验首先建立数据文件,如下。配对卡方检验配对卡方检验同理,由于是频数表数据,应该先用weightcases进行预处理。不能忘记哦!配对卡方检验在此选入频数变量即可进行下一步的分析。配对卡方检验配对卡方检验(统计量选择对话框)选中进行配对卡方检验按继续按钮返回配对卡方检验结果分析结果分析如果在crosstab过程的statistics子对话框中勾选上Kappa复选框:一致性检验一般认为,当Kappa≥0.75时,表明两者一致性较好;0.75Kappa≥0.4时,表明一致性一般;Kappa0.4时,表明两者一致性较差。一致性检验注意:Kappa检验会利用列联表的全部信息,而McNemar检验只会利用非主对角线单元格上的信息。因此,对于一致性较好,即绝大多数数据都在主对角线的大样本列联表,McNemar检验可能会失去实用价值。一致性检验两分类变量间关联程度的度量2检验可以从定性的角度说明两个变量是否存在关联,当拒绝原假设时,在统计上有把握认为两个变量存在相关。但接下来的问题是,如果两变量之间存在相关性,它们之间的关联程度有多大?针对不同的变量类型,在SPSS中可以计算各种各样的相关指标,而且Crosstabs过程也对此提供了完整的支持,此处只涉及两分类变量间关联程度的指标,更系统的相关程度指标见相关与回归一章。两分类变量间关联程度的度量相对危险度RR:是一个概率的比值,指试验组人群反应阳性概率与对照组人群反应阳性概率的比值。数值为1,表明试验因素与反应阳性无关联;小于1时,表明试验因素导致反应阳性的发生率降低;大于1时,表明试验因素导致反应阳性的发生率增加。优势比OR:是一个比值的比,是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比。当关注的事件发生概率比较小时(0.1),优势比可作为相对危险度的近似估计值。两分类变量间关联程度的度量例3某食堂食物中毒,现想通过调查发现,吃某海产品和食物中毒发生是否具有关联性,以及吃了某食物的人是没吃海产品的人的几倍。数据文件见下:两分类变量间关联程度的度量两分类变量间关联程度的度量基本操作与四格表卡方检验相同,只是在统计量对话框中选择可得到OR(或RR)值两分类变量间关联程度的度量结果分析这就是两变量的四格表及卡方检验。两分类变量间关联程度的度量结果分析结果显示,OR=3.00,说明吃了该食物者发生食物中毒的可能性是没有吃该食物者的3.00倍?例4为了研究饮酒与食管癌的关系,现对200名病例和775名对照进行研究,并整理成如下按年龄分层的表格,试分析饮酒与食管癌的关系按年龄分层饮酒与食管癌关系的病例对照研究对频数变量加权分层卡方检验层变量行变量列变量分层卡方检验基本操作与不分层卡方检验相同,在统计量对话框中除了选中risk(风险)外,再选择各层的四格表:各层检验的结果各层的OR估计值分层卡方检验分层卡方检验结果,即考虑了年龄分层因素的影响以后,对饮酒与食管癌检验结果,共给出CMH2检验和MH2检验两种结果,前者是后者的改进,可见P值均小于0.05,即可认为饮酒与食管癌有关。结果分析层间OR齐性检验,二种检验结果p均0.05,提示各层间的OR一致,可以合并,如果层间OR不一致,则不宜合并。调整年龄混杂后OR的估计值结果显示,去除了年龄混杂效应以后饮酒与不饮酒优势比ORMH值为5.205,95%CI:3.593-7.541。结果分析未校正年龄混杂时OR估计值年龄的混杂效应为:5.606-5.205=0.4015.6051.0775.205caOROR如果不校正年龄混杂效应,则饮酒对食管癌的效应被高估了7.7%(1-1.07)*100。行×列表也称R×C表,包括2×2、R×2、2×C、R×C表等。用于多个样本率或构成比的比较,上一节介绍的四格表为其中最简单的一种形式。在SPSS软件中R×C表基本操作步骤与四格表卡方检验相似。关于行×列表资料的卡方检验关于多个独立样本率多重比较:对于比较多组独立样本的2检验,拒绝H0只能说各组总体概率不全相同,即多组中至少有两组的有效概率是不同的,但并不是多组有效概率彼此之间均不相同。若要明确哪两组间不同,还需进一步作多组间的两两比较。3个处理组,两两比较有3种对比,如果直接对每种对比分别作四格表的2检验,将增大I类错误的机会,为此在进行多组频率的两两比较时,需根据比较的次数修正检验水准。例如原来检验水准=0.05,进行3组间的两两比较,共比较3次,于是两两比较的检验水准应取=0.05/3=0.0167。(如果此时例数较少而不宜用2检验的话,应计算确切概率)剂量镇痛效果合计有效率%有效无效1.0mg3121520.002.5mg1192055.005.0mg1261866.67合计26275349.06•例:为研究某镇痛药的不同剂量镇痛效果是否有差别,研究人员在自愿的原则下,将条件相似的53名产妇随机分成三组,分别按三种不同剂量服用该药,镇痛效果如下表。对比组四格表卡方值P值检验水准修正值检验结果1.0mgvs2.5mg4.380.0360.0167—1.0mgvs5.0mg7.190.0070.0167*2.5mgvs5.0mg0.540.4630.0167—本例不同剂量有效概率间的两两比较结果见下表不同剂量两两比较的结果*用Bonfferroni调整后差别有统计学意义。将疗效变量放入行变量(row)框将组变量放入列变量(columm)框按选择卡方检验按选择Bonfferrnio法做多重比较相同字母的组在α=0.05的水准上无统计学显著性1.卡方检验是以2分布为基础的一种常用假设检验方法,常用作计数资料的显著性检验。其基本思想是:首先假设观察频数与期望频数没有差别。而统计量2值表示观察值与理论值之间的偏离程度。当n比较大时,2统计量近似服从k-1个自由度的2分布。在自由度固定时,每个2值与一个概率值相对应,此概率即为在H0假设成立的前提下,出现这样一个样本或更大差别样本的概率。如果P值小于或等于显著性水准,则应拒绝H0,接受H1。小结2.关联程度的测量:卡方检验从定性的角度分析是否存在相关,而各种关联指标从定量的角度分析相关的程度大小。不同的指标适合不同类型的变量。RR值是一个概率的比值,是指试验组人群反应阳性概率与对照组人群反应概率的比值。用于反映试验因素与反应阳性的关联程度。OR值是比值的比。是反应阳性人群中试验因素有无的比例与反应阴性人群中试验因素有无的比例之比。在下列两个条件均满足时,可用于估计RR值:①所关注的事件发生概率比较小(0.1),②所设计的研究是病例对照研究。小结3.Kappa一致性检验对两种方法结果的一致程度进行评价;配对检验则用于分析两种分类方法的分类结果是否有差异。小结4.分层卡方检验是把研究对象分解成不同层次,按各层对象来进行行变量与列变量的独立性研究。可在去除分层因素下更准确地对行列变量的独立性进行研究。在SPSS中,Crosstab过程的Statistics子对话框中选中Cochran’sandMantel-Haenszelstatistics会自动给出分层卡方检验的结果。5.对于多个样本率的多重比较需对检验水准进行校正。小结

1 / 56
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功