第十四章++卡方检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十四章卡方检验本章主要讲解Crosstabs菜单功能,该菜单项专门处理分类资料(包含有序分类和无序分类资料),类似的菜单还有Logistic,Loglinear菜单也是专门针对分类资料。引例:1、请分析性别与所喜爱的颜色是否有关?喜爱颜色性别红蓝绿男301010女2010202、请比较两种治疗方法是否有显著差别,哪种治疗方案更好?状态处理治愈未治愈13614222283、杀人犯的种族是否会影响判处死刑?对1976年-1977年美国弗罗里达州20个地区杀人案件中的326个被告进行调查,考虑的种族有白人和黑人。用“是”或“否”表示是否判死刑,调查数据如下:种族判刑白黑是1917否141149析:在调查问卷中,常常涉及到上述类型的数据,该种类型的表格称为列联表,也称为交叉表,具有两个或多个分类型变量。其一般格式表现为CR,即行变R个水平,而列变量C个水平,最特殊的表为22,即行变量和列变量均只有两个水平,如引例2和3。对该种类型数据的分析,常涉及到下列几个问题:①产生汇总分类数据——列联表,即计算行/列百分数、行/列汇总数等序列描述统计量②检验行变量与列变量是否独立(即有无相关性)完成上述两项任务,可通过SPSS-----Descriptive-----Crosstabs过程实现,下面是有关Crosstabs过程的详细内容。一、CROSSTABS要求的数据格式CROSSTABS专门处理分类资料,有其特定的要求格式行变量列变量频数………….….…….…….………….……..…….如:针对引例1,SPSS对该数据进行分析需要的数据格式为:性别颜色频数113012101310212022102320在完成上述数据转换过程之后,进一步指定频数变量,即DATA---WEIGHTCASES---频数,该过程指定频数变量。二、CROSSTABS如何解决上述问题解决上述列联表中行变量与列变量是否相关,一个通常的方法是卡方检验,它用于检验分类型变量有无相关性,其统计假设为:0H:行变量与列变量无关联性(不相关)1H:行变量与列变量有关联性(相关)卡方检验统计量计算公式略,有兴趣可参考其他教材,本处只讲解涉及到的统计假设,以及如何在SPSS中检验并如何分析SPSS输出结果。注:此方法一般要求样本容量不小于50,每一组频数都不小于5,如果出现小于5的情况,一般应选择合并。否则运用卡方检验分析出的结果是不可靠的。例1:见书260。无序分类变量的相关性检验分析:该数据满足卡方检验的要求,各组频数不小于5,样本容量也超过50。按照下述过程操作:Descriptive---crosstab---row---column---statisitcs---chi-square-ok.下面给出SPSS最关键的一张输出表:Chi-SquareTestsValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)PearsonChi-Square6.133(b)1.013ContinuityCorrection(a)5.1181.024LikelihoodRatio6.3041.012Fisher'sExactTest.018.011Linear-by-LinearAssociation6.0841.014NofValidCases126aComputedonlyfora2x2tableb0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis13.78.在上述诸多的结果中应当看哪一项分析结果呢?标准如下:①当样本容量超过40,且每一组频数超过5,直接看卡方检验即可。若P值和显著性水平较为接近,则使用确切概率法。②当样本容量超过40,但有频数小于5,直接看校正卡方检验即可。③当样本容量小于40,且有频数小于5,则不适用卡方检验,而使用确切概率法。Crosstabs对话框中最重要的两个对话框1、EXACT该对话框主要决定计算概率的方法,包含两种类型:近似概率法,确切概率法。默认状态下均选择第一项,即近似概率法,特殊情况下,如存在频数小于5的情况,应该使用确切概率法。2、Statistics(1)、Chi-square:用于检验行变量与列变量是否相关。对于特殊的22还会给出校正卡方检验和确切概率的检验结果。(2)、Nominal:专门反映分类变量的相关性。实际上更适合于无序分类变量。(3)、Ordinal:专门反映分类变量的一致性。只适合于有序分类变量。所谓一致性,指的是行变量水平越高,列表量水平也越高,反之亦然。否则,认为行变量与列变量不具有一致性。(4)Kappa:内部一致性系数(5)McNemanr:配对卡方检验。只适合于方形表格。即行变量和列变量水平数相同。(6)Cochran’sandMantel-Haenszelstatistics:分层卡方检验。适合于两个二分类变量进行相关性检验以及方差齐性检验。例2:请根据引例2提供的数据分析两种方案的疗效是否有显著差别。主要分析结果:Chi-SquareTestsValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)PearsonChi-Square8.046(b)1.005ContinuityCorrection(a)6.9381.008LikelihoodRatio8.1701.004Fisher'sExactTest.008.004Linear-by-LinearAssociation7.9661.005NofValidCases100aComputedonlyfora2x2tableb0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis21.00.由于此题目中各单元的频数符合卡方检验的要求,因此,看第二行校正卡方检验结果即可。从表中可知,P值小于0.05,拒绝原假设,认为两种治疗方案有显著差异,从所提供的数据看,显然第一种治疗方案更有效。例3:请分析判死刑与种族是否有关?主要分析结果:Chi-SquareTests.221b1.638.0861.769.2211.638.725.384.2211.638326PearsonChi-SquareContinuityCorrectionaLikelihoodRatioFisher'sExactTestLinear-by-LinearAssociationNofValidCasesValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)Computedonlyfora2x2tablea.0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis17.67.b.从上表中看出,判刑与种族无关联性。为对上述结果加以佐证,可以计算出列联相关系数如下:SymmetricMeasures.026.638.726c.714.737.026.638.726c.714.737.026.638.726c.714.737326PhiCramer'sVContingencyCoefficientNominalbyNominalNofValidCasesValueApprox.Sig.Sig.LowerBoundUpperBound99%ConfidenceIntervalMonteCarloSig.Notassumingthenullhypothesis.a.Usingtheasymptoticstandarderrorassumingthenullhypothesis.b.Basedon10000sampledtableswithstartingseed562334227.c.从上表中可知,反映行变量与列变量相关系数的三个指标取值都很小(这里的行变量与列变量都是无序分类变量,因此先用上述三指标分析行变量与列变量的相关性),取值越低,相关性越弱,从结果看,印证了卡方检验的结果。总结:实际上,三个引例均属同一种类型,即数据均满足卡方检验的要求,每个单元的频数都不小于5,但实际处理问题的过程中,往往不会都是这样理想的数据。当出现部分单元的频数小于5时,应该在EXACT中使用确切概率法。例4:为比较两种工艺对产品的质量是否有影响,对其产品进行抽样检查,结果如下:合格不合格工艺134工艺264合计98注:进行卡方检验的同时,计算出列联相关系数以便辅助说明结果。例5:见书266。有序分类变量之间的相关性检验主要分析结果:见书P267。此处由于有多个单元的期望频数小于5,故应该使用确切概率法。补充说明:本例中所提到的“血压控制情况”和“肥胖程度”两项指标均属于有序分类变量,对于此种类型的变量,通常涉及两个问题:(1)两个变量之间是否有关系.(2)两个变量之间,是否存在随着一个变量的等级增加,另一个变量的等级也增加。对前一问题的回答,通过卡方检验即可完成,但对后一问题的回答需要计算列联相关系数完成。通过ORDINAL复选框完成。上例中相关系数如下:从DirectionalMeasures-.074.085-.869.385-.078.089-.869.385-.070.081-.869.385Symmetric血压控制情况Dependent肥胖程度DependentSomers'dOrdinalbyOrdinalValueAsymp.Std.ErroraApprox.TbApprox.Sig.Notassumingthenullhypothesis.a.Usingtheasymptoticstandarderrorassumingthenullhypothesis.b.SymmetricMeasures-.074.085-.869.385-.069.080-.869.385-.114.131-.869.385108Kendall'stau-bKendall'stau-cGammaOrdinalbyOrdinalNofValidCasesValueAsymp.Std.ErroraApprox.TbApprox.Sig.Notassumingthenullhypothesis.a.Usingtheasymptoticstandarderrorassumingthenullhypothesis.b.从上述4项指标看,列联相关系数的取值很小,也印证了卡方检验分析的结论。例6:一位动物流行病学家检验奶牛是否患有某种细菌性疾病,通过分析获得如下数据:请分析:(1)奶牛疾病与牛群大小是否有关?(2)随着牛群的增大,奶牛患病程度是否有增加或减小的趋势?没有患病低程度患病高程度患病小959中18419大1188136例7:见书P267。配对卡方检验。KAPPA:用于检验两个变量的一致性程度。0H:行变量与列变量不具有一致性1H:行变量与列变量具有一致性McNemar:只适合于方形表格。即行变量和列变量的分类数相同,针对这样的数据作配对卡方检验,检验两个变量在哪些地方不一致。PearsonChi-Square:侧重于检验两个变量是否相关本例分析结果:Chi-SquareTests170.918a4.000174.2984.000112.2361.00013.5662.001166PearsonChi-SquareLikelihoodRatioLinear-by-LinearAssociationMcNemar-BowkerTestNofValidCasesValuedfAsymp.Sig.(2-sided)0cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis9.34.a.SymmetricMeasures.676.04912.2

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功