第八章--分类变量的资料的比较卡方检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第八章分类变量资料的比较-卡方检验学习目标1.能够阐述卡方检验的原理和应用范围。2.掌握四格表资料两独立样本率比较的方法。3.掌握配对设计资料样本率比较及关联性检验的方法。4.掌握不同应用条件下R×C表的卡方检验方法。学习内容第一节两独立样本率的卡方检验第二节两相关样本率的卡方检验第三节Fisher确切概率检验第四节R×C表的卡方检验第五节案例讨论(自学)第一节两独立样本率的卡方检验χ2检验的基本思想χ2检验的基本思想是:在H0成立的条件下,两独立样本的总体率π1、π2可以看作来自总体参数为π的同一总体。在此条件下,经从同一总体随机抽样所得的两个样本率在一般情况下应相差不大,两独立样本所对应的四格表实际数和理论数(A-T)在一般的情况下相差也不大。χ2值反映了理论频数和实际频数的吻合程度。χ2检验的基本思想为了更好地反映在不同抽样情况下A-T差值的分布规律,KarlPearson引入χ2统计量,以此来反映A-T差值的分布规律,见式(8.2)。χ2分布概率密度函数所对应的图形具有以下特征:①与u、t、F分布一样,χ2分布是一个连续型的分布,只有一个参数v决定它的形状;χ2检验的基本思想②v越大,曲线趋于对称,v→∞,χ2分布趋向正态分布;③卡方图形的面积分布有规律性,记为,表示自由度为v,χ2分布曲线下右侧尾部面积为α时χ2的界值;2,χ2分布的面积χ2分布的曲线在第一象限内,其形状与ν的大小有关。当ν确定后,如果分布曲线下右侧尾部的面积为α时,则横轴上相应的χ2值就记作,即χ2界值。其右侧部分的面积α表示ν时,值大于界值的概率大小。χ2值与P值的对应关系见附表6,χ2值愈大,P值愈小;反之,χ2值愈小,P值愈大。χ2检验时,先计算检验统计量χ2值,然后按ν查界值表(附表7),确定P值。2,χ2分布的面积从图8.1可知,当v固定时,尾部面积越小,χ2值越大,反之亦然。=3.84是指在H0成立的条件下,当v=1时,得到的χ2值等于3.84及大于3.84的概率为0.05,相对而言,在此条件下理论上95%的抽样样本其χ2值都会落在0~3.84这个区域2,χ2分布的面积据小概率的定义,说明在H0成立的条件下,χ2值落在大于3.84及更极端的区域是不大可能发生的事件。如果实际样本所计算的χ2值大于3.84,按α=0.05水平拒绝H0假设,接受H1。反之,如果χ2值小于3.84,不拒绝H0假设。从本例来看,χ2=8.812,该卡方值比较大,也从侧面反映了实际频数与理论频数的不吻合。其真正原因很有可能是两样本率来自两个不同的总体,即H0假设实际上是不成立的。χ2分布的图形χ2分布的特点⑴分布的形状依赖于ν的大小:当ν≤2时,曲线呈L型;随着ν的增加,曲线逐渐趋于对称;当ν→∞时,分布趋近于正态分布。⑵分布具有可加性:如果两个独立的随机变量X1和X2分别服从ν1和ν2的分布,那么它们的和(X1+X2)也服从(ν1+ν2)的分布。χ2检验的基本步骤χ2检验的基本步骤χ2检验的基本步骤χ2检验的基本步骤四格表资料的专用公式四格表资料校正χ2四格表资料校正χ2四格表资料校正χ2SPSS软件实现SPSS软件实现SPSS软件实现SPSS软件实现SPSS软件实现第二节两相关样本率的卡方检验一、假设检验步骤一、假设检验步骤SPSS软件实现可以通过以下菜单方式操作实现1描述统计交叉表2非参数统计相关样本或非参数统计旧对话框2个相关样本SPSS软件实现SPSS软件实现SPSS软件实现SPSS软件实现(非参数法)SPSS软件实现(非参数法)SPSS软件实现(非参数法)第三节Fisher确切概率检验例8.4假设检验步骤假设检验步骤假设检验步骤P值是观察到的情况以及更极端情况的概率。对于双侧检验,如将现有样本概率记为Pr,则所有概率小于等于Pr的四格表的概率和,即为确切概率法的结果。如果是单侧检验,则将相应方向上所有概率小于等于Pr的四格表的概率相加即可。假设检验步骤如果π1π2,将Pr下方所有概率小于等于Pr的四格表的概率相加;如果π1π2,将Pr上方所有概率小于等于Pr的四格表的概率相加。根据研究目的,本研究应采用双侧检验,故P=P1+P2+P7+P8+P9=0.08050.05。即获得当前样本和比它更极端样本的概率是0.0805。按α=0.05水准,不拒绝H0,两组样本率的差异无统计学意义,尚不能认为某中药制剂对HIV垂直传播的预防能力高于对照组。SPSS软件实现同两独立样本率的卡方检验的SPSS实现直接读取精确概率行的双侧P值第四节R×C表的卡方检验一、多个样本率的比较二、两组构成比的比较(一)双向无序两组构成比的比较(二)单向有序两组构成比的比较三、多组构成比的比较四、定性资料的关联性检验第四节R×C表的卡方检验四、定性资料的关联性检验(一)四格表资料的相关分析(二)R×C列联表资料的关联性分析1.双向无序列联表2.双向有序且属性不同的列联表3.双向有序且属性相同的列联表R×C表的有关概念多个样本率的比较多个样本率的比较多个样本率的比较SPSS实现同两独立样本率的卡方检验。多个样本率之间的两两比较可采取卡方分割的方法进行检验。具体方法请参照有关书籍。二、两组构成比的比较(一)双向无序两组构成比的比较(一)双向无序两组构成比的比较双向无序两组构成比的比较SPSS实现同两独立样本率的卡方检验。数据见08-06.sav单向有序两组构成比的比较单向有序两组构成比的比较单向有序两组构成比的比较单向有序两组构成比的比较SPSS实现不能进行卡方检验。可以作CMH(SAS软件可实现,SPSS无此功能)。也可以作秩和检验(SPSS软件、SAS软件)。也可以作Ridit分析(SAS软件可实现或Excel)。多组构成比的比较多组构成比的比较多组构成比的比较SPSS实现同两独立样本率的卡方检验。数据见08-08.sav定性资料的关联性检验四格表资料的相关分析四格表资料的相关分析四格表资料的相关分析四格表资料的相关分析SPSS实现SPSS数据输入格式:生长、不生长、结果(1代表生长,2代表不生长)。同两独立样本率的卡方检验。列联系数(Phicoefficient)可在Statistics相应的选项中进行选择。四格表资料的相关分析SPSS实现四格表资料的相关分析SPSS实现R×C列联表资料的关联性分析双向无序列联表双向无序列联表双向无序列联表SPSS实现同两独立样本率的卡方检验。数据见08-10.sav列联系数(Phicoefficient)可在Statistics相应的选项中进行选择。双向有序且属性不同的列联表双向有序且属性不同的列联表SPSS实现可运用Spearman秩相关(分析相关双变量Spearman)可以作CMH(SAS软件可实现,SPSS无此功能)。数据见08-11.sav。双向有序且属性相同的列联表双向有序且属性相同的列联表双向有序且属性相同的列联表SPSS实现双向有序且属性相同的列联表SPSS实现注意事项1.对于行×列表多个样本率/构成比比较的χ2检验不能有1/5以上的格子理论数小于5,或者不能有一个格子的理论数小于1,否则易出现偏性。如出现上述情况,可通过软件计算确切概率。2.对于单向有序两组或多组构成比资料的比较一般采用CMH方法计算行平均分检验统计量进行分析,也可以进行秩和检验、Ridit分析等。注意事项3.分类变量资料的关联性检验比较特殊,应根据不同的设计和资料特点选择相应的统计量。

1 / 76
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功