spss18.0卡方检验主要内容•1.两独立样本率比较的卡方检验•2.配对计数资料的卡方检验•3.分层资料的卡方检验•4.卡方的两两比较一、两独立样本的卡方检验列联表资料:指两个或者多个分类变量各水平组合频数分布表,又称频数交叉表,简称交叉表(Crosstabs)。下表为四格表操作过程(1)建立数据文件(chi2_2.sav)数据格式:4行3列(如下图)•分类变量(行变量):变量名“group”,1=“抗病毒组”,2=“紫外线组”。•分类变量(列变量):变量名”effect”,1=“有效”,2=“无效”。•频数变量:变量名“freq”,将四格表中的4个频数输入此列(2)加权个案加权个案是指对变量,特别是频数变量赋予权重。本例对变量“freq”进行加权。Spss18.0操作点击“数据”——选择“加权个案”•弹出下列窗口选择加权个案,并将变量“freq”拉进框内(3)卡方检验操作:分别选择“分析”“统计描述”“交叉表”如右图弹出交叉表(Crosstabs)主对话框1.行变量本例选择“group”2.列变量本例选择“effect”•点击右边“统计量”选项,弹出对话框(如下图)•选择“卡方”选项(4)结果解释:Pearson卡方:非校正卡方检验连续校正:仅适用于四格表Fisher的精确检验:Fisher确切概率检验,也仅适用于四格表资料似然比:似然比卡方检验,适用表资料线性和线性组合:线性相关性检验,两变量均为等级变量,且从小到大排列时方有意义,其他情况忽略RC其他选项介绍•1.相关性:计算Pearson和Spearsmen相关系数,用以说明行变量和列变量的相关程度。•2相依系数:又称列联系数。也是用来说明相关性。•3.Gamma:测量两个等级变量之间关联度的统计量•4.Kappa:Kappa系数,见下文•观察值:观察频数•期望值:期望频数•行百分比:给出行变量百分比•列百分比:给出列变量百分比不需要加权个案的数据如果数据格式如下图(例:骨科数据)每一行都是一个个体,无需加权。如果分析4种病变节段在性别分布有无差异,如下图:将“性别”和“病变节段”分别拖入行变量和列变量,其他操作同需加权数据。•1.两独立样本率比较的卡方检验•2.配对计数资料的卡方检验•3.分层资料的卡方检验•4.卡方的两两比较2.配对计数资料的卡方检验•配对设计的特点是对同一样本的每一份样品分别用A、B两种方法处理,或者前后测量,观察其阳性和阴性例数。•文件chi_pair.sav为例•操作过程:分析统计描述交叉表行变量:treat_b列变量:treat_a统计量:McNemar•结果解释:所用方法是基于二项分布的McNemar检验,p=0.000(双侧),差异显著,即抗生素用于治疗呼吸道感染是有效的。使用系数分析吻合情况例:116例患者的诊断结果见下表及数据“diagnosis.sav”,使用kappa系数法分析影像CT诊断和病理诊断的吻合情况。•文件diagnosis.sav为例•操作过程:•分析•统计描述•交叉表•行变量:treat_b•列变量:treat_a•统计量:McNemarKappa结果解释:McNemar检验结果p=0.057,两法诊断结果差异无统计学意义两种诊断吻合系数为k=0.740,p=0.000,说明两种诊断方法的吻合度有统计学意义且较强。一般大于0.7表示吻合度较强。0.7~0.4一般,小于0.4表示较弱•1.两独立样本率比较的卡方检验•2.配对计数资料的卡方检验•3.分层资料的卡方检验•4.卡方的两两比较例:Doll和Hill以709例肺癌患者做病例、709个非肿瘤患者做对照,按性别分层,研究吸烟与肺癌的关系,调查结果如下表。试做肺癌的病例对照分析。如果不分层结果如下结果解释:p=0.002,差异具有统计学意义分层做法操作:(1)建立数据文件分层变量:选如“gender”(2)菜单选择统计量主对话框下风险Cochran’sandMantel-Haenszel统计量结果1:男性卡方检验p=0.000女性p=0.584结果2:风险估计,男性组OR=14.043,95%置信区间不包括1。女性OR=1.222,95%置信区间包括1。提示,对于男性而言吸烟史发生肺癌的危险因素,女性则不是。关于OR值•OddsRatio:相对危险度(也称比值比、优势比)•指病例组中暴露人数与非暴露人数的比值除以对照组中暴露人数与非暴露人数的比值。•涵义:暴露者的疾病危险度为非暴露者的多少倍。OR1说明疾病的危险度因暴露而增加,暴露与疾病为“正”关联。OR1说明疾病的危险度因暴露而减少,“负”关联•结果3:OR的均一性检验,用两种方法比较性别之间OR是否存在差异(p=0.001)。说明男性高于女性•结果4:又称协变量分析,将性别当做协变量,即剔除性别这个影响后吸烟与肺癌的关系。结果显示在剔除性别影响后,吸烟和肺癌仍然显著相关,即吸烟史导致肺癌的危险因素。•结果5:又称公共OR值估计,合并OR值为2.812,95%置信区间不包括1,且与1相比差异有显著性(p=0.000)•注意:经OR值均一性检验各层OR值有显著差异时,不宜计算公共OR值主要内容•1.两独立样本率比较的卡方检验•2.配对计数资料的卡方检验•3.分层资料的卡方检验•4.卡方的两两比较多个率间的多重比较•多个率比较的资料可以整理成多个2乘k表资料,若不经过任何处理,而直接进行两两比较,必须重新规定检验标准,其目的是为保证检验假设中I型错误的概率不变。•重新规定检验标准的估计方法有两种•1.多个实验组间的两两比较分析目的为k个实验组间,任两个率进行比较,公式如下'(1)/21kk'2(1)k例3个实验组间的两两比较,其检验水准用上面公式估计如下''0.01253(31)/212.实验组与同一个对照组的比较公式如下SPSS进行两两比较有两种方式1.第一种,直接通过“选择个案“来筛选数据。•第二种方法:SPSS语法修改。选择“黏贴”选项,进行修改。•通过修改个案选择和黏贴交叉表的语法•也可以直接进行交叉表语法的修改练习•练习一:某医院欲比较异梨醇口服液(实验组)和氢氯噻嗪+地塞米松(对照)降低颅内压的疗效。将200例颅内压增高患者随机分为两组。见下表。问两组降低颅内压的总体有效率有无差别•练习2:某医师研究物理疗法、药物治疗和外用膏药三种方法治疗周围性面神经麻痹的疗效。•问题1:三种疗法的有效率有无差别•问题2:如果三种疗法存在差异,是否任意两组疗法均有差别素材猫