SPSS确切概率法1.什么时候使用确切概率?当n很小时,因为不服从卡方分布(不能有单元格的期望小于1,不能有20%以上的单元格期望值小于5),所以不能用卡方检验,这时系统会在分析结果的最后给出警告(WARNING:50%ofthecellshaveexpectedcountslessthan5.Chi-Squaremaynotbeavalidtest),提示用户采用确切概率法分析。2.确切概率的思想是什么?fisher精确检验其思想是在固定各边缘和的条件下,根据超几何分布(见概率分布),可以计算观测频数出现任意一种特定排列的条件概率。把实际出现的观测频数排列,以及比它呈现更多关联迹象的所有可能排列的条件概率都算出来并相加,若所得结果小于给定的显著性水平(比如给定的显著水平为0.05),则判定所考虑的两个属性存在关联,从而拒绝h0。3.怎么操作?例1.(1)录入数据(1)加权:Data——WeightCases:Weightcaseby(选入“频数”)(3)卡方检验:Analyze——DescriptiveStatistics——Crosstabs:Row(选入性别),Column(选入咨询内容);点击Statistics:选择Chi-square;点击Continue,点击OK。见图3,4。4分析结果:χ2值与P值,依次看“Chi-SquareTests”表的第1行,红色字体部分。补充:第2行是校正的卡方值与P值,第4行是Fisher确切概率法计算的P值。通常规定:(1)当两组总样本量n≥40且所有的单元格的理论频数T≥5时,看第1行的结果;当P≈检验水准时,看第4行的结果。(2)当两组总样本量n≥40但有1≤理论频数T<5时,看第2行的结果;或者看第4行的结果。(3)当两组总样本量n<40,或最小理论频数T<1时,看第4行的结果。例2某研究者调查了一匹高血压患者的血压控制情况和肥胖度,数据见文件tables.sav,为列举格式。汇总如下表,试分析两者之间有无关系。(1)输入数据,由于table.sav为枚举格式,即一条记录代表一个病例。因此分析是无需调用WeightCases过程。由于轻度肥胖的三个格子频数都很少,它们的理论频数都小于5,故用确切概率法计算。(2)步骤:Analyze→DescriptiveStatistics→CrosstabsRow框:fatColumns框:controlStatistics:Chi-Square:ContinueOk血压控制情况Total良好尚可不良肥不肥胖胖程轻度肥胖度中/重度肥胖Total152412514271320131144393930108