2020/7/9马金凤bluerui123456@sina.com.cnpage111Chi-squaretest卡方检验2020/7/9Chi-squareTestpage2引言populationsample随机抽样statisticparameter2020/7/9Chi-squareTestpage3引言统计分析Statisticalanalysis统计描述Statisticaldescription统计推断Statisticalinference统计图statisticalgraph统计指标statisticaltarget参数估计estimationofparameters假设检验Hypothesistest统计表statisticaltable2020/7/9Chi-squareTestpage4引言假设检验Hypothesistest计量资料的假设检验计数资料的假设检验等级资料的假设检验卡方检验Chi-squaretestt检验方差分析2020/7/9Chi-squareTestpage5引言假设检验Hypothesistest计量资料的假设检验计数资料的假设检验等级资料的假设检验卡方检验Chi-squaretestt检验方差分析2020/7/9Chi-squareTestpage6卡方检验Chi-squaretest读作chi2卡方2检验(chi-squaretest)是现代统计学的创始人KarlPearson(1857-1936)于1900年提出的一种具有广泛用途的计数资料的统计推断方法。2020/7/9Chi-squareTestpage7卡方检验Chi-squaretest用途:两个样本率或多个样本率的比较两个构成比或多个构成比的比较关联性检验拟合优度检验等2020/7/9马金凤bluerui123456@sina.com.cnpage82分布和拟合优度检验2020/7/9Chi-squareTestpage9卡方检验Chi-squaretest2检验是一种具有广泛用途的计数资料的统计推断方法。2检验的理论依据2分布chisquaredistribution拟合优度检验goodnessoffittest2020/7/9Chi-squareTestpage102分布chisquaredistribution2分布是一种连续型随机变量的概率分布若有k个相互独立的标准正态分布随机变量Z1、Z2、…、Zk,则其平方和(Z12+Z22+…+Zk2)的分布称为服从自由度v=k的2分布,记为:2(v)2020/7/9Chi-squareTestpage11若Z服从标准正态分布,那么Z2服从自由度为1的2分布记作2(1)图形:从纵轴某个点开始单调下降,先凸后凹。0.00.10.20.30.40.5RejectionArea2分布chisquaredistributionv=12020/7/9Chi-squareTestpage122分布chisquaredistribution0.00.10.20.30.40.50369121518卡方值纵高自由度=1自由度=2自由度=3自由度=62/)12/(2222)2/(21)(ef2020/7/9Chi-squareTestpage132分布chisquaredistribution2分布是一簇单峰正偏态分布曲线,2取值范围为0~∞。2分布的形状依赖于自由度ν的大小。当自由度ν>2时,随着ν的增加,曲线逐渐趋于对称。当自由度ν趋于∞时,2分布逼近正态分布。2界值表(教材附表9)0.00.10.20.30.403691215v=1v=4v=6v=92020/7/9Chi-squareTestpage14拟合优度检验goodnessoffittest根据样本的频率分布,检验其总体分布是否服从于某种分布(正态分布、Poisson分布等)基本思想是判断实际频数(actualfrequency)和理论频数(theoreticalfrequency)的差别是否由抽样误差所引起2020/7/9Chi-squareTestpage15拟合优度检验goodnessoffittest拟合优度检验(goodnessoffittest)实际频数用A表示,根据H0确定的理论频数用T表示,则构造的2统计量为:TTA22)(2020/7/9Chi-squareTestpage16拟合优度检验goodnessoffittest拟合优度检验(goodnessoffittest)2值的大小反映了实际频数与理论频数的吻合程度。在H0成立的条件下,实际频数与理论频数相差不应该很大,即2值不会太大;若一次抽样得到的2值超过的预先规定检验水准所对应的2界值,则有理由怀疑H0的成立TTA22)(2020/7/9Chi-squareTestpage17拟合优度检验goodnessoffittest例1判断表1所示数据是否服从正态分布?表1136例体模骨密度测量值频数分布组段实际频数A1.228~21.234~21.240~71.246~171.252~251.258~371.264~251.270~161.276~41.282~1合计1362020/7/9Chi-squareTestpage18拟合优度检验goodnessoffittest例1判断表1所示数据是否服从正态分布?对该数据作正态分布拟合优度检验。136例体模骨密度测量值的均数=1.260标准差=0.010检验的假设:H0:总体分布为均数为1.260,标准差为0.010的正态分布H1:总体分布不服从该正态分布2020/7/9Chi-squareTestpage19表2136例体模骨密度测量值频数分布表及拟合优度检验统计量的计算组段(1)实际频数A(2)φ(L)(3)Φ(U)(4)P(X)(5)T=n×P(X)(6)(A—T)2/T(7)1.228~20.000690.004660.003970.54053.941431.234~20.004660.022750.018092.46010.086051.240~70.022750.080760.058017.88890.100161.246~170.080760.211860.1311017.82940.038591.252~250.211860.420740.2088828.40830.408921.258~370.420740.655420.2346831.91670.809611.264~250.655420.841340.1859225.28550.003221.270~160.841340.945200.1038614.12440.249061.276~40.945200.986100.040905.56180.438581.282~10.986100.997440.011351.54340.19130合计136————6.26692拟合优度检验goodnessoffittest2020/7/9Chi-squareTestpage20计算统计量:推断结论:自由度=10-1-2=7,查附表8,得到,P>0.50,可以认为该样本服从正态分布。35.627,50.022()6.27ATT计算T时的参数有2个(均数和标准差)拟合优度检验goodnessoffittest2020/7/9Chi-squareTestpage21拟合优度检验goodnessoffittest判断样本观察频数是否与某一理论频数相符,即了解样本是否来自某理论分布类别或组段观察频数(A)理论频数(T)1A1T12A2T23A3T34A4T4………kAkTk2020/7/9Chi-squareTestpage221、建立检验假设H0:样本对应的总体分布服从给定的理论分布H1:样本对应的总体分布不服从给定的理论分布2、确定检验水准a=0.053、计算检验统计量2值反映了样本实际频数分布与理论总体分布的符合程度。如果原假设成立,2值不会太大;反之,A若与T差距大,2值也大;当2值超出一定范围时,就有理由认为原假设不成立。4、确定相应的概率P5、作出推断结论拟合优度检验goodnessoffittest总体参数的个数122kTTA2020/7/9Chi-squareTestpage23练习某医学院校医生随机抽取100名一年级医学生,测定空腹血糖值(mmol/L),其频数分布如右表中第(1)栏和第(2)栏所示,试用检验判断该资料是否符合正态分布。Xf空腹血糖值频数2.65~52.95~53.25~43.55~193.85~124.15~124.45~244.75~105.05~55.35~5.654合计1002020/7/9马金凤bluerui123456@sina.com.cnpage24独立样本2×2列联表资料的2检验2020/7/9Chi-squareTestpage25完全随机化设计两样本率比较例2将病情相似的169名消化道溃疡患者随机分为两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?表两种药物治疗消化道溃疡患者4周后的疗效处理愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.052020/7/9Chi-squareTestpage26完全随机化设计两样本率比较例2将病情相似的169名消化道溃疡患者随机分为两组,分别用洛赛克与雷尼替丁两种药物治疗,4周后疗效见下表。问两种药物治疗消化道溃疡的愈合率有无差别?表两种药物治疗消化道溃疡患者4周后的疗效药物愈合未愈合合计愈合率(%)洛赛克64(57.84)21(27.16)8575.29雷尼替丁51(57.16)33(26.84)8460.71合计1155416968.052020/7/9Chi-squareTestpage27完全随机化设计两样本率比较原始数据四格表(2×2表)数据普通四格表的基本形式表1普通四格表的基本形式group+-totalAaba+bBcdc+dtotala+cb+dn2020/7/9Chi-squareTestpage28完全随机化设计两样本率比较基本思想:可通过卡方检验的基本公式来理解理论频数的计算理论数T的计算是在假设检验H0成立的条件下,用两样本合计率来估计的。TTA22)(nnnTCR2020/7/9Chi-squareTestpage29完全随机化设计两样本率比较(1)建立检验假设H0:两药的有效概率相同H1:两药有效概率不同(2)检验水准=0.05(3)计算检验统计量=(2-1)(2-1)=1TTA22565.656.6)56.611(44.28)44.2824(44.8)44.84(56.36)56.3641(222221212020/7/9Chi-squareTestpage30完全随机化设计两样本率比较(4)确定P值查附表8,2界值表,20.05,1=3.84,P0.05。(5)结论:按检验水准,拒绝H0,接受H1,两样本频率的差异有统计学意义。可认为洛赛克、雷尼替丁两种药物治疗消化道溃疡的效果有差别。鉴于洛赛克的治愈率是75.29%,雷尼替丁的愈合率为60.71%,可以认为洛赛克的愈合率比雷尼替丁的愈合率高。2020/7/9Chi-squareTestpage31完全随机化设计两样本率比较四格表资料2检验专用公式dbcadcbanbcad22药物愈合未愈合合计洛赛克64(a)21(b)85(a+b)雷尼替丁51(c)33(d)84(c+d)合计115(a+c)54(b+d)1692020/7/9Chi-squareTestp