第一节小总体情况——超几何分布第二节大总体情况——二项分布及大样本正态近似第二章总体比例的检测和置信区间教学重点根据不同的总体和样本选用适当方法检验总体分布比例计算总体比例的置信区间估计(置信度为1-α)第一节小总体情况——超几何分布在总体量N较小时检测总体比例用超几何分布。Hyper(x,k,N-k,n),其中,x和k分别是样本或总体中具有某种特征的个体数;N和n分别是总体和样本数;同时,π=k/N和π0=x/n分别是总体和样本中具有某种特征的比例。例2.1:p26,学生赞成“骑自行车在校门口应该下车”的比例检测。假设样本n=50,其中只有1人赞成该下车,问能否说“至少有10%的学生赞成下车的规定”?第一节小总体情况——超几何分布首先,计算样本中赞成的比例π0=x/n=1/50=0.02,显然低于10%,因此我们有理由怀疑总体中赞成的比例不会超过10%,这样可以建立如下假设:H0:π=π0=0.1H1:ππ0=0.1第一节小总体情况——超几何分布其次,假设总体量不大,N=400,应该用超几何分布Hyper(x,k,N-k,n)来检测,如此原假设就等价于如下假设H0:k=40与H1:k40而超几何分布的模型为Hyper(1,k,400-k,50),需要计算x≤1的概率p值,即0p=P(X1)(,40,40040,50)40400-4040400-40050-0150-10.026374004005050xipi第一节小总体情况——超几何分布对于通常的显著性水平α=0.05,可以拒绝零假设,得出支持出入下车的学生比例不足10%的结论。下面进一步计算k的100(1-α)%置信区间(k1,k2),或者π=k/N的100(1-α)%置信区间(π1,π2)=(k1/N,k2/N)。上限k2为满足不等式的最小的k;下限k1为满足不等式的最大的k。参见p29的表。0(,,,)(,,,)/2xiPxkNknpikNkn0(,,,)(,,,)1/2xiPxkNknpikNkn第二节大总体情况—二项分布及大样本正态近似当总体量N很大时,超几何分布Hyper(x,k,N-k,n)用二项分布Bin(n,π)近似。例2.1(续)检验假设不变,二项分布的模型是Bin(50,π),在零假设成立时为Bin(50,0.1)。下面计算至少有1人不赞成的概率P(x≤1)的值按二项分布的公式得p值为i0P()(1),(0)xininXxini1i0050149P(1)(1)50500.10.90.10.90.0337901ininXi第二节大总体情况—二项分布及大样本正态近似因此,对于通常的显著性水平α=0.05,可以拒绝零假设,得出支持出入下车的学生比例不足10%的结论。下面进一步计算在二项分布假定下,总体比例π的100(1-α)%置信区间(π1,π2).其上限π2应为满足不等式的π;下限π1应为满足不等式的π。计算后例2.1中π的95%的置信区间为(0.000506,0.106469)0n(1)/2xiniiin(1)/2niniixi第二节大总体情况—二项分布及大样本正态近似例2.2:随机调查多所大学的1752个学生,有979个支持减少必修课。能否说该市高校中有多于50%的学生都支持减少必修课的建议?能否找到支持这个建议的人数总体比例π的95%置信区间?这是一个大总体、大样本的问题。要检验的假设为:H0:π=0.5与H1:π0.5如果用二项分布模型Bin(1752,π),要计算x=979及更极端情况的概率P(x≥979)作为p值。175217529791752P(X979)0.50.54.718694070.00000iiiie第二节大总体情况—二项分布及大样本正态近似因此,即使对于通常的显著性水平α=0.001,也可以拒绝零假设,得出大部分支持减少必修课的结论。同时可以计算出π的95%置信区间为(0.53517,0.58221).正态近似:在样本量n很大时,可用均值为nπ,方差为nπ(1-π)的正态分布来对二项分布Bin(n,π)近似.这时,检验的假设为H0:π=π0对单边或双边的H1。检验统计量000(1)nnZn第二节大总体情况—二项分布及大样本正态近似把观察到的=x/n代入检验统计量Z,就得到Z的实现:对应的p值=φ(z)≈1-φ(4.92153)≈0.0000.如果考虑连续性修正对应的p值=1-φ(z)≈0.0000.和不修正差不多。00097917920.54.92153(1)17520.50.5xnzn0000.54.897639(1)xnzn而总体比例π的95%置信区间为即例2.2的总体比例π的95%置信区间为(0.5232666,0.5693673),和二项分布得到的区间大体相同。小结:p35/2(1)zn第二节大总体情况—二项分布及大样本正态近似符号检验(二项检验)在excel中的运用例:某种超常记忆训练法声称可以让80%的普通学生在1个小时内掌握60个单词,现随机抽取20个学生进行训练,其单词记忆个数如图16.1中列B所示,试检验该训练法的成功(1小时掌握60个单词)概率是否能达到0.8(α=0.05)?H0:H1:其操作步骤为:1.在AB列输入原始数据;2.将原始数据转换为二项数据,在C2输入=IF(B2=60,1,0),拖拉填充句柄往下一直复制到C21处;符号检验(二项检验)在excel中的运用3.计算成功的学生数,在F2输入=COUNTIF(C2:C21,=1);4.计算未成功的学生数,在F3输入=COUNTIF(C2:C21,=0);5.计算试验次数n,在F4输入=F2+F3。(一)双侧检验。6.在F8单元输入=BINOMDIST(F2,F4,F5,1),得单侧概率,为计算双侧概率,在单元F9输入=F8*2。由于双侧概率为0.173,大于给定的显著水平0.05,不是小概率事件,因此接受H0,即认为该训练法的成功概率没达到0.8。符号检验(二项检验)在excel中的运用也可以计算成功次数的临界值,然后根据n(1)是否超出临界值域,从而作出判定。7.计算临界值上下限,在F11输入上限公式=CRITBINOM(F4,F5,1-F6/2),在F12输入下限公式=CRITBINOM(F4,F5,F6/2)。用b1代表下限,b2代表上限,因显著水平α=0.05,所以两侧各占0.025,在二项累计概率公式中应分别指定为0.025和0.975。计算得下限b1=12,上限b2=19,由成功次数n(1)=13,在临界值范围内,因此接受H0,认为其成功概率可以没达到0.8。符号检验(二项检验)在excel中的运用(二)单侧检验(左侧)如果选择左侧检验,则只需计算下限b1,显著水平应指定0.05。8.在F15输入下限公式=CRITBINOM(F4,F5,F6)。得下限b2=13,由于n(0)≤b1,因此接受H0,即不能认为成功概率达到0.8。(三)右侧检验如果选择右侧检验,显著水平应指定1-0.05=0.95。9.在F18输入下限公式=CRITBINOM(F4,F5,1-F6)。得下限b2=19,由于n(1)<b1,因此接受H0,即认为成功概率没达到0.8。二项分布检验的SPSS软件使用说明二项分布:在现实生活中有很多的取值是两类的,如人群的男和女、产品的合格和不合格、学生的三好学生和非三好学生、投掷硬币的正面和反面。这时如果某一类出现的概率是P,则另一类出现的概率就是1-P。这种分布称为二项分布。实例1:掷一枚比赛用的挑边器31次,变量tbh,1为出现A面、2为出现A面,试问这挑边器是否均匀。数据data12-03(31个cases)。Analyze-NonparametricTests-BinomialTestVariable:tbh二项分布检验的SPSS软件使用说明由于这是一个均匀分布检测,使用默认选择(TestProportion:0.5);比较有用的结果:两组个数和sig=1.000.5,不能拒绝零假设,认为挑边器是均匀。实例1的数据可以组织成:两个变量(side面和number次数),2个cases。但在二项分布检验前要求用number加权。结果同。补充:二项分布检验实例实例:为验证某批产品的一等品率是否达到90%,现从该批产品中随机抽取23个样品进行检测,结果有19个一等品(1-一等品,0-非一等品)。(变量2个:一等品和个数,Cases2个:119和04)加权:Data-WeightCases:个数Analyze-NonparametricTests-BinomialTestVariable:一等品TestProportion:0.9比较有用的结果:两组个数和sig=.1930.5,不能拒绝零假设,认为该批产品的一等品率达到了90%。