假设检验基础:单样本检验学习目标•假设检验的基本原则•如何用假设检验均值和比例•如何评价假设检验中的假设,以及违背时的后果•如何避免假设检验的缺陷•假设检验中的道德问题原假设和备择假设原假设一般都是根据统计经验的事先判断,然后去证明是否符合这个假设,如果不符合那么就是备择假设,统计学原理中的假设检验只能回答是还是不是,而不是如何,怎么样,这样多种选择的问题。例如方差检验中原假设是各均值都相等,备择假设是各均值不全相等。什么是原假设政府统计数据Example:美国家庭的户均拥有电视台数是3。()关注在是总体信息,而不是样本信息3μ:H03μ:H03X:H0原假设和备择假设的重要观点检验统计量的临界值•假设检验方法背后的逻辑是根据样本得出的信息确定原假设是正确的可能性。•如果统计值和总体参数的假设值之间有很大的差距,那么可以设为原假设是错误的。•通常情况下不那么清晰,如何确定近似还是差距大是很主观的,缺乏明确的定义。假设检验的方法给出了如何衡量差距的明确定义。•检验统计量的抽样分布通常是服从普遍的抽样分布的,像标准正态分布,t分布等,可以通过这些分布来确定原假设是否正确。假设检测•总体均值是50–H0:μ=50,H1:μ≠50•从总体中抽样,并统计其均值总体样本•如果样本均值与总体均值接近,那么原假设成立,不被拒绝。•如果样本均值与总体均值相差很大,则原假设被拒绝。•差距多大才能认为足够满足拒绝原假设H0呢?SamplingDistributionofXμ=50IfH0istrueIfitisunlikelythatyouwouldgetasamplemeanofthisvalue......thenyourejectthenullhypothesisthatμ=50.20...Wheninfactthiswerethepopulationmean…X拒绝域和接受域•检验统计量的抽样分布成两个区域,一个是拒绝域,也叫否定域,一个是接受域。•如果检验统计值落在接受域之内,就不能拒绝原假设;如果检验统计值是落在拒绝域之内,则就要拒绝原假设。拒绝域和接受域临界值距样本均值的距离太远拒绝域拒绝域接受域•拒绝域是由原假设为真时检验统计量不大可能出现的值所组成的。原假设错误时,这些值更有可能发生。因此检验统计值落在了拒绝域内,就可以拒绝原假设。假设检验方法的风险假设检验方法的风险检验的功效:与第II类错误概率互补的是(1-β),叫做统计检验的功效。统计检验的功效(1-β):是你拒绝原假设,而实际上该假设也是错误的或应该被拒绝的概率。假设检验和决策假设检验和决策统计决策实际情况H0为真H0为假没有拒绝H0正确判断概率=(1–α)第II类错误的概率=β拒绝H0第I类错误的概率=α正确决策的功效=(1–β)第I类错误和第II类错误的关系第I类错误和第II错误不能同时发生第I类错误只能在原假设H0为真时发生第II类错误只能在原假设H0为假时发生如果第I类错误的概率(),那么第II类错误的概率(β)影响第II类错误的因素•Allelseequal,–βwhenthedifferencebetweenhypothesizedparameteranditstruevalue–βwhen–βwhenσ–βwhenn显著信水平和拒绝域显著信水平=αThisisatwo-tailtestbecausethereisarejectionregioninbothtailsH0:μ=3H1:μ≠3临界值拒绝域α/20α/2均值的Z假设检验(σ已知)检验统计量是:nσμXSTATZσKnownσUnknown均值的假设检验已知未知(Z检验)(t检验)假设检验示例美国家庭户均拥有电视3台(假设σ=0.8)1.写出原假设和备择假设H0:μ=3H1:μ≠3(这属于双尾检验)2.选择显著性水平和样本容量显著性水平:=0.05和样本容量:n=1003.因为σ已知,可以使用服从正态分布的Z检验统计量4.确定拒绝域因为=0.05所以Z检验的临界值为±1.96假设检验示例(续)5.收集样本数据,计算检验统计量的值n=100,X=2.84(σ=0.8)所以检验统计量是:2.0.08.161000.832.84nσμXSTATZ假设检验示例(续)拒绝H0接受H0•6.判断这个检验值是否在拒绝域内?/2=0.025-Zα/2=-1.960如果ZSTAT-1.96或ZSTAT1.96,拒绝H0,否则接受H0/2=0.025拒绝H0+Zα/2=+1.96这里,ZSTAT=-2.0-1.96,所以检验值是在拒绝域内假设检验中的p值法P值检验示例美国家庭户均拥有电视3台(假设σ=0.8)1.写出原假设和备择假设H0:μ=3H1:μ≠3(这属于双尾检验)2.选择显著性水平和样本容量显著性水平:=0.05和样本容量:n=1003.因为σ已知,可以使用服从正态分布的Z检验统计量P值检验示例(续)2.0.08.161000.832.84nσμXSTATZ4.收集数据,计算检验值和p值假设样本数据是n=100,X=2.84(σ=0.8)计算检验统计量:P值检验示例(续)4.(续)计算p值•为了计算检验统计量在标准差之外的概率,要计算Z值大于或小于+2.0和-2.0的概率P值=0.0228+0.0228=0.0456P(Z-2.0)=0.02280-2.0Z2.0P(Z2.0)=0.0228P值检验示例(续)•5.p值α?–p值=0.0456α=0.05拒绝H0没有足够的证据支持电视在美国家庭的平均数等于3的结论假设检验(σ未知)•如果总体标准差未知,我们只能利用样本的标准差S来完成检验•因为这一变化,我们需要用t检验来替代Z检验,去检验原假设是否有效•当使用t分布时,我们需确认所抽样的总体是服从正态分布的•其他的步骤和方法就与前面的相同均值的t假设检验(σ未知)nSμXSTATtHypothesisTestsforσKnownσUnknownKnownUnknown(Ztest)(ttest)nSμXSTATtHypothesisTestsforσKnownσUnknownKnownUnknown(Ztest)(ttest)检验统计量:nSμXSTATt均值的假设检验σKnownσUnknown已知未知(Z检验)(t检验)例子(双尾检验,未知)H0:μ=168H1:μ168例解•=0.05•n=25•df=25-1=24•未知,使用t检验•临界值:±t24,0.025=±2.0639不能拒绝H0拒绝H0拒绝H0/2=.025-t24,0.025不拒绝H00/2=.025-2.06392.06391.462515.40168172.50nSμXSTATt1.46H0:μ=168H1:μ168t24,0.025采用p值法完成双尾T检验tTestfortheHypothesisoftheMeanNullHypothesisµ=168.00$LevelofSignificance0.05SampleSize25SampleMean172.50$SampleStandardDeviation15.40$StandardErroroftheMean3.08$=B8/SQRT(B6)DegreesofFreedom24=B6-1tteststatistic1.46=(B7-B4)/B11LowerCriticalValue-2.0639=-TINV(B5,B12)UpperCriticalValue2.0639=TINV(B5,B12)p-value0.157=TDIST(ABS(B13),B12,2)=IF(B18B5,Rejectnullhypothesis,Donotrejectnullhypothesis)DataIntermediateCalculationsTwo-TailTestDoNotRejectNullHypothesisP值α因此不能拒绝H0单尾检验•在很多情况,备注假设关注的是某一边的情况H0:μ≥3H1:μ3H0:μ≤3H1:μ3备择假设关注的是低于均值3的lower-tail备择假设关注的是高于均值3的upper-taillower-tail检测拒绝H0接受H0这里只有一个临界值,拒绝域只在一边存在-Zαor-tα0μH0:μ≥3H1:μ3ZortX临界值upper-tail检测拒绝H0接受H0Zαortα0μH0:μ≤3H1:μ3这里只有一个临界值,拒绝域只在一边存在临界值ZortX_例子:基于均值的Upper-Tailt检验(未知)一个电话公司的管理人员认为客户每月的电话费用在上升,现在平均每月的费用超过了$52,公司希望检测这种说法的可靠性(假设总体呈正态分布)H0:μ≤52每月电话费均值没有超过$52H1:μ52每月电话费均值超过$52形成假设检验:例解:找出拒绝域拒绝H0接受H0•假设置信水平:=0.10•此次检测的抽样样本n=25.找出拒绝域:=0.101.3180拒绝H0如果tSTAT1.318,拒绝H0例解:计算检验值假设检验样本得出如下结论:n=25,X=53.1,andS=10–检验统计量是:0.5525105253.1nSμXtSTAT例解:结论拒绝tH0接受H0=0.101.3180拒绝H0因为tSTAT=0.55≤1.318,不能拒绝H0没有足够的证据证明假设不成立tSTAT=0.55例:利用p值法检验•p值和进行比较拒绝H0=0.10接受H01.3180拒绝H0tSTAT=.55P值=0.2937因为p值=0.2937=0.10,因此不能拒绝H0例解:p值计算tTestfortheHypothesisoftheMeanNullHypothesisµ=52.00LevelofSignificance0.1SampleSize25SampleMean53.10SampleStandardDeviation10.00StandardErroroftheMean2.00=B8/SQRT(B6)DegreesofFreedom24=B6-1tteststatistic0.55=(B7-B4)/B11UpperCriticalValue1.318=TINV(2*B5,B12)p-value0.2937=TDIST(ABS(B13),B12,1)=IF(B18B5,Rejectnullhypothesis,Donotrejectnullhypothesis)DataIntermediateCalculationsUpperTailTestDoNotRejectNullHypothesis比例假设检验pμn)(1σp比例的假设检验•p抽样分布符合正态分布,所以单样本比例的Z检验ZSTAT值:n)(1pSTATZπππnπ5和n(1-π)5p概率假设nπ5或n(1-π)5后续章节介绍成功次数的比例Z检验•将分子和分母都乘以n,将Z检验统计量转换成成功次数X的形式:)(1nnXSTATZπππX5andn-X5成功次数的假设XX5orn-X5后续章节再介绍例:比例的Z检验(临界值法)Check:nπ=(500)(.08)=40n(1-π)=(500)(.92)=460求解=0.05n=151,p=0.5166在=0.05下,接受H0H0:π=0.5H1:π0.5临界值:±1.96TestStatistic:决策:结论:z0拒绝拒绝.025.0251.96-0.4069目前一半杂货商认为沃尔玛是最大竞争对手的说法与Z检验结论没有矛盾4069.0151.5).5(1.5.5166n)(1pZSTAT-1.96用p值法求解接受H0拒绝H0拒绝H0/2=.0251.960Z=-0.4069计算p值。然后与进行比较(对于双尾