4.统计学-三举例抽样与检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

4.统计学-三举例抽样与检验抽样分布例:甲、乙、丙三位学生统计学补考成绩分别为50、60、70分。从中随机抽取2位学生。在重置抽样、考虑顺序情况下:总体容量N=3;样本容量n=2一、做均值(平均成绩)估计1.总体分布:总体均值∑===60)()ExxPx(μ;总体方差3200)()()(22=-==∑xPxxDμσx~),(2σμN即:x~)320060,(N2.样本空间:甲甲、甲乙、甲丙、乙甲、乙乙、乙丙、丙甲、丙乙、丙丙对应的样本均值为:50、55、60、55、60、65、60、65、703.样本分布:如抽取到一个样本:甲乙,成绩分别为50、60。样本均值55==∑nxx;样本方差501)22=--=∑nxxs(4.抽样分布:样本均值的均值μ===∑60)()(xPxxE样本均值的方差3100232003100)()]([)(222=====-=∑nPEDxσσx~),(2nNσμ即:x~)23200,60(N上述样本均值的方差开平方根就叫抽样平均误差,即:nxσσ=二、做比率(及格率)估计1.总体分布:总体及格率∏=2/3;及格率总体方差92-12=∏∏=)(σ2.样本空间:甲甲、甲乙、甲丙、乙甲、乙乙、乙丙、丙甲、丙乙、丙丙对应的样本及格率为:0、1/2、1/2、1/2、1、1、1/2、1、13.样本分布:如抽取到一个样本:甲乙,成绩分别为50、60。样本及格率1=p;及格率样本方差41)1(2=-=pps4.抽样分布:样本及格率的均值∏====∑3296)()(pPppE样本及格率的方差9123132)1(91)()]([)(22=?=∏-∏===-=∑npPpEppDpσ上述样本及格率的方差开平方根就叫抽样平均误差,即:np)1(∏-∏=σ(三)参数估计举例例8.某工业企业报告期生产某种橡胶轮胎10000个,从中随机抽取0.5%进行耐磨性能检验,抽样结果如表5-7所示。据有关质量标准规定,在规定时间内的磨损量低于6000毫克(不含6000毫克)为正品。试以95%的概率估计全部产品的平均磨损量和正品率。表5-7解:已知样本容量n=5030为大样本,总体方差σ2未知,在大样本(n≥30)情况下,尽管总体方差未知,仍然可以采用2αZ代替)1,2(-ntα来近似建立总体均值的估计区间。已知1-α=95%,查正态分布概率表知205.0Z=1.96根据表5-7资料计算有:样本平均磨损量x=fxf∑∑=50288750=5775(毫克)平均磨损量的样本修正方差S2=15025000001)(2-=-∑-∑ffxx=51020.41样本正品率p=%92504650281251==+++=nni正品率的样本方差S2=p(1-p)=92%×(1-92%)=0.07361.总体均值估计(由于σ2未知,用S2代替)。(1)在重复抽样的条件下:平均磨损量的抽样平均误差xσ=n2σ≈ns2=5041.51020=31.94(毫克)抽样极限误差x?=xZσα2=1.96×31.94=62.61(毫克)总体平均磨损量μ=x±x?=5775±62.61=[5712.39,5837.61](毫克)即:可以95%的概率推断该批轮胎的平均磨损量在5712.39毫克至5837.61毫克之间。(2).在不重复抽样的条件下:平均磨损量的抽样平均误差xσ=)1(2--NnNnσ≈)1(2--NnNns=)1100005010000(5041.51020--=31.87(毫克)抽样极限误差x?=xZσα2=1.96×31.87=62.46(毫克)总体平均磨损量μ=x±x?=5775±62.46=[5712.54,5837.46](毫克)即:可以95%的概率推断该批轮胎的平均磨损量在5712.54毫克至5837.46毫克之间。2.总体比率估计(由于P(1-P)未知,用p(1-p)代替)。(1).在重复抽样条件下:正品率的抽样平均误差pσ=nP)-P(1≈npp)1(-=500736.0=3.84%抽样极限误差p?=pZσα2=1.96×3.84=7.53%总体正品率P=p±p?=92%±7.53%=[84.47%,99.53%]即:可以95%的概率推断该批轮胎的正品率在84.47%至99.53%之间。(2).在不重复抽样条件下:正品率的抽样平均误差pσ=)1(nP)-P(1--NnN≈)1(np)-p(1--NnN=%83.31100005010000500736.0=--?抽样极限误差p?=pZσα2p?=1.96×3.83%=7.51%总体正品率P=p±p?=92%±7.51%=[84.49%,99.51%]即:可以95%的概率推断该批轮胎的正品率在84.49%至99.51%之间。例9.某灯泡厂为提高产品竞争能力,对某灯泡生产线进行了技术革新。现从技术革新后生产的一批灯泡中随机抽样取20只,测得样本平均照明时间为4200小时,样本修正标准差为150小时,试以95%的概率推断该批灯泡的平均照明时间。解:样本容量n=20σ未知。已知S=150,x=4200,由1-α=95%,自由度V=n-1=20-1=19,查t分布表,有)19,205.0(t=2.093。平均照明时间的抽样平均误差xσ=nS=20150=33.54(小时)抽样极限误差x?=)1,2(-ntαns=2.093×33.54=70.20(小时)总体平均照明时间μ=x±x?=4200±70.20(小时)=[4129.8,4270.2]即:估计该批产品的平均照明时间在4129.8小时至4270.2小时之间,其概率保证程度为95%。例22.某企业从报告期生产的甲产品中随机抽取20件,测得其使用寿命的方差s2为310,该产品使用寿命服从正态分布,试以90%的概率估计产品使用寿命的总体方差。解:已知1-α=90%,由1-2α=0.95,2α=0.05,自由度v=n-1=20-1=19,查2χ分布表可得两个临界值2)1(,21--naχ=2)19(,95.0χ=10.117和2)1(,2-naχ=2)19(,05.0χ=30.144,所以有总体方差σ2在90%置信概率下的置信区间为:()()2)1(,21222)1(,2211----≤≤-nnSnSnααχσχ,即:144.30310)120(?-≤σ2≤117.10310)120(?-。205.7≤σ2≤612.8故以90%的概率估计产品使用寿命的总体方差在205.7至612.8之间;估计产品使用寿命的总体标准差在14.34小时至24.75小时之间。提问:在简单随机重复抽样方式下,若允许误差扩大一倍,则抽样单位数()A.只需原来的四分之一B.增加3倍C.只需原来的二分之一D.增加4倍正确答案:A提问:某企业在对产品质量正式开展抽样调查之前,做了三次小型试验抽样,得知三次的产品合格率分别为93%、95%、96%,则本次抽样调查确定抽样单位数计算比率方差时,应选择的合格率是()A.93%B.95%C.96%D.94.67%正确答案:A例24.某厂对生产的某牌号灯泡进行质量检验,根据过去各期抽样调查资料知道,一般来讲,灯泡平均照明时间的标准差为350小时,灯泡照明时间达到4800小时以上的灯泡所占比例为85%。现要求在保证概率达到95%的条件下,平均照明时间的极限误差不超过30小时,照明时间达到4800小时以上的灯泡所占比例的极限误差不超过3%。问报告期采用简单随机重复抽样方法,应抽多少只灯泡调查?解:已知σ=350,P=85%,x?=30,p?=3%,由1-α=95%,知2αZ=1.96,则:估计平均数的抽样单位数n1=2222xZ?σα=2223035096.1?=522.88(只),即:n1=523(只)。估计成数的抽样单位数n2=222)1(pppZ?-α=22%)3(%)851(%8596.1-??=544.23(只)。只入不舍n2=545只。答:为满足平均数和成数估计研究的需要,应抽取545只灯泡。2.检验规则对假设检验问题做出判断依据的主要规则有两种:一是临界值规则;二是P-值规则。(1)临界值规则在没有计算机的情况下,做假设检验,一般会选择临界值规则。临界值规则是指先确定出检验统计量(如Z或t)落入拒绝域所需的临界值[如:αZ(或2αZ)或者vt,α(或vt,2α)],再使用该值来检验假设的规则。根据所提出的显著性水平α标准(它是概率密度曲线的尾部面积)查表得到相应的检验统计量的数值,称作临界值,直接用检验统计量的观测值与临界值作比较,观测值落在临界值所划定的尾部(称之为拒绝域)内,便拒绝原假设;观测值落在临界值所划定的尾部之外(称之为不能拒绝域)的范围内,则认为拒绝原假设的证据不足。这种做出检验结论的方法,我们称之为临界值规则。如:在做均值或比率检验时,有如下临界值规则:对于双侧检验,若Z<2αZ,或t<vt,2α,则接受原假设H0,拒绝备择假设H1;若Z≥2αZ,或t≥vt,2α,则拒绝原假设H0,接受备择假设H1。对于左单测检验,若Z>-αZ,或t>-vt,α,则接受原假设H0,拒绝备择假设H1;若Z≤-αZ,或t≤-vt,α,则拒绝原假设H0,接受备择假设H1。对于右单测检验,若Z<αZ,或t<vt,α,则接受原假设H0,拒绝备择假设H1;若Z≥αZ,或t≥vt,α,则拒绝原假设H0,接受备择假设H1。(2)P-值规则用计算机进行假设检验,若使用统计软件,一定会见到P-值。在一个假设检验问题中,通过检验统计量计算的拒绝原假设H0的最小显著性水平称为P-值。它是进行检验决策的另一个依据。P-值显示了检验统计量的值在一定范围内出现的概率,P-值也被称为实测显著性水平。P-值是一个概率值,通过计算检验量得到,测量样本对原假设的支持(缺乏支持)的程度。如:对于双侧检验,检验统计量位于正态分布曲线两边尾部,说明对原假设缺乏支持。对于双侧检验,P-值是检验统计量的绝对值大于或等于样本所给出的检验统计量的绝对值的概率;对于左单侧检验,P-值是检验统计量小于或等于样本所给出的检验统计量的值(即具体样本观测值)的概率;对于右单侧检验,P-值是检验统计量大于或等于样本所给出的检验统计量的值(即具体样本观测值)的概率。显著性水平α值在P-值规则中被视为一个临界的概率值。P-值定义了可以拒绝原假设的最小α值。通常,小的P-值说明对原假设的支持的程度也较小。P-值小,表明通常根据样本结果不能得出原假设H0为真的结论。如果P-值小于所给定的显著性水平α,则认为原假设不太可能成立;如果P-值大于所给定的显著性水平α标准,则认为没有充分的证据否定原假设。因此,有如下P-值规则:对于单侧检验,若P-值>α,则接受原假设H0,拒绝备择假设H1;若P-值≤α,则拒绝原假设H0,接受备择假设H1。对于双测检验,若P-值>2α,则接受原假设H0,拒绝备择假设H1;若P-值≤2α,则拒绝原假设H0,接受备择假设H1。必须注意:在双侧检验时,一些统计软件包会将观测概率乘以2,再将该值作为P-值给出,此时就不需再将α除以2。因此,在采用P-值规则做假设检验时,一定要弄清楚计算机软件包是如何得到双测检验的P-值的。显然,P-值规则和临界值规则是等价的。在做检验时,只用其中一个规则即可。P-值规则较之临界值规则具有更明显的优点。这主要是:第一,它更加简捷;第二,在P-值规则的检验结论中,对于犯第一类错误的概率的表述更加精确。(一)总体方差已知,且为大样本时的一个正态总体均值检验例10:已知某化工厂的甲化学制品日产量x~N(880,212),现随机抽取了49天的日产量,测得平均日产量为871吨。如果估计方差没有变化,试问在显著性水平为5%下:1.可否认为现在的平均日产量仍与以往一样?2.如果生产设备未更新,可否认为现在的平均日产量将低于以往水平?3.如果生产设备已更新,可否认为现在的平均日产量将高于以往水平?解:已知日产量服从正态分布,总体方差2σ=212,以往水平μ=880,n=49大样本,x=871,α=0.05;1.关心平均日产量和以往880吨是否一样,故有双测:0H:μ

1 / 27
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功