1第十一章抽样法2第一节抽样法的意义和作用一、抽样法的特点•抽样法在统计调查和统计分析中都有广泛的应用。•抽样法是按照随机原则从全部研究对象中抽取一部分单位进行观察,并依据所获得的数据对全部研究对象的数量特征做出具有一定可靠性的估计判断,从而达到对全部研究对象的认识的一种统计方法。3抽样法的基本特点:(1)根据部分实际资料对全部总体的数量特征作出估计。•通过抽样调查,取得部分单位的实际材料,据以计算抽样的综合指标,然后对于总体的规模、水平、结构指标作出估计。4•(2)按随机的原则从全部总体中抽选样本单位。•(3)抽样推断的抽样误差可以事先计算并反加以控制。•抽样推断是以部分资料推算全体,虽然存在一定的抽样误差,但它可以事先通过一定资料加以计算,并且能够采取一定的组织措施来控制这个误差范围,保证抽样准断的结果达到一定的可靠程度。5二、抽样法的作用•第一,对某些不可能进行全面调查而又要了解其全面情况的社会经济现象,必须应用抽样法。•如,工业生产中检验某些产品的质量时,常常具有破坏性。如轮胎的里程检验、灯泡的寿命检验,纱布的强力检验、炮弹的杀伤力检验等。•有些现象的总体过大,单位过于分散,进行全面调查实际上是不可能的,例如要检验水库的鱼苗数,森林的木材积蓄丝等。6•第二,对某些社会经济现象虽然可以进行全面调查.但抽样法仍然有其独到的作用,例如:•抽样调查可以节省人力、费用,提高调查的经济效果。•抽样调查可以节省时间,提高调查的时效性。•抽样调查由于调查单位少,调查队伍经过专门训练,可以增加调查项目,取得比较详细的资料,并且提高资料的准确性。7•第三,抽样调查和全面调查同时进行,可以发挥相互补充和检查质量的作用。•第四,抽样法可以用于工业生产过程的质量控制。•第五,利用抽样法原理,还可以对于某种总体的假设进行检验,来判断这种假设的真伪,决定行动的取舍。8三、抽样法的理论基础(一)大数法则•就数量关系来说,抽样推断是建立在概率论的大数法则基础上,大数法则的一系列定理为抽样推断提供了数学依据。9•大数法则即关于大量的随机现象具有稳定性质的法则。它说明如果被研究的总体是由大量的相互独立的随机因素所构成,而且每个因素对总体的影响都相对地小,那么对这些大量因素加以综合平均的结果,因素的个别影响将相互抵消,而显现出它们共同作用的倾向,使总体具有稳定的性质。10•联系到抽样推断来看,大数法则证明:如果随机变量总体存在着有限的平均数和方差,则对于充分大的抽样单位数n,可以几乎趋近于l的概率,来期望抽样平均数与总体平均数的绝对离差为任意小,即对于任意的正数。有:11(二)中心极限定理•大数法则论证了抽样平均数趋近于总体平均数的趋势,这为抽样推断提供了重要的依据。但是,抽样平均数和总体平均数的离差究竟有多大?离差不超过一定范围的概率究竞有多少?这个离差的分市怎样?大数法则并没有在这方面给出什么信息。•这个问题要利用另一重要的定理,即中心极限定理来研究。中心极限定理证明:如果总体变量存在有限的平均数和方差,那么不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋近于正态分布。12INTRODUCTIONTOINFERENTIALSTATISTICS•Statisticalinferenceistheprocessofmakinggeneralizationaboutapopulationfromasample.Sincemostofthecharacteristicsofapopulationcanbedescribedbyparameters,inferentialstatisticsprimarilydealswiththeestimationofanunknownpopulationparameterfromthecorrespondingsamplestatistic.withtheverificationwhetherabelieforhypothesisaboutaparameterissupportedbythesampleevidence.EstimationHypothesistesting(E.g.:Weestimateprobabilitymeasuresfromrelativefrequencies.)(E.g.:Webelievethattheprobabilityofaneventis0.2andusingjustasamplewewanttofindoutwhetherthisisareasonableassumption.)13Ex1:Supposeweareinterestedinthefollowingpopulation:X={1,2,3,4,5).a)Sincethisisaverysmallpopulation(Nx=5),itiseasytoobservethewholepopulation,toillustrateitwitharelativefrequencyhistogramandtofindtheparameters,likethepopulationmeanandthepopulationvariance.3xand22x(Checkthedetails.)•Thekeyconceptbehindthesestatisticalproceduresistheprobabilitydistribution,calledsamplingdistribution,ofasamplestatistic.Asummaryofallpossiblevaluesofastatisticalongwiththecorrespondingprobabilities.PopulationofX0.000.050.100.150.200.2512345141234512345b)Thoughthesecalculationswerereallysimple,assumethat,forsomereason,wedonotobservethewholepopulation,butdrawallpossiblesamplesofsizetwo(n=2)withreplacement.Thereare25possiblesamples.Theyareshowninthefirstrowandfirstcolumnofthetablebelow.1stdraw(x1)2nddraw(x2)1.0Computethesamplemeanfromeachofthesesamples.(E.g.:Ifx1=1andx2=4,x-baris2.5.)2.53.52.02.53.01.52.02.53.03.52.02.53.03.54.03.03.54.04.53.01.54.04.55.0xThesesamplemeanvaluesformasecondpopulation,X-bar1.251xN31x121x(Checkthedetails.)15c)Repeatpartbassumingthistimethatsamplingiswithoutreplacement.123451-1.52.02.53.021.5-2.53.03.532.02.5-3.54.042.53.03.5-4.553.03.54.04.5-1stdraw(x1)2nddraw(x2)x202xN32x75.022xThesesamplemeanvaluesformathirdpopulation,X-bar2.(Sincesamplesaredrawnwithoutreplacement,thesamenumbercannotturnuptwice.)16d)ComparetheX,X-bar1andX-bar2populationstoeachother.XX-bar1X-bar2Size(N)52520Mean(μ)333Variance(σ2)210.75i.X-bar1andX-bar2arelargerpopulationsthanX.ii.X,X-bar1andX-bar2havethesamemean.iii.XhasthebiggestvarianceandX-bar2hasthesmallest.TheseresultssuggestthatItiseasierto‘guess’X-bar2thanX-bar1orX.17Apartfromtheirmeansandvariances,theX-bar1andX-bar2populationscanalsobecharacterizedbytheirshapes.Notehowever,thatnxx222211and115252275.0222xxxxNnNn(TheserelationshipsbetweenthevariancesofX,X-bar1andX-bar2arevalidingeneral.)PopulationofX-bar10.000.050.100.150.200.251.01.52.02.53.03.54.04.55.0PopulationofX-bar20.000.050.100.150.200.251.52.02.53.03.54.04.5TheserelativefrequencyhistogramsaregraphicalrepresentationsoftheX-bar1andX-bar2samplingdistributions.Apparently,bothsamplingdistributionsaresymmetricalaroundµ=3.Nevertheless,theyaredifferentfromeachother,andbothofthemaredifferentfromthedistributionofX.18•Howtotakeasample?Inthisexampletheoriginalpopulation,X,isverysmall,sowecouldeasilycalculatethepopulationmean,μx.Therewasnorealneedtodrawsamples.•Inpractice,however,thetargetpopulationisusuallymuchlarger.Thepopulationaboutwhichwewanttodrawinferences.Sinceitmightbeimpossibleorimpracticaltoobservethewholepopulation,wedrawasample.Itisnotnecessarilythesamethanthesampledpopulation,i.e.thepopulationfromwhichweactuallytakethesample.–Thesamplemustberepresentative,i.e.itmusthavesimilarattributesthanthepopulationitself.Inordertoobtainreliableinformationfromasample–Thetargetandsampledpopulationsshouldbeverysimilar,orthesameifpossible.19Evenasmallsampleislikelytogiveusfairlyaccurateinformationaboutthepopulation.(E.g.thesamplemeancanbeexpectedtobeclosetothepopulationmean.)Ifthesampleitemsareselectedrandomly,thesampleislikea‘scaled-dow