统计7抽样推断

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2019/8/21扬州大学管理学院1第七章抽样推断第一节抽样推断的意义第二节抽样误差第三节抽样推断的方法第四节抽样调查的组织方式2019/8/21扬州大学管理学院2一、抽样推断的概念和特点1、概念:抽样推断是按随机原则从全部研究对象中抽取部分单位(样本)进行观察,并根据样本的实际数据对总体的数量特征作出具有一定可靠程度的估计和判断。第一节抽样推断的意义2019/8/21扬州大学管理学院32、意义:(1)有些现象是无法进行全面调查的,为了测算全面资料,必须采用抽样调查的方法。例如,对无限总体不能采用全面调查。另外,有些产品的质量检查具有破坏性,不可能进行全面调查,只能采用抽样调查。第一节抽样推断的意义(2)从理论上讲,有些现象虽然可以进行全面调查,但实际上没有必要或很难办到,也要采用抽样调查。2019/8/21扬州大学管理学院4(3)抽样调查的结果可以对全面调查的结果进行检查和修正。第一节抽样推断的意义(5)利用抽样调查原理,可以对某些总体的假设进行检验,来判别这种假设的真伪,依决定行动的取舍。(4)抽样调查可以用于工业生产过程的质量控制。2019/8/21扬州大学管理学院53、特点:(1)它是由部分推断整体的一种认识方法。(2)抽样推断建立在随机取样的基础上。(3)抽样推断运用概率估计的方法。(4)抽样推断的抽样误差是不可避免的,但可以事先计算并加以控制。第一节抽样推断的意义2019/8/21扬州大学管理学院6二、统计推断内容1.统计学:描述统计学:研究如何全面收集被研究客观事物的数据资料并进行简缩处理,描述其群体特征和数量规律性。推断统计学:研究如何有效地收集和使用被研究客观事物的不完整并且带有随机干扰的数据资料,以对其群体特征和数量规律性给出尽可能精确、可靠的推断性结论。2019/8/21扬州大学管理学院72.推断统计参数估计:由对部分进行观测取得的数据对研究对象整体的数量特征取值给出估计方法。假设检验:由对部分进行观测取得的数据对研究对象的数量规律性是否具有某种指定特征进行检验。2019/8/21扬州大学管理学院8统计推断的过程样本总体样本统计量如:样本的平均数、比例、方差2019/8/21扬州大学管理学院9(一)全及总体和样本总体全及总体(Population)是所要研究的对象,又称母体,简称总体,它是指所要认识的,具有某种共同性质的许多单位的集合体。全及总体单位数(N)一般很大。三、有关抽样的基本概念2019/8/21扬州大学管理学院10又称子样。是从全及总体中随机抽取出来的,做为代表这一总体的部分单位组成的集合体。样本单位总数用“n”表示。样本选取的基本原则:代表性:样本的每个分量都与总体有相同的分布独立性:样本的每个分量都是相互独立的样本(Sample):2019/8/21扬州大学管理学院11随着样本容量的增大,样本对总体的代表性越来越高,并且当样本单位数足够多时,样本平均数愈接近总体平均数。对于一次抽样调查,全及总体是唯一确定的,样本总体不是这样,样本是不确定的,一个全及总体可能抽出很多个样本总体,样本的个数和样本的容量有关,也和抽样的方法有关。2019/8/21扬州大学管理学院12(二)参数和统计量参数:指反映总体数量特征的综合指标。参数研究总体中的数量标志总体平均数总体方差X=∑XNX=∑XF∑FΣ(X-X)N2σ=2Σ(X-X)FΣF2σ=2研究总体中的品质标志总体成数成数方差σ2=P(1-P)P=N1N2019/8/21扬州大学管理学院13统计量:根据样本数据计算的综合指标。研究数量标志样本平均数x=∑xnx=∑xf∑f样本标准差研究品质标志样本成数成数标准差np=nnxxsx2ffxxsx2ppsp12019/8/21扬州大学管理学院14(三)样本容量和样本个数样本容量:一个样本包含的单位数。用“n”表示。一般要求n≥30大样本样本个数:从一个全及总体中可能抽取的样本数目。(四)重复抽样和不重复抽样重复抽样:又称回置抽样。不重复抽样:又称不回置抽样。考虑顺序时,可能组成的样本数目:不考虑顺序时,可能组成的样本数目:nNnnNC1考虑顺序时,可能组成的样本数目:不考虑顺序时,可能组成的样本数目:nNCnNP2019/8/21扬州大学管理学院15抽样方法不重复抽样考虑顺序不考虑顺序432是否考虑顺序11考虑顺序的重复抽样;2不考虑顺序的重复抽样;3考虑顺序的不重复抽样;4不考虑顺序的不重复抽样。重复抽样2019/8/21扬州大学管理学院16)!(!!!)1()2)(1(!nNnNnnNNNNnPCnNnNNNNNCCCCNNNNNnN1111)1()2()1(1112111nNNNNCCCCPnNNNNnN)!1(!)1(1NnnNCnnN!2019/8/21扬州大学管理学院17四、抽样推断的理论基础1、抽样推断的理论基础:大数(定律)法则大数定律即关于大量的随机现象具有稳定性质的法则。它说明如果被研究的总体是由大量的相互独立的随机因素所构成,而且因素对总体的影响都相对地小,那么对这些大量因素加以综合平均的结果,因素的个别影响将相互抵消,而呈现出它们共同作用的倾向,使总体具有稳定的性质。2019/8/21扬州大学管理学院18大数定律证明,如果随机变量总体存在着有限的平均数和方差,则对于充分大的抽样单位为n,可以以几乎趋近于1的概率,来期望平均数与总体平均数的绝对离差为任意小,即对于任意的正数a有:式中:为抽样平均数;为总体平均数;n为抽样单位数。2019/8/21扬州大学管理学院192、抽样推断的理论基础:中心极限定理人们已经知道,在自然界和生产实践中遇到的大量随机变量都服从或近似服从正态分布,正因如此,正态分布占有特别重要的地位。那么,如何判断一个随机变量服从正态分布显得尤为重要。如经过长期的观测,人们已经知道,很多工程测量中产生的误差X都是服从正态分布的随机变量。在什么条件下,,这是十八世纪以来概率论研究的中心课题,因而,从二十世纪二十年代开始,习惯上把研究随机变量和的分布收敛到正态分布的这类定理称为中心极限定理(CentralLimitTheorems))(limxxYPnn2019/8/21扬州大学管理学院20(林德伯格—莱维(Lindeberg-Lévy)中心极限定理)设是一相互独立同分布随机变量序列,则对任意的实数,总有}{nX,2,1,0,,22iDXEXii2111211limlimd()2nnnxtiiiiiinnniiXEXXnPxPxetxnDX2019/8/21扬州大学管理学院21本定理的证明在20世纪20年代由林德伯格和莱维给出,因证明较复杂,在此从略。由定理可知,当n充分大时,)1,0(~1NnnXnii近似),(~21nnNXnii近似),(~121nNXnnii近似由于它对的分布形式没有要求,因而得到广泛使用。}{nX2019/8/21扬州大学管理学院22第二节抽样误差一、抽样误差二、抽样平均误差三、抽样极限误差四、抽样误差的概率度2019/8/21扬州大学管理学院23第二节抽样误差一、抽样误差的含义(一)统计误差有两种:1、登记性误差:由于调查整理过程中登记错误和计算不准而产生的。2、代表性误差:由于用样本资料代表总体资料而产生的,全面调查中不存在这种误差,其中由于不按照随机原则抽样造成的误差为系统性误差,由于随机抽样的偶然因素使样本各单位的结构不足以代表总体各单位的结构,而引起抽样指标和全及指标之间的绝对离差为抽样误差。2019/8/21扬州大学管理学院24(二)影响抽样误差大小的因素1、总体各单位标志值的变异程度2、样本的单位数3、抽样方法4、抽样推断的组织形式2019/8/21扬州大学管理学院25二、抽样平均误差1、概念:抽样平均误差是抽样平均数或抽样成数的标准差。反映了抽样平均数与总体平均数抽样成数与总体成数的平均误差程度。2、计算方法:抽样平均数的平均误差抽样成数平均误差(以上两个公式实际上就是第四章讲的标准差。但反映的是样本指标与总体指标的平均离差程度)MXxix2MPpip22019/8/21扬州大学管理学院26抽样平均数平均误差的计算公式:采用重复抽样:此公式说明,抽样平均误差与总体标准差成正比,与样本容量开方成反比。(当总体标准差未知时,可用样本标准差代替)通过计算可说明以下几点:①样本平均数的平均数等于总体平均数。②抽样平均数的标准差仅为总体标准差的③可通过调整样本单位数来控制抽样平均误差。nxn12019/8/21扬州大学管理学院27例题:假定抽样单位数增加2倍、0.5倍时,抽样平均误差怎样变化?解:抽样单位数增加2倍,即为原来的3倍则:抽样单位数增加0.5倍,即为原来的1.5倍则:577.0313nx8165.05.115.1nx即:当样本单位数增加2倍时,抽样平均误差为原来的0.577倍。即:当样本单位数增加0.5倍时,抽样平均误差为原来的0.8165倍。2019/8/21扬州大学管理学院28采用不重复抽样:公式表明:抽样平均误差不仅与总体变异程度、样本容量有关,而且与抽样方法有关。例题一:随机抽选某校学生100人,调查他们的体重。得到他们的平均体重为58公斤,标准差为10公斤。问抽样推断的平均误差是多少?例题二:某厂生产一种新型灯泡共2000只,随机抽出400只作耐用时间试验,测试结果平均使用寿命为4800小时,样本标准差为300小时,求抽样推断的平均误差?Nnnx122019/8/21扬州大学管理学院29例题一解:)(110010公斤nx即:当根据样本学生的平均体重估计全部学生的平均体重时,抽样平均误差为1公斤。例题二解:)(15400300小时nxNnnx12)(42.13200040014003002小时计算结果表明:根据部分产品推断全部产品的平均使用寿命时,采用不重复抽样比重复抽样的平均误差要小。已知:10,58,100sxn则:已知:300,4800,400,2000sxnN则:2019/8/21扬州大学管理学院30抽样成数平均误差的计算公式采用重复抽样:采用不重复抽样:例题三:某校随机抽选400名学生,发现戴眼镜的学生有80人。根据样本资料推断全部学生中戴眼镜的学生所占比重时,抽样误差为多大?例题四:一批食品罐头共60000桶,随机抽查300桶,发现有6桶不合格,求合格品率的抽样平均误差?nppp1Nnnppp112019/8/21扬州大学管理学院31例题三解:已知:400n801n则:样本成数%20400801nnp02.04008.02.01nppp即:根据样本资料推断全部学生中戴眼镜的学生所占的比重时,推断的平均误差为2%。2019/8/21扬州大学管理学院32例题四解:已知:60000N300n61n则:样本合格率98.030063001nnnp(%)808.030002.098.01npppNnnppp11(%)806.060000300130002.098.0计算结果表明:不重复抽样的平均误差小于重复抽样,但是“N”的数值越大,则两种方法计算的抽样平均误差就越接近。2019/8/21扬州大学管理学院33三、抽样极限误差含义:抽样极限误差指在进行抽样估计时,根据研究对象的变异程度和分析任务的要求所确定的样本指标与总体指标之间可允许的最大误差范围。计算方法:它等于样本指标可允许变动的上限或下限与总体指标之差的绝对值。=Δp│p

1 / 60
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功