财务管理统计学第八章抽样推断

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第八章抽样推断第一节抽样推断概述第二节抽样的组织方式第三节抽样误差第四节参数估计2抽样调查研究SamplingStudy为什么要抽样?1.涉及破坏受试对象质量控制2.取得精确可靠的结果3.实际情况的约束时间、成本等3基本要求:抽样推断是统计研究中一种重要的分析方法。通过本章的学习,要求掌握利用样本统计资料来推断总体数量特征的原理及方法;深刻理解抽样推断的概念及特点;了解抽样误差产生原因,对抽样误差、抽样平均误差、抽样极限误差加以区别,掌握抽样平均误差、抽样极限误差的计算;掌握点估计和区间估计的方法;掌握必要样本单位数的确定方法。了解假设检验的基本方法。4第一节抽样推断概述一、抽样推断的概念及特点(一)概念按随机原则从总体中抽取部分单位,根据这部分单位的信息对总体的数量特征进行科学估计与推断的方法。包括抽样调查和统计推断抽样调查:一种非全面调查,按随机原则从总体中抽取部分单位进行调查以获得相关资料,以推断总体统计推断:根据抽样调查所获得的信息,对总体的数量特征作出具有一定程度的估计和推断。5(二)特点按随机原则(等可能性原则)抽取调查单位根据部分推断总体的数量特征抽样推断的结果具有一定的可靠性和准确性,抽样误差可以事先计算和控制6不可能进行全面调查时不必要进行全面调查时检查生产过程正常与否对全面调查资料进行补充修正时抽样估计的应用7二、若干基本概念(一)总体与样本总体:研究对象的全体。个体:组成总体的每个元素。样本:从总体中抽取的一部分个体。样本容量:样本中个体的个数。一般说来,总体是唯一的,而样本是不唯一样本容量大于30的称为大样本,反之,即为小样本.8(二)总体参数和样本参数1.总体参数(1)含义:是描述总体数量特征的指标,是唯一的(2)总体参数总体均值:总体成数:总体标准差:fxfxN1NNP1ffxNx22))((92.样本参数(1)含义:是描述样本数量特征、用来推断总体数量特征的指标。由于样本是随机的,所以样本统计量也是随机的。(2)样本参数样本均值:样本成数:样本标准差:fxfnxxnnp11)1)(22ffxxnxxS(10第二节抽样的组织方式简单随机抽样类型抽样机械抽样整群抽样多阶段抽样11应用仅适用于单位数不多、标志变异较小、分布较均匀的总体是最简单、最基本、最符合随机原则,但同时也是抽样误差最大的抽样组织形式1.简单随机抽样(纯随机抽样)——对总体单位逐一编号,然后按随机原则直接从总体中抽出若干单位构成样本12总体N样本n最佳分配法等比例抽取2NkN1N1n2nkn······能保证分布的均匀性,提高样本的代表性,误差较小;能同时推断总体指标和各子总体的指标——将总体全部单位分类,形成若干个类型组,然后从各类型中分别抽取样本单位组成样本。2.类型抽样经济分配法133.等距抽样(机械抽样或系统抽样)——将总体单位按某一标志排序,而后按一定的间隔抽取样本单位。······随机起点半距起点对称起点(总体单位按某一标志排序)按无关标志排队,其抽样效果相当于简单随机抽样;按有关标志排队,其抽样效果相当于类型抽样。144.整群抽样(集团抽样)—将总体全部单位分为若干“群”,然后随机抽取一部分“群”,被抽中群体的所有单位构成样本例:总体群数R=16样本群数r=4hlpdnnnnnABCDEFGHIJKLMNOPLHPD样本容量简单、方便,能节省人力、物力、财力和时间,但其样本代表性可能较差155.多阶段抽样——指分两个或两个以上的阶段来完成抽取样本单位的过程例:在某省100多万农户抽取1000户调查农户生产性投资情况。第一阶段:从该省所有县中抽取5个县第二阶段:从被抽中的5个县中各抽4个乡第三阶段:从被抽中的20个乡中各抽5个村第四阶段:从被抽中的100个村中各抽10户样本n=100×10=1000(户)16第三节抽样误差一、抽样误差概述1.统计误差:有调查误差和代表性误差之分,代表性误差有偏差和随机误差之分。2.抽样误差:在遵守随机原则的条件下,用抽样指标代表全及指标不可避免的误差,不包括调查误差和系统性误差在内的随机误差抽样误差不是唯一的。173.影响抽样误差的因素(1)抽样单位数的多少(2)总体各单位标志值的变异程度(3)不同的抽样组织方式和方法。不重复抽样误差<重复抽样误差说明:抽样误差是样本统计量和总体参数之间的绝对差异,是不可测量的.但抽样误差的大小可以依据概率分布理论加以说明18(一)抽样平均误差指每一个可能样本的估计值与总体指标值之间离差的平均数,即样本估计量的标准差MiixXxM121式中:为样本平均数的抽样平均误差;为可能的样本数目;为第个可能样本的平均数;为总体平均数xiXixM1)(2nxxS注意:不要混淆抽样标准差与样本标准差!19(二)抽样平均误差的计算公式nnx2NnnNnNnx1122⒈样本平均数的抽样平均误差当N很大时,有NnNnNNnN11重复抽样时:不重复抽样时:20⒉样本成数的抽样平均误差nPPp1NnnPPNnNnPPp1111重复抽样时:不重复抽样时:当N很大时,有NnNnNNnN1121关于总体方差的估计方法用过去同类问题全面调查或抽样调查的经验数据代替;用样本标准差代替总体标准差,用代替。spsP1122ffxxnxx或ppnn11当n较大时,n-1≈n22例:对某企业某时期生产的2号电池的电流强度进行1‰的抽样检查:电流强度电池数组中值xf4.5以下4.5—5.05.0—5.55.5—6.06.0—6.56.5以上245139314.254.755.255.756.256.758.519267.75224.2518.756.751.22×20.72×40.22×510.32×390.82×31.32×1合计100—54514fxx2)(23解:平均电流强度为:电流强度的标准差:电流强度的平均误差:)(45.5100545Afxfx)(374.010014)(2AffxxS)(0374.0100374.0AnSx24按规定,2号电池的电流强度必须5A以上才合格,则该批电池的合格率为:标准差:成数的平均误差:%94100941nnp237.0)94.01(94.0)1(ppS%37.20237.010006.094.01nPPp25各种组织方式的抽样平均误差简单随机抽样前面的平均误差的计算都是建立在此基础上.机械抽样(等距抽样)其抽样误差不仅取决于全及总体的标志变动度,还取决于各个抽样间隔的标志变动度。采用纯随机抽样公式(不重复抽样)计算抽样误差。26类型抽样(分层抽样)抽样平均误差不仅取决于样本容量,还取决于各类型组组内方差的平均数。重复抽样:类型抽样的平均误差一般小于同样容量的纯随机抽样的平均误差。nx2nnii22不重复抽样:)1(2Nnnx27例:某市对居民在一年内某类消费品的消费支出进行了类型抽样,调查结果如下表:类别全部居民(户)N调查户数(户)n平均消费支出(元)标准差(元)城镇农村45018025109607502240合计630359002828各类方差平均数:抽样平均误差为:85.80235104025222222nnii元)(79.43585.8022nx29整群抽样采用不重复抽样方法(1)平均数的抽样误差为:(2)成数的抽样平均误差:2222)(1,1xxrRrRrixxxx即为平均数的群间方差,其中,2222)(1,1pprRrRripppp为成数的群间方差,即其中,30抽样极限误差指在一定的概率保证程度下,抽样误差不允许超过的某一给定范围,也称作允许误差、误差范围等1.抽样平均数的极限误差:2.抽样成数的极限误差:xXxpPp31由于提高把握程度,会增大允许误差,使估计精度降低,而缩小允许误差,提高估计的精度,又会降低估计的把握程度,所以在实际中应根据具体情况,先确定一个合理的把握程度再求相应的允许误差或先确定一个允许误差范围再求相应的把握程度。32抽样极限误差的计算公式(大样本条件下)xxz样本平均数的极限误差:⒈样本成数的极限误差:⒉ppzZ为概率度,是给定概率保证程度下样本均值偏离总体均值的抽样平均误差的倍数。33Z与相应的概率保证程度存在一一对应关系,常用Z值及相应的概率保证程度为:z值概率保证程度1.000.68271.650.90001.960.95002.000.95452.580.99003.000.9973134dtextZZ22212Z2Z22135221975.02105.0,95.01x应查,则若确定了保证程度dtextx2221标准正态分布函数值表362Z2Z96.1025.02,05.02ZxP得到,则查若确定了显著性水平212dtexPtx222137第四节参数估计一、点估计(一)点估计的概念及特点参数估计:以样本统计量对总体参数进行估计,有点估计和区间估计两种。点估计:直接以样本统计量作为相应的总体参数的估计量。点估计的优点:直接给出了总体参数的具体数值缺点:未能反映误差的大小38参数点估计有:(1)样本均值估计总体均值(2)样本成数估计总体成数(3)样本方差估计总体方差xˆpPˆ22ˆS39(二)估计量优劣的衡量标准设为待估计的总体参数,为样本统计量,则的优良标准为:ˆˆ若,则称为的无偏估计量ˆ)ˆ(E指样本指标的均值应等于被估计的总体指标无偏性40若,则称为比更有效的估计量2ˆ1ˆ21ˆˆ作为优良的估计量,除了满足无偏性的要求外,其方差应比较小有效性指随着样本单位数的增大,样本估计量将在概率意义下越来越接近于总体真实值n一致性若对于任意ε0,有1ˆlimPn41二、区间估计指根据样本指标和抽样极限误差以一定的可靠程度推断总体指标的可能范围;其中,被推断的总体指标的下限与上限所包括的区间称为置信区间,估计的可靠程度也称为置信度。42区间估计步骤:1.计算样本统计量2.计算抽样平均误差3.计算极限误差4.确定置信区间5.估计总量指标注意抽样方法的不同px,nppnpx)1(,ppxx22ppxxppxx,,NPXN43【例A】某企业生产某种产品的工人有1000人,某日采用不重复抽样从中随机抽取100人调查他们的当日产量,要求在95﹪的概率保证程度下,估计该厂全部工人的日平均产量和日总产量。区间估计的应用44按日产量分组(件)组中值工人数(人)110~114114~118118~122122~126126~130130~134134~138138~14211211612012412813213614037182321186433681221602852268823768165605887006489284648600784合计—100126004144xfxffxx2100名工人的日产量分组资料45解:件件44.61004144126100126002ffxxsfxfx件611.01000100110044.6122Nnnsx46件2.1611.096.1xxZ则该企业工人人均产量及日总产量的置信区间为:XXN2.112610002.112610

1 / 61
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功