第七章抽样调查

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第七章抽样调查一、教学目的与要求通过本章的学习,使学生了解抽样调查的概念、特点、作用等,掌握抽样平均误差、极限误差、区间估计、样本容量的确定和对总量指标的推算。二、教学内容第一节抽样调查的意义一、抽样调查的概念二、抽样调查的特点三、抽样调查的作用第二节抽样调查的基本概念及理论依据一、全及总体和抽样总体全及指标和抽样指标三、抽样方法四、抽样调查的理论依据第三节抽样平均误差一、抽样误差的概念二、抽样平均误差的意义三、影响抽样平均误差的因素四、平均误差的计算第四节总体指标的推断一、极限误差二、可信程度三、抽样推断第五节样本容量的确定和对总量指标的推算一、必要样本容量的确定二、总体总量指标的推算第六节抽样方案设计一、抽样方案设计的基本原则二、简单随机抽样三、类型抽样四、机械抽样五、整群抽样三、重点与难点抽样误差、抽样估计及样本容量的确定。四、教学方法多媒体教学五、学习方法掌握本章内容的方法在于理解的基础上加以记忆。2六、计划安排课时4~6课时七、作业统计学原理习题集第七章抽样调查第一节抽样调查的意义一、抽样调查的概念抽样调查是非全面调查,它是按照随机原则从调查对(总体)中抽取一部分单位进行调查,用调查所得指标数值对调查对象相应指标数值作出具有一定可靠性的的估计和推断的一种统计调查方法。我国的抽样调查应用主要有:⒈国家和地方统计部门一系列抽样调查制度:1%人口抽样调查、城市和农村住户调查、农产量抽样调查等。三支调查队:城市社会经济调查总队、农村社会经济调查总队、企业调查总队。⒉其他政府部门、社会团体和学术团体妇女生育力调查(国家计划生育委员会)公众科学素养调查(全国科协)语言与文字使用情况调查(教育部与国家语委)⒊专业调查咨询机构央视调查咨询中心、北京华通现代信息咨询有限公司、北京零点市场调查与分析公司等。二、抽样调查的特点⒈只抽取总体中一部分单位进行调查;⒉用一部分部位的指标值去推断总体的指标值;⒊抽取部分单位要遵循随机原则;⒋抽样误差可以计算,并且可以控制。三、抽样调查的作用⒈有破坏性、不可能进行全面调查的事物可进行抽样调查;⒉全面调查实际办不到的事物可进行抽样调查;⒊节省人力、费用和时间,方式灵活;⒋可对总体进行推断。3第二节抽样调查的基本概念及理论依据一、全及总体和抽样总体㈠总体⒈概念:研究对象的全体。⒉总体的分类总体按各单位标志性质不同,可分为:⑴变量总体:各单位可用数量标志计量。①无限总体:变量值无限,分为可列或连续。②有限总体:变量值有限。⑵属性总体:各单位用品质标志描述。⒊总体单位数:N㈡样本⒈概念:将从总体中抽取的部分单位称为样本⒉样本的大小:大样本超过30,小样本小于30⒊样本的容量:n二、全及指标和抽样指标㈠总体指标:根据总体各单位标志值计算的、反映总体属性的指标。主要有:总体平均数NXX总体方差NXX22总体标准差NXX2㈡抽样指标:根据样本各单位标志值计算的、反映样本属性的指标。主要有:样本平均数nxx总体方差nxxi22总体标准差nxxi2在属性总体中,设N1个单位具有某种属性,N0个单位不具有某种属性,则NNP1,NNQ0称为总体成数。nnp1,nnq0称为样本成数。PP1称为总体是非标志标准差。4pp1称为样本是非标志标准差。有些社会经济现象,只表现为两种性质上的差异,例如,产品的质量表现为合格或不合格,对某一电视节目,观众表现为收看或不收看,学生成绩表现为及格或不及格等等,这些只表现为是或否、有或无的标志称为交替标志,也称作是非标志。㈠成数。总体中,交替标志只有两种表现,我们把具有某种表现或不具有某种表现的单位数占全部总体单位数的比重称为成数。若p和q分别表示具有与不具有某种标志的成数,则同一总体两种成数之和等于1。用公式表示为:p+q=1或q=1-p㈡交替标志的平均数。交替标志表现了现象质的区别,因此计算期平均数首先需要将交替标志的两种表现进行量化处理。用“1”表示具有某种表现,用“0”表示不具有某种表现,则:xfxfxx2xxfxx2是1pp1-p21ppp21非01-p00-p2ppp12合计11p-------------pppp1122ppfxfx1㈢交替标志的标准差。qqpppqppppffxx11111222注意:在有些书上,样本标准差用s表示在计算器上,有σ和s按钮,σ代表总体标准差,S代表样本标准差。12nxxs在EXCEL“数据分析”“描述统计”中计算的样本方差即是按上面公式计算的。三、抽样方法抽样方法按抽取样本的方式不同分为重复(置)抽样和不重复(置)抽样。㈠重复(置)抽样:是从全及总体抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现后,把它放回到全及总体中去,再从全及总体中随机抽取第二个样本单位,记录它的有关标志表现后,也把它放回全及总体中去,照此下去直到抽选第n个样本单位。可见重置抽样时:①总体单位数在抽选过程中始终不变;5②总体中各单位被抽中的可能性前后相同;③总体中各单位有被重复抽中的可能。㈡不重复抽样:是从全及总体抽取样本时,随机抽取一个样本单位,记录该单位有关标志表现后,这个样本单位不再放回全及总体参加下一次抽选;然后,从总体N-1个单位中随机抽取第二个样本单位,记录它的有关标志表现后,该单位也不放回全及总体中去,从总体N-2个单位中抽取第三个样本单位,照此下去直到抽选出第n个样本单位。可见,不重置抽样时:①总体单位数在抽选过程中逐渐减少;②总体中各单位被抽中的可能性前后不断变化;③总体中各单位没有被重复抽中的可能。四、抽样调查的理论依据大数法则:随着抽样单位数n的增加,抽样平均数x有接近总体平均数X的趋势,几乎具有实际的必然性。中心极限定理:如果总体变量存在有限的平均数和方差,则不论这个总体变量的分布如何,随着抽样单位数n的增加,抽样平均数的分布便趋于正态分布。第三节抽样平均误差一、抽样误差的概念㈠抽样误差的一般概念。抽样误差是指样本指标与总体指标之间的差距。表示为:Xx、Pp。㈡统计调查误差种类按产生的原因分,统计调查误差可分为登记性误差和代表性误差。登记性误差是指统计调查时,由于主观原因在登记、汇总、计算、过录中所产生的误差。登记性误差不论全面调查或非全面调查都可能产生。代表性误差又可分为两种:系统性误差和随机误差。系统性误差又称偏差,它是由于抽样调查没有遵循随机原则而产生的误差。只要遵循随机原则就可以避免。随机误差又称偶然的代表性误差,它是指没有登记性误差的前提下,又遵循了随机原则所产生的误差。随机误差是抽样调查固有的误差。抽样误差是指这种随机误差。抽样平均误差抽样实际误差抽样误差偶然的代表性误差随机误差偏差系统性误差代表性误差登记性误差统计调查误差抽样误差包括抽样实际误差和抽样平均误差两种。6抽样实际误差是指某一样本指标与被它估计的总体指标产差数。抽样平均误差,从一般意义上说是所有抽样实际误差的平均水平。确切地说,抽样平均误差是所有样本指标(样本平均数和样本成数)的标准差。二、抽样平均误差的意义抽样平均误差是一系列抽样指标的标准差。样本可能数目2XExx例:总体为2、3、4,从总体中按重复抽样抽出两个单位组成样本。序号样本总量样本平均数2xx[1][2]122212232.50.25324304322.50.25533306343.50.25742308433.50.2594441103333求抽样平均误差就是求所有可能样本平均数的标准差。用计算器求2、2.5、3、2.5、3、3.5、3、3.5、4的标准差得577.0x即为抽样平均误差。三、影响抽样平均误差的因素⒈全及总体标志的变动程度()全及总体标志变异程度大,抽样平均误差大;反之,全及总体标志变异程度小,抽样平均误差小。⒉样本单位标志的变异程度(S)⒊样本容量(n)的多少样本容量愈大,抽样平均误差愈小;反之,样本容量愈小,抽样平均误差愈小。⒋抽样组织的方式有简单随机抽样、类型抽样、整群抽样、机械抽样等。四、抽样平均误差的计算㈠抽样平均数的抽样平均误差前面已经举例说明了直接按照可能抽样平均数求标准差的方法计算,但该方法太繁。可以证明:7⒈在重复抽样下抽样平均误差nxσ为总体标准差,n为样本单位数,在总体标准差未知,且样本单位数较大时,可以用样本标准差代替。例:从40、50、70、80中抽取3个组成样本,在重复抽样下,求抽样平均误差。⒈求总体标准差,直接用计算器统计功能键可以求出:81.152NXX13.9381.15nx⒉求抽样平均误差⒈在不重复抽样下抽样平均误差Nnnx12σ为总体标准差,n为样本单位数,N为总体单位数。例:从40、50、70、80中抽取3个组成样本,在不重复抽样下,求抽样平均误差。⒈求总体标准差,直接用计算器统计功能键可以求出:81.152NXX27.51434381.15122NnNnx㈡抽样成数的抽样平均误差前面已经介绍过抽样成数的概念,总体成数是总体中具有某种属性的单位占所有单位的比重,用P表示,不具有某种属性的比重用Q表示;样本中具有某种属性用p表示,不具有某种属性用表示。可以证明:总体平均数=P总体标准差PPP1样本标准差ppp1求样本平均数和样本成数的抽样平均误差。使用时间(小时)抽查灯泡个数(个)组中值900以下2875900~9504925950~1000119751000~105071102581050~11008410751100~11501811251150~1200711751200以上31225合计200⒈求灯泡平均使用时间、标准差和灯泡合格率(样本)1057fxfx63.532nxx⒉求灯泡使用时间抽样平均误差:小时79.320063.53nx在重复抽样下抽样平均误差在不重复抽样下抽样平均误差小时75.310000200120063.53122Nnnx⒊求灯泡合格率的抽样平均误差:%5.91200183p在重复抽样下抽样平均误差%97.1200085.0915.01nppp在不重复抽样下抽样平均误差%95.1100002001200085.0915.011Nnnppp第四节总体指标的推断一、抽样极限误差㈠概念:抽样极限误差是指总体指标和抽样指标之间误差的可能范围。⒈抽样平均数的抽样极限误差XxxPpp⒉抽样成数的抽样极限误差㈡总体范围的估计9若有了抽样极限误差,则总体平均数和总体成数的可能范围可以用下式估计:⒈抽样平均数的范围xxxXx⒉抽样成数的极限误差pppPp例:要估计一批产品的合格率,从1000件产品中抽取200件,其中有10件不合格品,如果确定抽样极限误差的范围为2%,试估计产品合格率的范围。样本成数p=190/200=95%总体成数下限=95%-2%=93%总体成数上限=95+2%=97%即该产品合格率在93%~97%之间。㈢抽样极限误差与抽样平均误差的关系抽样极限误差通常用抽样平均误差的倍数表示,即xxtpptt称为概率度。二、可信程度可信程度是表示估计的可靠程度如果估计区间越大,则可靠程度越大;估计区间越小,则可靠程度越小。而估计区间又与抽样极限误差有关,在一定的抽样方式下,抽样极限误差又是由概率度t决定的。因而可靠程度与t之间有一定正比关系。概率度t与概率保证程度(可靠程度)之间的关系见表。概率度t误差范围(△)概率F(t)概率度t误差范围(△)概率F(t)0.50.50.38291.961.960.95001.001.000.6827

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功