第6章抽样推断本章主要内容第一节抽样推断的概述第二节抽样误差(自学)第三节抽样推断的方法——参数估计第四节抽样组织设计想一想ThinkingChallenge消费者协会接到消费者投诉,指控品牌纸包装饮料存在容量不足,有欺骗消费者之嫌。包装上标明的容量为250毫升。消费者协会从市场上随机抽取50盒该品牌纸包装饮品,测试发现平均含量为248毫升,小于250毫升。这是生产中正常的波动,还是厂商的有意行为?消费者协会能否根据该样本数据,判定饮料厂商欺骗了消费者呢?250ml抽样推断:从样本含有的信息中提取总体的信息一个轮胎制造商发明了一种新轮胎,这种轮胎的里程数超过了企业现有生产线上轮胎的里程数。为了对这种新型轮胎作出评估,管理人员需要对新型轮胎的平均里程作出估计。制造商选择了120个这种新型轮胎作为样本进行检验,检验结果的样本均值为36500英里。于是,该种新型轮胎平均里程的估计值为36500。某个政治团体的成员正考虑支持某一候选人竞选国会议员。为了决定是否参加即将到来的普选,政团领导者需要对登记选民中支持这一候选人的比率做一个估计。受时间和成本的限制,不可能与登记选民总体中的每一个都取得联系。于是,选取400个登记选民为样本。如果400个选民中有160个对该候选人表示支持,则登记选民中支持该候选人的比率的估计值为160/400=0.4参数估计在统计方法中的地位描述统计推断统计参数估计假设检验参数估计:通过样本的观察结果来推断总体参数的取值范围以及得到此结论的可靠程度。假设检验:根据样本所提供的信息,对总体的某些方面,如总体的分布类型、总体参数的性质等作出结论性的判断。基本做法:预先对总体参数的取值或总体分布形式作出假定,然后用样本数据来验证,从而作出是接受还是拒绝该假设的结论。统计方法例:某大学从该校学生中随机抽取100人,调查到他们平均每天参加体育锻炼的时间为26分钟。试以95%的置信水平估计该大学全体学生平均每天参加体育锻炼的时间(已知总体方差为36分钟)。例:某地区水土中缺乏一种微量元素,根据医学研究结果可知,人们如果摄取这种元素过少,脑功能可能受影响,因此可推测该地区儿童的智力水平可能低于一般水平。心理学家使用某一标准化智力检验方法,对该地区随机选取36名儿童进行智力测验,得到智力分数的平均值是94分,已知总体标准差为15分,问该地区儿童的智力水平是否和一般水平(100分)有明显差异?抽样推断的过程样本总体(参数待推断)样本统计量例如:样本均值、比例、方差抽样计算推断抽样分布:样本统计量(样本平均数或样本比率)的概率分布1.样本统计量服从什么理论分布?2.统计量抽样分布的参数与总体的参数有什么关系?核心概念两个基本点如果将抽取简单随机样本的过程看作一次试验,样本均值或比率就是试验结果的一个数值描述,即样本均值或样本比率就是一个随机变量。因此,也就有数学期望、方差和概率分布。第一节抽样推断的一般问题一、抽样推断的概念和特征二、抽样推断的应用范围三、抽样推断的内容四、有关抽样的基本概念和理论依据统计学第6章抽样推断第一节抽样推断的概述本章目录一、抽样推断的概念和特征1.抽样推断的含义抽样推断是根据随机原则从总体中抽取部分总体单位,以这一部分总体单位的实际数据推算总体相应数量特征的一种统计分析方法。随机原则指样本单位的抽取不受主观因素及其他系统性因素的影响,每个总体单位都有均等的被抽中机会。随机抽样的目的是使样本与总体同分布。统计学第6章抽样推断第一节抽样推断的概述统计推断全及总体指标:参数(未知量)样本总体指标:统计量(已知量)抽样推断《统计学》第6章抽样推断随机原则的实现抽签法是将总体中每个单位的编号写在外形完全一致的签上,将其搅拌均匀,从中任意抽选,签上的号码所对应的单位就是样本单位。随机数表法将总体中每个单位编上号码,然后使用随机数表,查出所要抽取的调查单位。计算机模拟法是将随机数字编制为程序存储在计算机中,需要时将总体中各单位编上号码,启用随机数字发生器输出随机数字,然后从总体中找到相应总体单位形成样本。并非所有的抽样估计都按随机原则抽取样本,也有非随机抽样总体随机样本非随机样本与总体分布特征相同与总体分布特征不同《统计学》第6章抽样推断2.抽样推断的特征(1)是由部分推算整体的一种认识方法(2)按随机原则抽取样本(3)运用概率估计的方法(4)抽样推断虽然存在一定的误差,但抽样误差可以事先计算并加以控制统计学第6章抽样推断第一节抽样推断的概述二、抽样推断的应用范围《统计学》第6章抽样推断1.对于一些具有破坏或损伤使用价值的检验调查方法,即被抽取的单位经过观测之后就失去了原有的形态或功能。(如灯泡耐用时间实验)2.反映不可能进行全面调查,而又要了解全面情况的社会经济现象总体的数量特征。(产品质量检验、商品市场占有率调查)3.对可进行全面调查的现象,抽样调查可取得事半功倍的效果,并有其独到的作用。(居民生活状况调查)二、抽样推断的应用范围《统计学》第6章抽样推断4.可以对全面调查资料进行补充和订正。(人口的抽样推断检查)5.可以用于工业生产过程的质量控制。6.可以对某种总体指标的假设进行检验,来判断这种假设的真伪,以决定取舍。三、抽样推断的内容1.抽样估计抽样估计是通过以样本数据对总体某一未知数量特征进行估计的一种统计分析方法。2.假设检验假设检验是根据研究的目的和要求,先对总体某一未知的数量特征作某种假设,然后根据样本数据对这一假设进行检验,以判断假设的真伪的一种统计分析方法。统计学第6章抽样推断第一节抽样推断的概述四、有关抽样的基本概念及理论依据1.全及总体和样本2.全及指标(总体参数)和抽样指标(统计量)3.重复抽样和不重复抽样统计学第6章抽样推断第一节抽样推断的概述(一)相关概念1.全及总体和样本统计学第6章抽样推断第一节抽样推断的概述全及总体又称总体或母体,是所要认识研究对象的全体,它由具有某种共同性质或特征的单位所组成。常用N表示全及总体的单位数目。样本又称样本总体、抽样总体或子样,是指从全及总体中按照随机原则抽取的那部分个体的组合。抽样总体的单位数称为样本容量,通常用n表示。1<n<N。n≥30称为大样本,n<30称为小样本.n/N称为抽样比。例如:在100万户居民中,随机抽取1000户居民进行家庭收支情况调查,其中的100万户居民就是全及总体,而被抽中的1000户居民则构成抽样总体。2.全及指标(总体参数)和抽样指标(统计量)统计学第6章抽样推断第一节抽样推断的概述(1)全及指标根据全及总体各个单位的标志值或标志特征所计算的反映总体某种属性的综合指标,又称总体参数。设样本中个样本单位,某项标志的标志值分别为,其中具有和不具有某种属性的样本单位数目分别为和个,则nnxxx,,210n1n①样本平均数(又叫样本均值):miimiiiniiffxxnxx111或指根据抽样总体各个单位的标志值或标志特征计算的综合指标,又被称为统计量,它是随机变量。(2)抽样指标《统计学》第6章抽样推断②样本单位标志值的标准差:③样本单位标志值的方差:miiimiiniifxxfsxxns121121111或miiimiiniifxxfsxxns12121221111或为自由度为的无偏估计2为的无偏估计pnnqnnp1,01④样本成数:⑤样本单位是非标志的标准差:pqnnppnnsp111⑥样本单位是非标志的方差:pqnnppnnsp1112为的无偏估计2P为的无偏估计P《统计学》第八章抽样推断ffxnxxPxp常用的参数常用统计量a.平均数:成数:b.方差:成数方差:ffXNXXffNXXXX222PXp)1(2PPpffnxxxx222)1(2PPp(2)常用的参数和统计量统计学第6章抽样推断第一节抽样推断的概述重复抽样从总体N个单位中随机抽取一个样本容量为n的样本,每次从总体中抽取一个,并把结果登记下来,又放回总体中重新参加下一次的抽选。又称放回抽样不重复抽样每次从总体中抽选一个单位后就不再将其放回参加下一次的抽选。又称不放回抽样.总体单位数N不变,同一单位可能多次被抽中。总体单位数减少n,同一单位只可能被抽中一次。《统计学》第6章抽样推断3.重复抽样和不重复抽样抽样方法的分类根据对样本的要求不同,可分为:考虑顺序抽样不考虑顺序抽样考虑各单位的中选顺序。ABC≠CBA不考虑各单位的中选顺序。ABC=CBA考虑顺序的重复抽样不考虑顺序的不重复抽样考虑顺序的不重复抽样不考虑顺序的重复抽样综合起来共有四种抽样方法《统计学》第6章抽样推断样本的可能数目考虑顺序的不重复抽样不考虑顺序的不重复抽样考虑顺序的重复抽样不考虑顺序的重复抽样)!/(!nNNpnNnNnnNC1-nNC《统计学》第6章抽样推断(二)抽样推断的理论基础大数法则中心极限定理又称大数定律,表明大量随机观象平均结果具有稳定性的性质。是指在随机试验中,每次出现的结果不同,但是大量重复试验出现的结果的平均值却几乎总是接近于某个确定的值。简单的说,大数定理就是“当试验次数足够多时,事件发生的频率无穷接近于该事件发生的概率”。1)(limXxPn如果变量总体存在有限的平均数和方差,那么不论这个总体的分布如何,随着样本容量的增加,样本平均数的分布,便趋近于正态分布。即:)(nNX,~第二节抽样误差一、抽样误差的概念及影响因素二、抽样平均误差三、抽样极限误差统计学第6章抽样推断第二节抽样误差本章目录一、抽样误差的概念及影响因素(一)抽样误差的概念在抽样推断中,误差的来源很多,包括登记性误差和代表性误差。⒈登记性误差又称为调查误差或工作误差,是指在调查过程中,由于各种主观或客观的原因而引起的误差。统计学第6章抽样推断第二节抽样误差⒉代表性误差是指在抽样调查中,样本各单位的结构情况不足以代表总体的状况,而用部分去推断总体所产生的误差。它包括两类误差:系统性误差和随机性误差。⑴系统性误差它是由于抽样时违反随机原则而产生的误差。系统性误差和登记误差一样,都是抽样组织工作造成的,应该采取措施预防或将其减小到最低程度。⑵随机性误差它是指由于随机抽样的偶然因素使样本代表性不足而引起的。随机性误差在抽样推断中是不可避免的。⒊抽样误差广义:指代表性误差狭义:专指抽样调查中的随机性误差(二)抽样误差的影响因素1.总体各单位标志值的差异程度;2.样本的单位数;3.抽样的方法;4.抽样调查的组织形式。重复抽样的抽样误差比不重复抽样的大单位数越多,抽样误差越小差异越大,抽样误差越大简单随机抽样的抽样误差最大二、抽样平均误差(一)什么是抽样平均误差抽样平均误差是反映抽样误差一般水平的指标,其实质是指抽样平均数的标准差,它反映了抽样指标与总体指标的平均离散程度,也就是样本指标与总体指标的标准差,通常用抽样平均数的标准差来衡量。抽样平均数的平均数=总体平均数(二)抽样平均误差的计算1.重复抽样的条件下2.不重复抽样的条件下统计学第6章抽样推断第二节抽样误差1.重复抽样的条件下nxx:抽样平均误差统计学第6章抽样推断第二节抽样误差式中,n为样本容量为总体标准差一般情况下是未知,可用样本标准差替代。npp:成数的抽样平均误差式中,n为样本容量;为总体成数标准差,一般情况下是未知的,可用样本成数标准差替代。Xxpp2.不重复抽样的条件下)1()1()(:22NnnNNnnNXxXx很大时近似为当;抽样平均误差统计学第6章抽样推断第二节抽样误差式中,N为总体单位数;n为样本容量;为总体方差一般情况下是未知,可用样本方差替代。式中,N为总体单位数;n为样本容量;为总体成数方差一般情况下是未知,可用样本成数方差替代。1:2NnNnPp成数的抽样平