第一章统计我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.你知道这些数据是怎么来的吗?实际上他们是通过调查获得的。怎样调查呢?是对考察对象进行全面调查吗?例如,为了了解一批计算器的使用寿命,我们能将它们逐一测试吗?很明显,这既不可能,也没必要,实践中,由于所考察的总体中的个体数往往很多,而且许多考察带有破坏性,因此,我们通常只考察总体中的一个样本,通过样本来了解总体的情况,于是,如何设计抽样方法,使从总体中抽取的样本能够真正代表总体,是我们需要研究的课题.否则,如果样本的代表性不好,那么对总体的判断就会出现错误。那么,(1)怎样从总体中抽取样本呢?(2)如何表示样本数据呢?(3)如何从样本数据中提取基本信息(样本分布、样本数字特征等),来推断总体的情况呢?这些正是本章要研究解决的问题。思考:要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?将锅里的汤“搅拌均匀”,品尝一小勺就知道汤的味道,这是一个简单随机抽样问题,对这种抽样方法,我们从理论上作些分析.高质量的样本数据来自“搅拌均匀”的总体.否则调查结果就会出现较大偏差。候选人预测结果(%)选举结果(%)兰顿5738罗斯福4362在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(在1936年电话和汽车只有少数富人拥有),通过分析收回的调查表,显示兰顿非常受欢迎。于是此杂志预测兰顿将在选举中获胜。实际选举结果正好相反,最后罗斯福在选举中获胜。其数据如下:思考问题:如何科学地抽取样本?使得样本能比较准确地反映总体搅拌均匀使得每个个体被抽取的机会均等合理、公平2.1.1简单随机抽样回顾(初中知识):总体、个体、样本、样本容量的概念:总体:所要考察对象的全体。个体:总体中的每一个考察对象。样本:从总体中抽取的一部分个体叫做这个总体的一个样本。样本容量:样本中个体的数目。简单随机抽样的概念设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N),如果每次抽取时总体内的各个个体被抽到的机会都相等,这种抽样方法叫做简单随机抽样。注意以下四点:(1)它要求被抽取样本的总体的个体数有限;(总体有限)(2)它是从总体中逐个进行抽取;(逐个抽取)(3)它是一种不放回抽样;(不放回)(4)它是一种等概率抽样。(机会均等)C及时检测一:下列抽取样本的方式是属于简单随机抽样的是()①从无限多个个体中抽取100个个体作为样本;②盒子有80个零件,从中选出5个零件进行质量检验,在抽样操作时,从中任意拿出一个零件进行质量检验后,再把它放回盒子里;③从8台电脑中不放回的随机抽取2台进行质量检验(假设8台电脑已编好号,对编号随机抽取)A.①B.②C.③D.以上都不对最常用的简单随机抽样方法有两种—抽签法和随机数法现从我们班64名同学中选取10名参加一项趣味活动,为保证选取的公平性,你打算如何操作?抽签决定实例一开始抽签法64名同学从0到63编号制作编号为0到63的号签(共64个)将64个号签搅拌均匀随机从中逐一抽出10个号签与所抽取号码一致的学生即被选中结束抽签法的一般步骤:(1)将总体中的N个个体编号;(2)将这N个号码写在形状、大小相同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,连续抽出n次;(5)将总体中与抽到的号签编号一致的n个个体取出。开始54名同学从0到53编号制作编号为0到53的号签将54个号签搅拌均匀随机从中逐一抽出10个签让对应号码的学生参加结束(总体个数N,样本容量n)开始编号制签搅匀抽签取出个体结束思考:你认为抽签法有什么优点和缺点?当总体中的个体数很多时,用抽签法方便吗?用抽签法抽取样本时,编号的过程有时可以省略(如果已有编号),但制签的过程就难以省去了,而且制签也比较麻烦,有简化制签的方法吗?简化制签过程的一个有效方法就是制作一个表,其中的每个数都是用随机方法产生的,这样的表称为随机数表,于是,我们只需要按一定的规则到随机数表中选取号码就可以了,这种抽样方法叫做随机数表法例:要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验。随机数表法随机数表:制作一个表(由数字0,1,2,...,9组成),表中各个位置上的数都是随机产生的(随机数)即每个数字在表中各个位置上出现的机会都是一样。随机数表教材103页范例:要考察某公司生产的500克袋装牛奶的质量是否达标,现从800袋牛奶中抽取60袋进行检验,用随机数表法抽取的过程如下第一步,先将800袋牛奶编号,可以编为000,001,…,799第二步,在随机数表中任选一个数,例如选出第8行第7列的数7.(为了便于说明,下面摘取了附表1的第6行至第10行)1622779439495443548217379323788442175331572455068877047447676301637859169555671998105071753321123429786456078252420744385760863244094727965449174609628735209643842634916421763350258392120676128673580744395238791551001342996602795490528477270802734328第三步,从选定的数7开始向右读(读数的方向也可以是向左、向上、向下等),得到一个三位数785,由于785<799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916>799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出,这样我们就得到一个容量为60的样本.随机数表法随机数表:表由数字0,1,2,...,9组成,表中各个位置上的数都是随机产生的(随机数)即每个数字在表中各个位置上出现的机会都是一样。第一步、先将总体中的所有个体(共有N个)编号,第二步、然后在随机数表内任选一个数作为开始,第三步、再从选定的起始数,沿任意方向取数(不在号码范围内的数、重复出现的数必须去掉),第四步、最后根据所得号码抽取总体中相应的个体,得到总体的一个样本.步骤:编号、选数(起始数)、取数、抽取.巩固练习2.欲从本校100位教师中随机抽取20位参加党的基本知识竞赛,试用随机表法确定这20位教师1.中央电视台要从春节联欢晚会的60名热心观众中随机抽出4名幸运观众,试用抽签法为其设计产生这4名幸运观众的过程.点评:随机数表法—编号、选数、取数、抽取,其中取号位置与方向具有任意性.点评:抽签法—编号、制签、搅拌、抽取,关键是“搅拌”后的随机性;2.1.2系统抽样简单随机抽样的概念适用范围:总体中个体数较少的情况,抽取的样本容量也较小时。复习回顾:一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。用抽签法抽取样本的步骤:简记为:编号;制签;搅匀;抽签;取个体。用随机数表法抽取样本的步骤:简记为:编号;选数;读数;取个体。知识回顾1、简单随机抽样包括________和____________.抽签法随机数表法2、在简单随机抽样中,某一个个体被抽到的可能性是()。A.与第几次抽样有关,第一次抽的可能性最大B.与第几次抽样有关,第一次抽的可能性最小C.与第几次抽样无关,每次抽到的可能性相等D.与第几次抽样无关,与抽取几个样本无关C思考1:某中学高一年级有12个班,每班50人,为了了解高一年级学生对老师教学的意见,教务处打算从年级600名学生中抽取60名进行问卷调查,那么年级每个同学被抽到的概率是多少?思考2:你能用简单随机抽样对上述问题进行抽样吗?具体如何操作?思考3:联想到学校每学期选派学生评教评学时的做法,你还有什么方法对上述问题进行抽样?你的抽样方法有何优点?体现了代表性和公平性吗?思考4:如果从600件产品中抽取60件进行质量检查,按照上述思路抽样应如何操作?第二步,将总体平均分成60部分,每一部分含10个个体.第四步,从该号码起,每隔10个号码取一个号码,就得到一个容量为60的样本.(如8,18,28,…,598)第三步,在第1部分中用简单随机抽样抽取一个号码(如8号).第一步,将这600件产品编号为1,2,3,…,600.思考5:上述抽样方法称为系统抽样,一般地,怎样理解系统抽样的含义?系统抽样:当总体的个体数较多时,采用简单随机抽样太麻烦,这时将总体平均分成几个部分,然后按照预先定出的规则,从每个部分中抽取一个个体,得到所需的样本,这样的抽样方法称为系统抽样(等距抽样)。系统抽样的特点:(1)用系统抽样抽取样本时,每个个体被抽到的可能性是相等的,(2)系统抽样适用于总体中个体数较多,抽取样本容量也较大时;(3)系统抽样是不放回抽样。个体被抽取的概率等于Nn思考1:用系统抽样从总体中抽取样本时,首先要做的工作是什么?将总体中的所有个体编号.思考2:如果用系统抽样从605件产品中抽取60件进行质量检查,由于605件产品不能均衡分成60部分,对此应如何处理?先从总体中随机剔除5个个体,再均衡分成60部分.思考3:用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,要平均分成多少段,每段各有多少个号码?思考4:如果N不能被n整除怎么办?从总体中随机剔除N除以n的余数个个体后再分段.思考5:将含有N个个体的总体平均分成n段,每段的号码个数称为分段间隔,那么分段间隔k的值如何确定?总体中的个体数N除以样本容量n所得的商.用简单随机抽样抽取第1段的个体编号.在抽取第1段的号码之前,自定义规则确定以后各段的个体编号,通常是将第1段抽取的号码依次累加间隔k.思考6:用系统抽样抽取样本时,每段各取一个号码,其中第1段的个体编号怎样抽取?以后各段的个体编号怎样抽取?思考7:一般地,用系统抽样从含有N个个体的总体中抽取一个容量为n的样本,其操作步骤如何?系统抽样的步骤:(1)采用随机的方式将总体中的个体编号;(2)将整个的编号按一定的间隔(设为K)分段,当(N为总体中的个体数,n为样本容量)是整数时,;当不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数能被n整除,这时,,并将剩下的总体重新编号;(3)在第一段中用简单随机抽样确定起始的个体编号;(4)将编号为的个体抽出。NnNknNn'N'Nkn,,2,...,(1)llklklnkl简记为:编号;分段;在第一段确定起始号;加间隔获取样本。思考8:系统抽样与简单随机抽样比较,有何优、缺点?(1)系统抽样比简单随机抽样更容易实施,可节约抽样成本;(2)系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;系统抽样所得样本的代表性和具体的编号有关,而简单随机抽样所得样本的代表性与个体的编号无关.如果编号的个体特征随编号的变化呈现一定的周期性,可能会使系统抽样的代表性很差.例如学号按照男生单号女生双号的方法编排,那么,用系统抽样的方法抽取的样本就可能会是全部男生或全部女生.(3)系统抽样比简单随机抽样的应用范围更广.例某中学有高一学生322名,为了了解学生的身体状况,要抽取一个容量为40的样本,用系统抽样法如何抽样?第一步,随机剔除2名学生,把余下的320名学生编号为1,2,3,…320.第四步,从该号码起,每间隔8个号码抽取1个号码,就可得到一个容量为40的样本.第三步,在第1部分用抽签法确定起始编号.第二步,把总体分成40个部分,每个部分有8个个体.2、采用系统抽样的方法,从个体数为1003的总体中抽取一个容量50的样本,则在抽样过程中,被剔除的个体数为(),抽样间隔为()。320练习:1、某工厂生产产品,用传送带将产品送放下一道工序,质检人员每隔十分钟在传送带的某一个位置取一件检验,则