问题提出1.我们生活在一个数字化时代,时刻都在和数据打交道,例如,产品的合格率,农作物的产量,商品的销售量,电视台的收视率等.这些数据常常是通过抽样调查而获得的,如何从总体中抽取具有代表性的样本,是我们需要研究的课题.2.要判断一锅汤的味道需要把整锅汤都喝完吗?应该怎样判断?3.将锅里的汤“搅拌均匀”,品尝一小勺就知道汤的味道,这是一个简单随机抽样问题,对这种抽样方法,我们从理论上作些分析.统计统计学:统计的基本思想:用样本估计总体,即通常不直接去研究总体,而是通过从总体中抽取一个样本,根据样本的情况去估计总体的相应情况。研究客观事物的数量特征和数量关系,它是关于数据的搜集、整理、归纳和分析方法的科学。总体:所要考察对象的全体。个体:总体中的每一个考察对象。样本:从总体中抽取的一部分个体叫做这个总体的一个样本。样本容量:样本中个体的数目。抽样分为不放回抽样和放回抽样两种情况.当我们逐个地从总体中抽取个体时,如果每次抽取的个体不再放回总体,这种抽样叫做不放回抽样;如果每次抽取一个个体后,先将它放回总体,然后再抽取一个个体,这种抽样叫做放回抽样.1、妈妈为了知道饼熟了没有,从刚出锅的饼上切下一小块尝尝,如果这一小块饼熟了,那么可以估计整张饼也熟了.请看下面几个例子:2、环境监测中心为了了解一个城市的空气质量情况,会在这个城市中分散地选定几个点,从各地点采集数据,对这些数据进行分析,就可以估计整个城市的空气质量.3、农科站要了解农田中某种病虫害的灾情,会随意地选定几块地,仔细检查虫卵数,然后估计一公顷农田大约平均有多少虫卵,会不会发生病虫害.以上几个例子都不适宜做普查,而需要做抽样调查.候选人预测结果(%)选举结果(%)Landon5738Roosevelt43624、在1936年美国总统选举前,一份颇有名气的杂志的工作人员做了一次民意测验,调查兰顿和罗斯福中谁将当选下一届总统。为了了解公众意向,调查者通过电话簿和车辆登记簿上的名单给一大批人发了调查表(在1936年电话和汽车只有少数富人拥有),通过分析收回的调查表,显示兰顿非常受欢迎。于是此杂志预测兰顿将在选举中获胜。实际选举结果正好相反,最后罗斯福在选举中获胜。其数据如下:为了使被抽查的样本能更好地反映总体,那么样本应该具备什么要求?(1)具有代表性;(2)不偏向总体中的某些个体。(2)第二次抽取时,余下每个学生被选到的机会是多少?111(3)第三次抽取时,余下的每个学生被选到的机会是多少?引例101121简单随机抽样的特点:(1)它要求被抽取样本的总体个数N是有限的;(3)它是从总体中逐个地进行抽取;(4)它是一种不放回抽样;(5)它的每个个体入样的可能性均为n/N.简单随机抽样一般地,设一个总体含有N个个体,从中逐个不放回地抽取n个个体作为样本(n≤N).如果每次抽取时各个个体被抽到的机会都相等,就称这种抽样为简单随机抽样.(2)样本数n小于等于样本总体的个数N;判断:下列抽样方式是否属于简单随机抽样?为什么?(1)从无限多个个体中抽取100个个体作样本;(2)盒子里共有80个零件,从中选出5个零件进行质量检测。在抽样操作时,从中任意拿出一个零件进行质量检测后,把它放回盒子再抽取下一个。简单随机抽样两种常见的实施简单随机抽样的办法1.抽签法抽签法的步骤:把总体中的N个个体编号,把号码写在号签上,将号签放在一个容器中,搅拌均匀后,每次从中抽取一个号签,连续抽取n次,就得到一个容量为n的样本.第三步:将取出的n个号签上的号码所对应的n个个体作为样本.第二步:准备N个号签分别标上这些编号,将号签放在容器中搅拌均匀后,每次抽取一个号签,不放回地连续取n次;优点:抽签法能够保证每个个体入选样本的机会都相等抽签法的优缺点:缺点:(1)当总体中的个体数较多时,制作号签的成本将会增加,使得抽签法的成本高(费时,费力)(2)号签很多时,把它们均匀搅拌就比较困难,结果很难保证每个个体入选样本的可能性相等,从而使产生坏样本(即代表性差的样本)的可能性增加2.随机数表法两种常见的实施简单随机抽样的办法随机数表:若一数表满足下列性质:②表中每个位置上出现各个数字的机会都是相等的.①表中共随机出现0,1,2,,9这十个数字;则称此表为随机数表.说明:(1)随机数还可用计算机产生。(2)随机数表并不是唯一的,只要符合以上两性质即可例:要考察某公司生产的500克袋装牛奶的质量是否达标,准备从800袋牛奶中抽取60袋进行检验,请设计一个抽取的方法。步骤:第二步:在随机数表中任选一个数,如选出第8行第7列的数字7:第三步:从选取的数7开始向右读(也可向其它方向),得到一个三位数785,因为785799,说明号码785在总体内,将它取出;继续向右读,得到916,由于916799,将它去掉,按照这种方法继续向右读,又取出567,199,507,…,依次下去,直到样本的60个号码全部取出。这样我们就得到了一个容量为60的样本。2.随机数法随机数表法抽样的步骤:②选定开始数字随机地选取一数字作为开始数字,选定后,应指明所在的纵横位置.③获取样本号码从开始数字算起,向左或右、或上或下等方向读取数字,从而获得样本号码(在这里注意,样本号码不应超过总体中的个体号码,否则舍去;样本号码不得重复,否则舍去,直到选够号码).④按所得的号码抽取样本.①将总体中的个体编号(即编数字号:一般地,100个个体的编号应为00,01,02,03,,99,以便于使用随机数表).例1人们打桥牌时,将洗好的扑克牌随机确定一张为起始牌,这时按次序搬牌时,对任何一家来说,都是从52张牌中抽取13张牌,问这种抽样方法是否是简单随机抽样?例2从20名学生中要抽取5名进行问卷调查,写出抽取样本的过程.解:总体和样本数目较小,可采用抽签法进行,抽取过程如下:①先将20名学生进行编号,从1编到20;②把号码写在形状、大小均相同的号签上;③将号签放在某个箱子中充分搅拌,然后依次不放回地逐个从箱子中取出5个号签,按这个号签上的号码取出样品,即得样本.例3假设要从100名学生中随机抽取10人参加一项科技活动,请用随机数法抽取,写出抽取过程.小结:1.简单随机抽样2.两种常见的实施简单随机抽样的办法(1)抽签法(2)随机数表法3、什么样的总体适宜用简单随机抽样?由于简单随机抽样适用于个体不太多的总体,那么当总体个数较多时,适宜采用什么抽取方法?新的抽样方法——系统抽样学校为了了解高二年级学生对教师教学的意见,打算从高二年级1000名学生中抽取50名学生进行调查.除了用简单随机抽样获取样本外,你能否设计其他抽样样本的方法?我们按照这样的方法来抽样:首先将这1000名学生从1开始进行编号,然后按号码顺序以一定的间隔进行抽取.由于,20501000间隔中随机地抽取一个号码,假如抽到的是6号,然后从第6号开始,每隔20个号码抽取一个,得到.986,,46,26,6这样,我们就得到一个容量为50的样本.这种抽样方法我们叫做系统抽样.当总体中的个体数较多时,将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这样的抽样叫做系统抽样.在上面的抽样中,由于在第1部分(个体编号1~20)中的起始号码是随机确定的,每个号码被抽到的概率都等于,201201201若采用简单随机抽样从这个总体中抽取一个容量为50的样本,那么每个个体被抽取的概率201100050P采用上面两种抽样方法时,每个个体被抽取的概率是相等的.在抽取第1部分的个体前,其他各部分中每个号码被抽取的概率也都是.所以的概率都是.就是说,在这个系统抽样中,每个个体被抽取系统抽样与简单随机抽样的联系在于:将总体均分后的每一部分进行抽样时,采用的是简单随机抽样.当总体中的个体数正好能被样本容量整除,可以用它们的比值作为进行系统抽样的间隔.如果不能整除,那应该怎么办,使在整个抽样过程中,每个个体被抽取的概率相等?可用简单随机抽样,先从总体中剔除余数部分的个体,使剩下的个体数能被样本容量整除,然后再按照系统抽样方法往下进行.1、适用于总体容量较大的情况3、是等可能抽样,每个个体被抽到的可能性都是n/N。系统抽样的特点:总体容量样本容量任一个个体NnP)((1)先将总体的N个个体编号,按照随机抽样的方法编号,有时也可直接利用个体自身所带的号码,如学号、准考证号、门牌号等(2)确定分段间隔k,对编号进行分段,当N/n(n是样本容量)是整数时,取k=N/n;当N/n不是整数时,从总体中剔除一些个体,使剩下的总体中个体的个数N΄能被n整除,这时K=N΄/n,并将剩下的总体进行重新编号(4)按照一定的规则抽取样本,通常是将L加上间隔k得到第2个个体编号(L+k),再加k得到第3个个体标号(L+2k),依次进行下去,直到获取整个样本系统抽样的步骤:练习2.下列抽样中不是系统抽样的是()A、从标有1—15号的15个球中,任选3个作样本,按从小号到大号排序,随机选起点i0,以后i0+5,i0+10(超过15则从1再数起)号入样B、工厂生产的产品,用传送带将产品送入包装车间前,检验人员从传送带上每隔5分钟抽一件产品进行检验C、搞某一市场调查,规定在商场门口随机抽一个人进行询问调查,直到调查到事先规定的调查人数为止D、电影院调查观众的某一指标,通知每排(每排人数相等)座位号为14的观众留下来座谈C例题.为了了解参加某种知识竞赛的1000名学生的成绩,打算从中抽取容量为50的样本。应采用什么抽取方法恰当?简述抽样过程?解析:(1)将每个人编号,由1至1000(2)由于50:1000=1:20,按编号顺序将号码等分为50段,每段20个,1至20为第1段(3)然后在第1段随机抽取一个号码,比如它是在第18号,那么可以从第18号起,每隔20个取一个号码(4)按编号,将18,38,58,…,978,998共50个号选出。这50个号对应的50个人成绩就组成了一个样本。例题.为了了解参加某种知识竞赛的1003名学生的成绩,打算从中抽取容量为50的样本。应采用什么抽取方法恰当?简述抽样过程?解析:(1)将每个人编号,由0001至1003(2)利用随机数表法找到3个号,将这3个人排除(3)重新编号0001至1000(4)按编号顺序将号码等分为50段,每段20个,0001至0020为第1段(5)在第1段中用简单随机抽样法抽得一个号码l(6)按编号,将l,20+l,40+l,……980+l共50个号选出。这10个号对应的10个人就组成了一个样本。思考:在这样的抽样过程中,每个个体被抽到的概率是否还相等?为什么?练习4:从N个编号中抽n个号码作样本,考虑用系统抽样方法,抽样间距为()nNA、1][nND、][nNC、nB、C练习3:为了解1200名学生对学校某项教改试验的意见,打算从中抽取一个容量为30的样本,考虑采用系统抽样,则分段的间隔k为()A.40B.30C.20D.12A