抽样方法数理统计是研究如何有效地收集,整理,分析受随机影响的数据,并对所考虑的问题作出推断或预测,直至为采取决策和行动提供依据和建议的一门学科。它是一门应用性很强的学科,凡是有大量数据出现的地方,都要用到数理统计。现在,数理统计的内容已异常丰富,成为数学中最活跃的学科之一。教科书选择了数理统计中最基本问题来介绍这门学科的思想与方法。数理统计所要解决的问题是如何根据样本来推断总体,第一个问题就是采集样本,然后才能作统计推断。注意以下四点:(1)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;(4)它是一种等概率抽样。简单随机抽样是在特定总体中抽取样本,总体中每一个体被抽取的可能性是等同的,而且任何个体之间彼此被抽取的机会是独立的。如果用从个体数为N的总体中抽取一个容量为n的样本,那么每个个体被抽取的概卒等于一般地,设一个总体的个体数为N,如果通过逐个不放回地抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。1、简单随机抽样抽签法随机抽样的方法:随机数表法1、抽签法先将总体中的所有个体(共N个)编号(号码可以从1到N),并把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。2、用随机数表法进行抽取随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。(2)随机数表并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。(3)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。(2)要抽样了解某年参加高考考生的语文考试成绩,我们可以提出问题(1)一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。这里选用了哪种抽取样本的方法?写出抽取过程。①按照科目分类:文科、理科、艺术、体育和外语五个层次。②按照地区分类:大城市、中等城市、城镇、乡镇四个层次。③按照学校分类:重点、非重点两个层次。为了了解高一年级12000名学生的数学成绩,需要抽取容量为120的样本,请用合适的方法抽取.解:(1)对全体学生的数学成绩进行编号:1,2,3……,12000.(2)分段:由于样本容量与总体容量的比是1:100,我们将总体平均分为100个部分,其中每一部分包含100个个体.(3)在第一部分即1号到100号用简单随机抽样,抽取一个号码,比如是50.(4)以50作为起始数,,然后顺序抽取150,250,350,…..11950.这样就得到容量为100的一个样本.由于每排的座位有40个,各排每个号码被抽取的概率都是,第1排被抽取前,其他各排中各号码被抽取哪率也是,也就是说被抽取的概率是,每排的抽样也是简单随机抽样,因此这种抽样的方法是系统抽样。(1)一个礼堂有30排座位,每排有40个座位。一次报告会礼堂坐满了听众。会后为听取意见留下了座位号为20的30名听众进行座谈。这里选用了哪种抽取样本的方法?写出抽取过程。当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为系统抽样。2.系统抽样系统抽样的步骤为:(1)先将总体中的N个体编号.有时可直接利用个体自身所带的号码.(2)确定分段间隔k。对编号均衡地分段,是整数时,;不是整数时,从N中剔除一些个体,使得其为整数为止。(3)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:l;l+k;l+2k;……l+nk系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的;如总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。需要说明的是整个抽样过程中每个个体被抽到的概率仍然相等。系统抽样与简单随机抽样比较,有何优、缺点?1、系统抽样比简单随机抽样更容易实施;2、系统抽样的效果会受个体编号的影响,而简单随机抽样的效果不受个体编号的影响;3、系统抽样比简单随机抽样的应用范围广。3.分层抽样当已知总体由差异明显的几部分组成时,为了使样本充分地反映总体的情况,常将总体分成几部分,然后按照各部分所占的比例进行抽样。其中所分成的各部分叫做层。由于分层抽样的要求不同,各层的抽样的样本容量也不相同,所以,应当按照实际情况,合理地将样本容量分配到各个层,以确保抽样的合理性,研究时可以根据不同的要求来分层抽样。分层抽样适用于总体由差异明显的几部分组成的情况,每一部分称为层,在每一层中实行简单随机抽样。这种方法较充分地利用了总体己有信息,是一种实用、操作性强的方法。分层抽样的一个重要问题是一个总体如何分层。分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。例2、一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?分析:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;35~49岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。解:抽取人数与职工总数的比是100:500=1:5,则各年龄段(层)的职工人数依次是125:280:95=25:56:19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、35~49岁、50岁以上的三个年龄段分别抽取25人、56人和19人。分层抽样的抽取步骤:(1)总体与样本容量确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。(4)对于不能取整的数,求其近似值。4.三种抽样方法的比较5.课堂练习1、系统抽样适合的总体应是()A、容量较小的总体;B、容量较大的总体;C、个体数较多但均衡的总体;D、任何总体C2、要从已编号(1~50)的50件产品中随机抽取5件进行检查,用系统抽样可能的编号是()A、5,10,15,20,25B、3,13,23,33,43C、1,2,3,4,5,D、2,4,8,16,32B3、从2005个编号中抽取20个号码入样,采用系统抽样的方法,则抽样的间隔为()A、99B、99.5C、100D、100.5C5、某校有老师200人,男学生1200人,女学生1000人,现用分层抽样的方法从所有师生中抽取一个容量为N的样本,已知女学生中抽取的人数为80,则N=1924、某单位有职工160人,其中业务员有104人,管理人员32人,后期24人,现用分层抽样从中抽取一容量为20的样本,则抽取管理人员()人A、3B、4C、7D、12B6、某大学数学系共有本科生5000人,其中一、二、三、四年级的学生比为4:3:2:1,用分层抽样的方法抽取一个容量为200人的样本,则应抽取三年级的学生为()人。A、80B、40C、60D、20B小结:1、抽样方法:简单随机抽样、系统抽样、分层抽样2、简单随机抽样:逐一抽取;系统抽样:平均分段;分层抽样:按比例进行分配