(1)现代社会,是信息化社会,人们常常需要收集各种各样的数据,根据所获得的数据提取有价值的信息,作出合理的判断与选择。统计是研究如何合理收集、整理、描绘和分析数据的学科,它可以为人们制定决策提供依据。统计学在社会各行各业中有着广泛的应用,在我们的日常生活中也经常要用到统计学的知识。例如,某校高中学生有900人,医务室想对全校学生的身高情况作一次调查,为了不影响正常教学,准备抽取50名作为调查对象。在这个问题中,调查对象的总体是某校全体学生的身高,个体是每个学生的身高,抽取的这50名学生的身高是样本,样本容量为50。统计统计所要解决的问题如何根据样本来推断总体,首先要做的就是采集样本,然后才能作统计推断。(2)如何抽取样本,直接关系到对总体估计的准确程度,因此在抽样时要保证每个个体被抽到的机会是均等的,满足这样条件的抽样叫做随机抽样。简单随机抽样、系统抽样、分层抽样常用方法随机抽样一个布袋中有6个同样质地的球,从中先后不放回地抽取三个球。第一次抽取时,6个球中的每一个球被抽到的可能性都是____;第二次抽取时,余下的5个球中的每一个被抽到的可能性都是____;第三次抽取时,余下的4个球被抽到的可能性都是____。61引例1也就是说,每次抽取时,每个球都有相同的可能性被抽到!5141注意(1)它要求被抽取样本的总体的个体数有限;(2)它是从总体中逐个进行抽取;(3)它是一种不放回抽样;(4)它是一种等概率抽样。一般地,从元素个数为N的总体中逐个、不放回地抽取容量为n的样本,如果每次抽取时各个个体被抽到的概率相等,这样的抽样方法叫做简单随机抽样,这样抽取的样本,叫做简单随机样本。1、概念(一)简单随机抽样抽签法、随机数表法2、简单随机抽样的方法:(1)抽签法ⅰ步骤①将总体中的所有个体(共N个)编号(号码可以从1到N),对个体编号时,也可以利用已有的编号。例如学生的学号,座位号等。②把号码写在形状、大小相同的号签上(号签可以用小球、卡片、纸条等制作),然后将这些号签放在同一个箱子里,进行均匀搅拌。③抽签时,每次从中抽出1个号签,连续抽取n次,就得到一个容量为n的样本。要从我们班50名同学中随机抽取3人参加心理测试,请设计抽样方法。小试身手ⅱ优缺点优点:简单易行缺点:仅适用于个体数较少的总体。当总体个数较多时,搅拌得有可能不均匀,导致抽样不公平。费时费力。(2)随机数表法ⅰ(1)随机数表是统计工作者用计算机生成的随机数,并保证表中的每个位置上的数字是等可能出现的。(2)随机数表并不是唯一的,因此可以任选一个数作为开始,读数的方向可以向左,也可以向右、向上、向下等等。(3)用随机数表进行抽样的步骤:将总体中个体编号;选定开始的数字;获取样本号码。(4)由于随机数表是等概率的,因此利用随机数表抽取样本保证了被抽取个体的概率是相等的。随机抽样并不是随意或随便抽取,因为随意或随便抽取都会带有主观或客观的影响因素注意ⅱ优缺点优点简单易行,很好地解决了当总体个数较多时抽签法制签难的问题。缺点当总体个数很多,需要的样本容量也很大时,用此法很不方便引例2为了了解高一年级12000名学生的数学成绩,需要抽取容量为120的样本,用简单随机抽样还方便吗?请用合适的方法抽取.解:(1)对全体学生的数学成绩进行编号:1,2,3……,12000.(2)分段:由于样本容量与总体容量的比是1:100,我们将总体平均分为120个部分,其中每一部分包含100个个体.(3)在第一部分即1号到100号用简单随机抽样,抽取一个号码,比如是50.(4)以50作为起始数,然后顺序抽取150,250,350,…..11950.这样就得到容量为120的一个样本.当总体的个数较多时,采用简单随机抽样太麻烦,这时将总体分成均衡的部分,然后按照预先定出的规则,从每一部分中抽取1个个体,得到所需要的样本,这种抽样称为系统抽样,也被称为等距抽样。1、概念系统抽样时,将总体中的个体均分后的每一段进行抽样时,采用简单随机抽样;系统抽样每次抽样时,总体中各个个体被抽取的概率也是相等的;若总体的个体数不能被样本容量整除时,可以先用简单随机抽样从总体中剔除几个个体,然后再按系统抽样进行。说明(二)系统抽样2、步骤(1)先将总体中的N个体编号.有时可直接利用个体自身所带的号码.(2)根据样本容量n把总体均分为n段,确定分段间隔k。是整数时,;不是整数时,先从N中随机剔除一些个体,使得其为整数为止。nNnNknN(3)第一段用简单随机抽样确定起始号码l。(4)按照规则抽取样本:l,l+k,l+2k,……l+(n-1)k3、适用情况总体容量较大,并且个体之间无明显差异5、系统抽样与简单随机抽样的比较类别特点相互联系适用范围共同点简单随机抽样从总体中逐个抽取系统抽样在起始部分抽样时,采用简单随机抽样。总体个数较少在抽样过程中每个个体被抽到的可能性相等系统抽样将总体平均分成几部分,按事先确定的规则分别在各部分抽取总体个数较多且分布均衡6、方法取舍(1)当总体个数较少,样本容量也较小时(2)当总体个数较多,样本容量较小时(3)当总体个数较多,样本容量也较大时抽签法或随机数表法随机数表法系统抽样法分层抽样引例3某中学有学生900名,已知高一有400名学生,高二300名,高三200名。为了考察他们的体重情况,如何抽取容量为45的一个样本?分析:“900名学生的体重”这一总体是由高一、高二、高三学生的体重三部分组成,这三部分有明显的差别。我们可以把总体分成三“层”,在各层中按比例进行简单随机抽样或系统抽样!20190045201400201300首先,计算样本容量n与总体容量N的比为所以在高一、高二、高三三个层面上取学生数为,,,即分别抽取20,15,10名学生,这一步可通过简单随机抽样达到。2012001、概念当总体由明显差别的几部分组成时,将总体中各个个体按某种特征分成若干个互不重叠的几部分,每一部分叫做层,在各层中按层在总体中所占比例进行简单随机抽样或系统抽样,这种抽样方法叫做分层抽样分层抽样的一个重要问题是一个总体如何分层。分层抽样中分多少层,要视具体情况而定。总的原则是:层内样本的差异要小,而层与层之间的差异尽可能地大,否则将失去分层的意义。2、分层抽样的抽取步骤:(1)样本容量与总体确定抽取的比例。(2)由分层情况,确定各层抽取的样本数。(3)各层的抽取数之和应等于样本容量。(4)有些层面上除法算出的结果不是整数时,求其近似整数值。例、一个单位的职工有500人,其中不到35岁的有125人,35~49岁的有280人,50岁以上的有95人。为了了解该单位职工年龄与身体状况的有关指标,从中抽取100名职工作为样本,应该怎样抽取?分析:这总体具有某些特征,它可以分成几个不同的部分:不到35岁;35~49岁;50岁以上,把每一部分称为一个层,因此该总体可以分为3个层。由于抽取的样本为100,所以必须确定每一层的比例,在每一个层中实行简单随机抽样。解:抽取人数与职工总数的比是100:500=1:5,则各年龄段(层)抽取的职工人数依次是25;56;19,然后分别在各年龄段(层)运用简单随机抽样方法抽取。答:在分层抽样时,不到35岁、35~49岁、50岁以上的三个年龄段分别抽取25人、56人和19人。