学业水平测试数学复习学案第20课时随机抽样与频率分布一.知识梳理1.简单随机抽样(1)最常用的简单随机抽样的方法:抽签法和随机数法.(2)简单随机抽样的特点:①抽取的个体数较少;②逐个抽取;③是不放回抽取;④是等可能抽取.注:抽签法适于总体中个体数较少的情况,随机数表法适用于总体中个体数较多的情况.(3)一个抽样试验能否用抽签法,关键看两点:一是抽签是否方便;二是号签是否易搅匀.一般地,当总体容量和样本容量都较小时可用抽签法.(4)利用随机数表法抽取样本的步骤:①编号:将每个个体编号,各号数的位数相同.②选起始号码:任取某行、某组的某数为起始号码.③确定读数方向:一般从左到右读取.2.系统抽样的步骤(1)先将总体的N个个体编号;(2)确定分段间隔k,对编号进行分段,当N/n是整数时,取k=N/n;(3)在第1段用简单随机抽样确定第一个个体编号l;(4)按照一定的规则抽取样本,通常是将l加上间隔k得到第2个个体编号,依次进行下去,直到获取整个样本.3.分层抽样(1)定义:在抽样时,将总体分成互不交叉的层,然后按照一定比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法是一种分层抽样.(2)分层抽样的应用范围:当总体是由差异明显的几个部分组成时,往往选用分层抽样.注:三种抽样方法的共同点和联系:(1)抽样过程中每个个体被抽取的机会均等;(2)系统抽样中在分段后确定第一个个体时采用简单随机抽样,分层抽样中各层抽样时采用简单随机抽样或系统抽样.4、频率分布直方图反映样本的频率分布(1)频率分布直方图中横坐标表示组距,纵坐标表示,(2)频率分布直方图中各小长方形的面积之和为1,因此在频率分布直方图中组距是一个固定值,所以各小长方形高的比也就是频率比.(3)众数为最高矩形中点的横坐标.(4)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.5.标准差和方差(1)标准差s是样本数据到平均数的一种平均距离;s=(2)方差s2=(nx是样本数据,n是样本容量,x是样本平均数)(3)平均数、方差的公式推广①12,,,nmxamxamxa的平均数是mxa.数据12,,,naxaxax的平均数为②数据12,,,nxaxaxa的方差也为2s;数据12,,,naxaxax的方差为.6.线性相关关系、回归直线如果散点图中点的分布从整体上看大致在一条直线附近,就称这两个变量之间具有线性相关关系,这条直线叫做回归直线.方程ˆybxa是两个具有线性相关关系的变量的回归方程,一定经过数据中心点(,)二.课前自测1.为了了解全校900名高一学生的身高情况,从中抽取90名学生进行测量,下列说法正确的是④.①总体是900②个体是每个学生③样本是90名学生④样本容量是902.某校有学生2000人,其中高三学生500人.为了解学生身体情况,采用按年级分层抽样的方法,从该校学生中抽取一个200人的样本,则样本中高三学生的人数为503.已知10个数据如下:63,65,67,69,66,64,66,64,65,68.根据这些数据制作频率直方图,其中[64.5,66.5)这组所对应矩形的高为0.2三.典例解析【例1】今用简单随机抽样从含有6个个体的总体中抽取一个容量为2的样本。问:①总体中的某一个体a在第一次抽取时被抽到的概率是多少?②个体a不是在第1次未被抽到,而是在第2次被抽到的概率是多少?③在整个抽样过程中,个体a被抽到的概率是多少?解析:(1)31,(2)31,(3)31。【练习1】样本中共有五个个体,其值分别为a,0,1,2,3,,若该样本的平均值为1,则样本方差为(A)65(B)65(C)2(D)2【规范解答】选D,由题意知1a+0+1+2+3)=15(,解得a=-1,所以样本方差为2222221S=[(-1-1)+(0-1)+(1-1)+(2-1)+(3-1)]5=2,故选D.例2:(2010·北京高考理科·T11)从某小学随机抽取100名同学,将他们的身高(单位:厘米)数据绘制成频率分布直方图(如图)。由图中数据可知a=。若要从身高在[120,130),[130,140),[140,150]三组内的学生中,用分层抽样的方法选取18人参加一项活动,则从身高在[140,150]内的学生中选取的人数应为。本题考查频率颁布直方图,抽样方法中的分层抽样。熟练掌握频率颁布直方图的性质,分层抽样的原理是解决本题的关键。【思路点拨】利用各矩形的面积之和为1可解出a。分层抽样时,选算出身高在[140,150]内的学生在三组学生中所占比例,再从18人中抽取相应比例的人数。【规范解答】各矩形的面积和为:0.005100.03510100.02010a0.010101,解得0.030a。身高在[120,130),[130,140),[140,150]三组内的学生人数分别为:30、20、10,人数的比为3:2:1,因此从身高在[140,150]内的学生中选取的人数应为1816=3人。【参考答案】0.0303。【练习2】.把容量为100的某个样本数据分为10组,并填写频率分布表,若前七组的累积频率为0.79,而剩下三组的频数成公比大于2的整数等比数列,则剩下三组中频数最高的一组的频数为___________.答案:16点评:已知前七组的累积频率为0.79,而要研究后三组的问题,因此应先求出后三组的频率之和为1-0.79=0.21,进而求出后三组的共有频数,或者先求前七组共有频数后,再计算后三组的共有频数。由已知知前七组的累积频数为0.79×100=79,故后三组共有的频数为21,依题意qqa1)1(31=21,a1(1+q+q2)=21.∴a1=1,q=4。∴后三组频数最高的一组的频数为16。