第1讲抽样方法与总体分布的估计

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第1讲抽样方法与总体分布的估计【2014年高考会这样考】1.考查三种抽样方法及其应用.2.考查频率分布直方图中的相关计算(求解频率、频数等).3.考查用样本估计总体中的样本数据的数字特征(平均数、方差、标准差等).考点梳理类别共同点各自特点相互联系适用范围简单随机抽样抽样过程中每个个体被抽取的概率相等,均属于不放回抽样从总体中逐个抽取总体中的个体数较少将总体均分成几部分,按事先确定的规则在各部分中抽取在起始部分抽样时采用简单随机抽样总体中的个体数较多系统抽样分层抽样将总体分成几层,分层进行抽样各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成1.三种抽样方法的比较(1)当总体很大或不便获得时,可以用样本的频率分布去估计总体的频率分布,我们把反映样本频率分布的表格称为频率分布表.绘制频率分布表的步骤为:①_______;②_______________;③___________;④_____________.求极差决定组距和组数将数据分组列频率分布表12.频率分布直方图与茎叶图(2)利用直方图反映样本的频率分布,这样的直方图称为频率分布直方图.画频率分布直方图的一般步骤是:①绘制频率分布表;②作直角坐标系,把横轴分成若干段,每一段对应一个组的组距;③在上面标出的各点中,分别以相邻两点为端点的线段为底作矩形,它的高等于该组的频率组距.此时,每个矩形的面积恰好就是该组的频率,显然所有矩形的面积之和为____.(1)众数在样本数据中,出现次数最多的那个数据.(2)中位数样本数据中,将数据按大小排列,位于最中间的数据.如果数据的个数为偶数,就取中间两个数据的平均数作为中位数.3.样本的数字特征样本数据的算术平均数,即=__________________.(4)方差与标准差方差:s2=__________________________________.标准差:s=_____________________________________.1n(x1+x2+…+xn)x1n[(x1-x)2+(x2-x)2+…+(xn-x)2]1n[x1-x2+x2-x2+…+xn-x2](3)平均数一条规律【助学·微博】三种抽样方法的共同点都是等概率抽样,即抽样过程中每个个体被抽到的概率相等,体现了这三种抽样方法的客观性和公平性.若样本容量为n,总体的个体数为N,则用这三种方法抽样时,每个个体被抽到的概率都是nN.两个特性(1)在频率分布表中,频数的和等于样本容量,每一小组的频率等于这一组的频数除以样本容量,各小组频率的和等于1;(2)在频率分布直方图中,小矩形的高等于每一组的频率/组距,每个小矩形的面积等于该组的频率,所有小矩形的面积之和为1.1.(2012·山东)采用系统抽样方法从960人中抽取32人做问卷调查.为此将他们随机编号为1,2,…,960,分组后在第一组采用简单随机抽样的方法抽到的号码为9.抽到的32人中,编号落入区间[1,450]的人做问卷A,编号落入区间[451,750]的人做问卷B,其余的人做问卷C.则抽到的人中,做问卷B的人数为().考点自测A.7B.9C.10D.15解析从960人中用系统抽样方法抽取32人,则每30人抽取一人,因为第一组抽到的号码为9,则第二组抽到的号码为39,第n组抽到的号码为an=9+30(n-1)=30n-21,由451≤30n-21≤750,得23615≤n≤25710,所以n=16,17,…,25,共有25-16+1=10人,选C.答案C2.(2013·临沂模拟)甲校有3600名学生,乙校有5400名学生,丙校有1800名学生.为统计三校学生某方面的情况,计划采用分层抽样法,抽取一个容量为90的样本,应该在这三校分别抽取的学生人数是().A.30,30,30B.30,45,15C.20,30,10D.30,50,10解析抽取比例是903600+5400+1800=1120,故三校分别抽取的学生人数为3600×1120=30,5400×1120=45,1800×1120=15.答案B3.10名工人某天生产同一零件,生产的件数分别是15,17,14,10,15,19,17,16,14,12,则这一天10名工人生产的零件的中位数是().A.14B.16C.15D.17解析将这组数据从小到大排列得10,12,14,14,15,15,16,17,17,19.故中位数为15+152=15.答案C4.(2013·西北工大附中测试)如图是容量为150的样本的频率分布直方图,则样本数据落在[6,10)内的频数为().A.12B.48C.60D.80解析落在[6,10)内的频率为0.08×4=0.32,故频数为0.32×150=48.答案B5.(2013·长沙模拟)如图是某学校一名篮球运动员在五场比赛中所得分数的茎叶图,则该运动员在这五场比赛中得分的方差为________.(注:方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中x为x1,x2,…,xn的平均数)解析x=15(8+9+10+13+15)=11,s2=15×(9+4+1+4+16)=6.8.答案6.8[审题视点]因为802不能整除80,为了保证“等距”分段,应先剔除2个个体.考向一抽样方法【例1】►从某厂生产的802辆轿车中抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.解由于总体及样本中的个体数较多,且无明显差异,因此采用系统抽样的方法,步骤如下:第一步:先从802辆轿车中剔除2辆轿车(剔除方法可用随机数法);第二步:将余下的800辆轿车编号为1,2,…,800,并均匀分成80段,每段含k=80080=10个个体;第三步:从第1段即1,2,…,10这10个编号中,用简单随机抽样的方法抽取一个编号(如5)作为起始编号;第四步:从5开始,再将编号为15,25,…,795的个体抽出,得到一个容量为80的样本.解决系统抽样问题的两个关键步骤为:(1)分段的方法应依据抽取的样本容量而定,即根据定义每段抽取一个样本.(2)起始编号的确定应用简单随机抽样的方法,一旦起始编号确定,其他编号便随之确定了.解析根据分层抽样的特点求解.从小学中抽取30×150150+75+25=18所学校;从中学中抽取30×75150+75+25=9所学校.答案189【训练1】(2012·天津)某地区有小学150所,中学75所,大学25所.现采用分层抽样的方法从这些学校中抽取30所学校对学生进行视力调查,应从小学中抽取________所学校,中学中抽取________所学校.考向二频率分布直方图的绘制及应用【例2】►某班同学利用国庆节进行社会实践,对[25,55]岁的人群随机抽取n人进行了一次生活习惯是否符合低碳观念的调查,若生活习惯符合低碳观念,称为“低碳族”,否则称为“非低碳族”,得到如下统计表和各年龄段人数频率分布直方图:组数分组低碳族的人数占本组的频率第一组[25,30)1200.6第二组[30,35)195p第三组[35,40)1000.5第四组[40,45)a0.4第五组[45,50)300.3第六组[50,55]150.3(1)补全频率分布直方图;(2)求n,a,p的值.[审题视点](1)要补全频率分布直方图,关键是计算出第二组的频率;(2)灵活运用关系式:频率组距×组距=频率,频数样本容量=频率求解.解(1)第二组的频率为1-(0.04+0.04+0.03+0.02+0.01)×5=0.3,所以小长方形的高为0.35=0.06.频率分布直方图如图所示.(2)第一组的人数为1200.6=200,频率为0.04×5=0.2,所以n=2000.2=1000.由(1)知,第二组的频率为0.3,所以第二组的人数为1000×0.3=300,所以p=195300=0.65.第四组的频率为0.03×5=0.15,所以第四组的人数为1000×0.15=150,所以a=150×0.4=60.(1)绘制频率分布直方图时需注意:①制作好频率分布表后可以利用各组的频率之和是否为1来检验该表是否正确;②频率分布直方图的纵坐标是频率组距,而不是频率.(2)由频率分布直方图进行相关计算时,需掌握下列关系式:频率组距×组距=频率.【训练2】(2013·烟台四校联考)据悉2012年山东省高考要将体育成绩作为参考,为此,济南市为了了解今年高中毕业生的体能状况,从本市某校高中毕业班中抽取一个班进行铅球测试,成绩在8.0m(精确到0.1m)以上的为合格.把所得数据进行整理后,分成6组,并画出频率分布直方图的一部分如图所示.已知从左到右前5个小组对应矩形的高分别为0.04,0.10,0.14,0.28,0.30,且第6小组的频数是7.(1)求这次铅球测试成绩合格的人数;(2)若由直方图来估计这组数据的中位数,指出该中位数在第几组内,并说明理由.解(1)由题易知,第6小组的频率为1-(0.04+0.10+0.14+0.28+0.30)×1=0.14,∴此次测试的总人数为70.14=50.∴这次铅球测试成绩合格的人数为(0.28×1+0.30×1+0.14×1)×50=36.(2)直方图中中位数两侧的矩形面积和相等,即频率和相等,前三组的频率和为0.28,前四组的频率和为0.56,∴中位数位于第4组内.考向三用样本的数字特征估计总体的数字特征【例3】►甲乙二人参加某体育项目训练,近期的五次测试成绩得分情况如图.(1)分别求出两人得分的平均数与方差;(2)根据图和上面算得的结果,对两人的训练成绩作出评价.[审题视点](1)先通过图象统计出甲、乙二人的成绩;(2)利用公式求出平均数、方差,再分析两人的成绩,作出评价.解(1)由图象可得甲、乙两人五次测试的成绩分别为甲:10分,13分,12分,14分,16分;乙:13分,14分,12分,12分,14分.x甲=10+13+12+14+165=13,x乙=13+14+12+12+145=13,s2甲=15[(10-13)2+(13-13)2+(12-13)2+(14-13)2+(16-13)2]=4,s2乙=15[(13-13)2+(14-13)2+(12-13)2+(12-13)2+(14-13)2]=0.8.从折线图看,甲的成绩基本呈上升状态,而乙的成绩上下波动,可知甲的成绩在不断提高,而乙的成绩则无明显提高.(2)由s2甲>s2乙可知乙的成绩较稳定.(1)用样本估计总体时,样本的平均数、标准差只是总体的平均数、标准差的近似.实际应用中,当所得数据平均数不相等时,需先分析平均水平,再计算标准差(方差)分析稳定情况.(2)若给出图形,一方面可以由图形得到相应的样本数据,再计算平均数、方差(标准差);另一方面,可以从图形直观分析样本数据的分布情况,大致判断平均数的范围,并利用数据的波动性大小反映方差(标准差)的大小.设甲乙两组数据的平均数分别为x甲,x乙,中位数分别为m甲,m乙,则().A.x甲x乙,m甲m乙B.x甲x乙,m甲m乙C.x甲x乙,m甲m乙D.x甲x乙,m甲m乙【训练3】(2012·陕西)从甲乙两个城市分别随机抽取16台自动售货机,对其销售额进行统计,统计数据用茎叶图表示(如图所示).解析x甲=116(41+43+30+30+38+22+25+27+10+10+14+18+18+5+6+8)=34516,x乙=116(42+43+48+31+32+34+34+38+20+22+23+23+27+10+12+18)=45716.∴x甲x乙.又∵m甲=20,m乙=29,∴m甲m乙.答案B方法优化15——快速掌握抽样方法的技巧【命题研究】通过近三年的高考试题分析,考查分层抽样方法的题目较多,其次是系统抽样.题型多为选择题、填空题,有的与统计的其它知识或概率综合考查,常以解答题的形式出现,难度较低.[教你审题]一审等比例性质;二审抽取的样本容量.【真题探究】►(2012·江苏)某学校高一、高二、高三年级的学生人数之比为3∶3∶4,现用分层抽样的方法从该校高中三个年级的学生中抽

1 / 38
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功