珠海一中平沙校区2015-2016第二学期高一数学期末复习1必修3统计案例考试导航考试要求重难点击命题展望1.理解随机抽样的必要性和重要性,会用简单随机抽样方法从总体中抽取样本,了解分层抽样和系统抽样方法.2.了解分布的意义和作用,会列频率分布表,会画频率分布直方图、茎叶图,理解它们各自的特点,理解样本数据标准差的意义和作用,会计算数据标准差,能从样本数据中提取基本的数字特征(如平均数、标准差),并作出合理的解释,会用样本的频率分布估计总体分布,会用样本的基本数字特征估计总体的基本数字特征,理解用样本估计总体的思想,会用随机抽样的基本方法和样本估计总体的思想解决一些简单的实际问题.3.会作两个有关联变量的散点图,会利用散点图认识变量间的相关关系,了解最小二乘法的思想,能根据给出的线性回归方程系数公式建立线性回归方程,了解回归的基本思想、方法及其简单应用.本章重点:1.三种抽样方法的区别、联系及操作步骤.2.样本频率分布直方图和茎叶图.3.用样本估计总体的思想.本章难点:回归直线方程统计多数以选择题和填空题形式考查,大题只在个别省的考题中出现过.难度属于基础题和中档题.考点往往集中体现在抽样方法、频率分布图表这两个方面.另外,应注意统计题反映出来的综合性与应用性,如与数列、概率等的综合,用统计方法提供决策、制定方案等,以此考查学生搜集处理信息及分析解决问题的能力.知识网络珠海一中平沙校区2015-2016第二学期高一数学期末复习21抽样方法与用样本估计总体典例精析题型一抽样方法【例1】某校有教师200人,男学生1200人,女学生1000人,用分层抽样的方法从所有师生中抽取一个容量为n的样本,已知女学生抽取的人数为80人,则n的值为.【解析】根据分层抽样的意义,n200+1200+1000=801000,解得n=192.【点拨】现实中正确的分层抽样一般有三个步骤:首先,辨明突出的统计特征和分类.其次,确定每个分层在总体上的比例.利用这个比例,可计算出样本中每组(层)应抽取的人数.最后,必须从每层中抽取独立简单随机样本.【变式训练1】从某厂生产的802辆轿车中随机抽取80辆测试某项性能.请合理选择抽样方法进行抽样,并写出抽样过程.【解析】第一步,将802辆轿车用随机方式编号.第二步,从总体中剔除2辆(剔除方法可用随机数表法),将剩余的800辆轿车重新编号(分别为001,002,003,…,800),并分成80段.第三步,在第一段001,002,…,010这十个编号中用简单随机抽样抽出一个(如005)作为起始号码.第四步,将编号为005,015,025,…,795的个体抽出,组成样本.题型二频率分布直方图【例2】(2010湖南)如图是某城市通过抽样得到的居民某年的月均用水量(单位:吨)的频率分布直方图.(1)求直方图中x的值;【解析】(1)依题意及频率分布直方图知0.02+0.1+x+0.37+0.39=1,解得x=0.12.【点拨】从频率分布直方图读取数据时,要特别重视组距,纵坐标是频率除以组距,故长方形的面积之和为1.【变式训练2】如图是容量为100的样本的频率分布直方图,试根据数据填空:珠海一中平沙校区2015-2016第二学期高一数学期末复习3(1)样本数据落在[10,14)内的频数为;(2)样本数据落在[6,10)内的频率为;(3)总体落在[2,6)内的频率为.【解析】(1)样本落在[10,14)内的频数为0.09×4×100=36.(2)样本落在[6,10)内的频率为0.08×4=0.32.(3)样本落在[2,6)内的频率为0.02×4=0.08,所以总体落在[2,6)内的频率约为0.08.题型三平均数、方差的计算【例3】甲、乙两人在相同条件下各射靶10次,每次命中环数如下:甲47109568688乙7868678759试问谁10次射靶的情况较稳定?【解析】本题要计算两样本的方差,当样本平均数不是整数,且样本数据不大时,可用简化公式计算方差.甲x=110(4+7+…+8)=7.1,乙x=110(7+8+…+9)=7.1,s2甲=110(42+72+…+82-10×7.12)=3.09,s2乙=110(72+82+…+92-10×7.12)=1.29,因为s2甲>s2乙,所以乙10次射靶比甲10次射靶情况稳定.【点拨】平均数反映了数据取值的平均水平;标准差、方差描述了一组数据围绕平均数波动的大小,标准差、方差越大,数据的离散程度就越大,越不稳定;标准差、方差越小,数据的离散程度越小,越稳定.【变式训练3】在一次数学统考后,某班随机抽取10名同学的成绩进行样本分析,获得成绩数据的茎叶图如右图.(1)计算此样本的平均成绩及方差;【解析】(1)样本的平均成绩x=80;方差为s2=110[(92-80)2+(98-80)2+(98-80)2+(85-80)2+(85-80)2+(74-80)2+(74-80)2+(74-80)2+(60-80)2+(60-80)2]=175.总结提高1.统计的基本思想是用样本估计总体.这就要求样本具有很好的代表性,而样本良好客观的代表性,则完全依赖抽样方法.2.三种抽样方法中简单随机抽样是最基本的抽样方法,是其他两种方法的基础,它们的共同点都是等概率抽样.适用范围不同,要根据总体的具体情况选用不同的方法.3.对于总体分布,总是用样本的频率分布对它进行估计.4.用样本估计总体,一般分成以下几个步骤:先求样本数据中的最大值和最小值(称为极值),再确定合适的组数和组距,确定分点(每个分点只属于一组,故一般采用半开半闭区间),然后列出频率分布表(准确,查数据容易),画频率分布直方图.2两变量间的相关性、回归分析珠海一中平沙校区2015-2016第二学期高一数学期末复习4典例精析题型一求回归直线方程【例1】下表是关于某设备的使用年限(年)和所需要的维修费用(万元)的几组统计数据:x23456y2.23.85.56.57.0(1)若y对x呈线性相关关系,求出y关于x的线性回归方程y=bˆx+aˆ;(2)估计使用年限为10年时,维修费用为多少?【解析】(1)因为51ixiyi=112.3,51ix2i=4+9+16+25+36=90,且x=4,y=5,n=5,所以bˆ=112.3-5×4×590-5×16=12.310=1.23,aˆ=5-1.23×4=0.08,所以回归直线方程为y=1.23x+0.08.(2)当x=10时,y=1.23×10+0.08=12.38,所以估计当使用10年时,维修费用约为12.38万元.【点拨】当x与y呈线性相关关系时,可直接求出回归直线方程,再利用回归直线方程进行计算和预测.【变式训练1】某工厂经过技术改造后,生产某种产品的产量(吨)与相应的生产能耗(吨标准煤)有如下几组样本数据.x3456y2.5344.5据相关性检验,y与x具有线性相关关系,通过线性回归分析,求得回归直线的斜率为0.7,那么y关于x的回归直线方程是.【解析】先求得x=4.5,y=3.5,由yˆ=0.7x+a过点(x,y),则a=0.35,所以回归直线方程是yˆ=0.7x+0.35.总结提高1.在研究两个变量之间是否存在某种关系时,必须从散点图入手.2.样本的随机性导致由线性回归方程所作出的预报也具有随机性.