本章优化总结本章优化总结专题探究精讲知识体系网络章末综合检测知识体系网络专题探究精讲抽样方法的应用本章学习了三种常用的抽样方法:简单随机抽样法、系统抽样法和分层抽样法.这几种抽样方法的共同特点是:在抽样过程中每一个个体被抽取到的可能性是一样的,体现了抽样方法的客观性和公平性.简单随机抽样法是最简单、最基本的抽样方法,在进行系统抽样和分层抽样时都要用到简单随机抽样法.一般地,当总体中个体数较多时,常采用系统抽样法,当已知总体由差异明显的几部分组成时,常采用分层抽样法.通常实现简单随机抽样,使用抽签法或随机数表法.下列问题中,采用怎样的抽样方法较为合理?(1)从10台冰箱中抽取3台进行质量检查;(2)某电影院有32排座位,每排有40个座位,座号为1~40,有一次报告会坐满了听众,报告会结束以后为听取意见,需留下32名听众进行座谈;例1(3)某学校有160名教职工,其中教师为120名,行政人员16名,后勤服务人员24名,为了解教职工对学校在校务公开方面的意见,拟抽取一个容量为20的样本.【解】(1)抽签法.(2)系统抽样.将每一排40人组成一组,共32组,先在第一排用简单随机抽样方法抽取一名观众,再将其他各排与此观众座位号相同的观众全部取出.(3)分层抽样.总体容量为160,故样本中教师人数应为20×120160=15,行政人员人数应为20×16160=2,后勤人员人数应为20×24160=3.【名师点评】搞清三种抽样方法的适用范围.总体分布估计的应用总体分布反映了总体在各个范围内取值的可能性的大小,我们常常采用频率分布直方图来表示相应样本的频率分布,有时也利用茎叶图来描述其分布,然后用样本的频率分布去估计总体分布,样本容量越大,这种估计也就越精确.我国是世界上严重缺水的国家之一,城市缺水问题较为突出,某市为了节约生活用水,计划在本市试行居民生活用水定额管理,即确定一个居民的月用水量标准,用水量不超过该标准的部分按平价收费,超出的部分按议价收费,如果希望大部分居民的日常生活不受影响,并假设该市即为你所处的市,请设计一个调查方案,制定一个合理的标准用水量.随机抽取某市100位居民某年的月用水量(单位:t):例23.12.52.02.01.51.01.61.81.91.63.42.62.22.21.51.20.20.40.30.43.22.72.32.11.61.23.71.50.53.83.32.82.32.21.71.33.61.70.64.13.22.92.42.31.81.43.51.90.84.33.02.92.42.41.91.31.41.80.72.02.52.82.32.31.81.31.31.60.92.32.62.72.42.11.71.41.21.50.52.42.52.62.32.11.61.01.01.70.82.42.82.52.22.01.51.01.21.80.62.2【解】列出频率分布表如下:分组频数累计频数频率[0,0.5)40.04[0.5,1)正80.08[1,1.5)正正正150.15[1.5,2)正正正正220.22[2,2.5)正正正正正250.25[2.5,3)正正140.14[3,3.5)正一60.06[3.5,4)40.04[4,4.5]20.02合计1001001.00绘出频率分布直方图,如下图.作出统计结论:从上面的图表我们可以看出,月均用水量在区间[2,2.5)内的居民最多,在[1.5,2)内的次之,大部分的居民用水量都在[1,3)之间,因此居民月用水量标准可定为3t.【名师点评】频率分布表比较确切,频率分布直方图比较直观.总体的平均数与标准差往往通过样本的平均数、标准差来估计,一般地,样本容量越大,对总体的估计越准确.(1)从数字特征上描述一组数据的情况.平均数、众数、中位数描述其集中趋势,方差、极差和标准差描述其波动大小,也可以说方差、标准差和极差反映各个数据与其平均数的离散程度.用样本特征数估计总体特征数(2)方差和标准差的运用.一组数据的方差或标准差越大,说明这组数据波动越大,方差的单位是原数据的单位的平方,标准差的单位与原单位相同.有1个容量为100的样本,数据的分组及各组的频数如下:[12.5,15.5)6,[15.5,18.5)16,[18.5,21.5)18,[21.5,24.5)22,[24.5,27.5)20,[27.5,30.5)10,[30.5,33.5]8.(1)列出样本的频率分布表(含累积频率);(2)画出频率分布直方图和累积频率分布图;(3)根据累积频率分布图,估计小于30的数据约占多大百分比.例3【解】(1)样本的频率分布表如下:分组频数频率累积频率[12.5,15.5)60.060.06[15.5,18.5)160.160.22[18.5,21.5)180.180.40[21.5,24.5)220.220.62[24.5,27.5)200.200.82[27.5,30.5)100.100.92[30.5,33.5]80.081.00合计1001.00(2)频率分布直方图如图1,累积频率分布图如图2.(3)在累积频率分布图中找到横坐标为30的点,然后量出这个点的纵坐标约为0.90,这说明小于30的数据约占90%.【名师点评】频率分布表列出的是各个不同区间内取值的频率,相应的直方图是用图形的面积的大小来表示各区间内取值的频率的.分析两个变量的相关关系时,我们可根据样本数据散点图确定两个变量之间是否存在相关关系,还可利用最小二乘法求出回归直线方程.利用线性回归方程对两个变量间的线性相关关系进行估计,实际上就是将非确定性的相关关系转化为确定性的函数关系进行研究.线性回归(2011年高考安徽卷)某地最近十年粮食需求量逐年上升,下表是部分统计数据:(1)利用所给数据求年需求量与年份之间的回归直线方程(2)利用(1)中所求出的直线方程预测该地2012年的粮食需求量.例4年份20022004200620082010需求量(万吨)236246257276286y^=bx+a;【解】(1)由所给数据看出,年需求量与年份之间是近似直线上升的,下面求回归直线方程.为此对数据预处理如下:年份-2006-4-2024需求量-257-21-1101929对预处理后的数据,容易算得x=0,y=3.2.b^=-4×-21+-2×-11+2×19+4×29-5×0×3.2-42+-22+22+42-5×02=26040=6.5,a^=y-b^x=3.2.由上述计算结果,知所求回归直线方程为y^-257=b^(x-2006)+a^=6.5(x-2006)+3.2,即y^=6.5(x-2006)+260.2.①(2)利用直线方程①,可预测2012年的粮食需求量为6.5×(2012-2006)+260.2=6.5×6+260.2=299.2(万吨).【名师点评】本题考查回归分析的基本思想及其初步应用,回归直线的意义和求法,数据处理的基本方法和能力,考查运用统计知识解决简单实际应用问题的能力.