考点1抽样方法1.简单随机抽样特点是从总体中逐个抽取.适用范围:总体中的个体较少.2.系统抽样特点是将总体均分成几部分,按事先确定的规则在各部分中抽取.适用范围:总体中的个体数较多.3.分层抽样特点是将总体分成几层,分层进行抽取.适用范围:总体由差异明显的几部分组成.[例1](1)[2019·全国卷Ⅰ]某学校为了解1000名新生的身体素质,将这些学生编号为1,2,…,1000,从这些新生中用系统抽样方法等距抽取100名学生进行体质测验.若46号学生被抽到,则下面4名学生中被抽到的是()A.8号学生B.200号学生C.616号学生D.815号学生【解析】(1)本题考查系统抽样;考查了数据处理能力;考查的核心素养为数据分析.将1000名学生分成100组,每组10人,则每组抽取的号码构成公差为10的等差数列{an},由题意知a5=46,则an=a5+(n-5)×10=10n-4,n∈N*,易知只有C选项满足题意.故选C.【答案】(1)C(2)[2019·全国卷Ⅲ]《西游记》《三国演义》《水浒传》和《红楼梦》是中国古典文学瑰宝,并称为中国古典小说四大名著.某中学为了解本校学生阅读四大名著的情况,随机调查了100位学生,其中阅读过《西游记》或《红楼梦》的学生共有90位,阅读过《红楼梦》的学生共有80位,阅读过《西游记》且阅读过《红楼梦》的学生共有60位,则该校阅读过《西游记》的学生人数与该校学生总数比值的估计值为()A.0.5B.0.6C.0.7D.0.8【解析】(2)本题主要考查用样本估计总体;考查学生对实际问题的处理能力和数据分析能力;考查了数据分析的核心素养.在样本中,仅阅读过《西游记》的学生人数为90-80=10,又由既阅读过《西游记》又阅读过《红楼梦》的学生人数为60,得阅读过《西游记》的学生人数为10+60=70,所以在样本中阅读过《西游记》的学生人数所占的比例为70100=0.7,即为该校阅读过《西游记》的学生人数与该校学生总数比值的估计值.【答案】(2)C(1)随机抽样各种方法中,每个个体被抽到的概率都是相等的;(2)系统抽样又称“等距”抽样,被抽到的各个号码间隔相同;(3)分层抽样满足:各层抽取的比例都等于样本容量在总体容量中的比例.『对接训练』1.[2019·河北枣强中学期末]总体由编号为01,02,…,19,20的20个个体组成,利用下面的随机数表选取5个个体,选取方法是从随机数表第1行的第6个数字开始向右读(每两个连续数字组成一个编号),则选出来的第5个个体的编号为()21166508903420764381263491641750715945069127353680727467213350258312027611870526A.12B.07C.15D.16解析:从随机数表第1行的第6个数字开始由左到右依次选取两个数字中小于20的编号依次为03,07,12,16,07,15,其中第二个和第五个都是07,重复,所以选出的5个个体的编号为03,07,12,16,15,则第5个个体的编号为15.故选C.答案:C2.[2019·惠州市高三第二次调研]某班共有56人,学号依次为1,2,3,…,56,现用系统抽样的方法抽取一个容量为4的样本,已知学号为2,30,44的同学在样本中,则样本中还有一位同学的学号为________.解析:由题意得,需要将56人按学号从小到大分成4组,每组抽取第2个学号对应的同学,所以还有一位同学的学号为1×14+2=16.答案:16考点2用样本估计总体1.频率分布直方图中横坐标表示组距,纵坐标表示频率组距,频率=组距×频率组距.2.频率分布直方图中各小长方形的面积之和为1.3.利用频率分布直方图求众数、中位数与平均数利用频率分布直方图求众数、中位数和平均数时易出错,应注意区分这三者.在频率分布直方图中:(1)最高的小长方形底边中点的横坐标即是众数;(2)中位数左边和右边的小长方形的面积和是相等的;(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.[例2](1)[2018·江苏卷]已知5位裁判给某运动员打出的分数的茎叶图如图所示,那么这5位裁判打出的分数的平均数为________;(2)[2017·全国卷Ⅰ]为评估一种农作物的种植效果,选了n块地作试验田.这n块地的亩产量(单位:kg)分别为x1,x2,…,xn,下面给出的指标中可以用来评估这种农作物亩产量稳定程度的是()A.x1,x2,…,xn的平均数B.x1,x2,…,xn的标准差C.x1,x2,…,xn的最大值D.x1,x2,…,xn的中位数【解析】(1)这5位裁判打出的分数分别是89,89,90,91,91,因此这5位裁判打出的分数的平均数为89+89+90+91+915=90.(2)因为可以用极差、方差或标准差来描述数据的离散程度,所以要评估亩产量稳定程度,应该用样本数据的极差、方差或标准差.故选B.【答案】(1)90(2)B众数、中位数、平均数与直方图的关系(1)众数为频率分布直方图中最高矩形的底边中点的横坐标.(2)中位数为平分频率分布直方图面积且垂直于横轴的直线与横轴交点的横坐标.(3)平均数等于频率分布直方图中每个小矩形的面积乘以小矩形底边中点的横坐标之积的和.『对接训练』3.[2019·河北石家庄模拟]已知甲、乙两名篮球运动员进行罚球训练,每人练习10组,每组罚球40个,每组投中个数的茎叶图如图所示,则下列结论错误的是()A.甲投中个数的极差是29B.乙投中个数的众数是21C.甲的投中率比乙高D.甲投中个数的中位数是25解析:由茎叶图可知甲投中个数的极差为37-8=29,故A正确;易知乙投中个数的众数是21,故B正确;甲的投中率为8+12+13+20+22+24+25+26+27+3740×10=0.535,乙的投中率为9+11+13+14+18+19+20+21+21+2340×10=0.4225,所以甲的投中率比乙高,C正确;甲投中个数的中位数为22+242=23,D不正确.故选D.答案:D4.[2019·河北衡水中学五调]某“跑团”为了解团队每月跑步的平均里程,收集并整理了2018年1月至2018年11月期间“跑团”每月跑步的平均里程(单位:千米)的数据,绘制了下面的折线图.根据折线图,下列结论正确的是()A.月跑步平均里程的中位数为6月份对应的平均里程数B.月跑步平均里程逐月增加C.月跑步平均里程高峰期大致在8月和9月D.1月至5月的月跑步平均里程相对于6月至11月,波动性更小,变化比较平稳解析:由折线图知,月跑步平均里程的中位数为5月份对应的平均里程数,A错;月跑步平均里程不是逐月增加的,B错;月跑步平均里程高峰期大致在9月和10月,C错.故选D.答案:D考点3变量的相关性与统计案例1.线性回归方程方程y^=b^x+a^称为线性回归方程,其中b^=i=1nxiyi-nx-y-i=1nx2i-nx-2,a^=y--b^x-;(x-,y-)称为样本中心点.2.随机变量K2(χ2)=a+b+c+dad-bc2a+bc+da+cb+d,若K2(χ2)3.841,则有95%的把握说两个事件有关;若K2(χ2)6.635,则有99%的把握说两个事件有关.[例3][2019·全国卷Ⅰ]某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020(1)分别估计男、女顾客对该商场服务满意的概率;(2)能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=nad-bc2a+bc+da+cb+d.P(K2≥k)0.0500.0100.001k3.8416.63510.828【解析】本题通过对概率与频率的关系、统计案例中两变量相关性检验考查学生的抽象概括能力与数据处理能力,重点考查数学抽象、数据分析、数学运算的核心素养;倡导学生关注生活,提高数学应用意识.(1)由调查数据知,男顾客中对该商场服务满意的比率为4050=0.8,因此男顾客对该商场服务满意的概率的估计值为0.8.女顾客中对该商场服务满意的比率为3050=0.6,因此女顾客对该商场服务满意的概率的估计值为0.6.(2)K2=100×40×20-30×10250×50×70×30≈4.762.由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.(1)求回归直线方程的关键①正确理解计算b^,a^的公式和准确的计算.②在分析实际中两个变量的相关关系时,可根据样本数据作出散点图来确定两个变量之间是否具有相关关系,若具有线性相关关系,则可通过线性回归方程估计和预测变量的值.(2)独立性检验的关键①根据2×2列联表准确计算K2,若2×2列联表没有列出来,要先列出此表.②K2的观测值k越大,对应假设事件H0成立的概率越小,H0不成立的概率越大.『对接训练』5.[2019·湖南长沙长郡中学调研]长沙某公司对其主推产品在过去5个月的月广告投入xi(万元)和相应的销售额yi(万元)进行了统计,其中i=1,2,3,4,5,对所得数据进行整理,绘制散点图并计算出一些数据如下:i=15xi=6.8,i=15wi=10.3,i=15yi=15.8,i=15xiyi=22.76,i=15wiyi=34.15,i=15xi-x)2=0.46,i=15wi-w)2=3.56,其中wi=x2i,i=1,2,3,4,5.(1)根据散点图判断y=bx+a与y=cx2+d哪一个适宜作为月销售额y关于月广告投入x的回归方程类型?(给出判断即可,不必说明理由)(2)根据(1)的判断结果及题中所给数据,建立y关于x的回归方程,并据此估计月广告投入220万元时的月销售额.附:对于一组数据(u1,v1),(u2,v2),…,(un,vn),其回归直线v=α+βu的斜率和截距的最小二乘估计分别为β^=解析:(1)根据散点图可知,y=cx2+d适宜作为月销售额y关于月广告投入x的回归方程类型.(2)由题意知,=34.15-5×10.35×15.853.56=0.45,d^=y--0.45×w-=15.85-0.45×10.35=2.233,故回归方程为y^=0.45x2+2.233,当月广告投入为220万元时,月销售额y^=0.45×2202+2.233=21782.233(万元).故选择y=cx2+d作为回归方程模型,当月广告投入为220万元时,月销售额约为21782.233万元.