1.统计的考查主要为抽样方法、样本估计总体、相关性、以及回归方程、独立性检验,在各种题型当中均有考查.2.概率的考查主要为:一是古典概型、几何概型、相互独立事件、独立重复试验的考查,难度中等偏易,选择题、填空题的考查形式居多,解答题也有考查;二是离散型随机变量分布列、均值、方差的考查,常与概率结合,主要以解答题的形式考查,难度中等.1.简单随机抽样定义:一般地,设一个总体含有𝑁个个体,从中逐个不放回的抽取𝑛个个体作为样本(𝑛≤𝑁),如果每次抽取时总体内的各个个体被抽到的机会相等,就把这种抽样方法叫做简单随机抽样.最常用的简单随机抽样方法有两种——抽签法和随机数法.适用范围:总体含个体数较少.2.系统抽样一般地,假设要从容量为𝑁的总体中抽取容量为𝑛的样本,我们可以按下列步骤进行系统抽样:(1)先将总体的𝑁个个体编号.有时可直接利用个体自身所带的号码,如学号、准考证号、门牌号等;(2)确定分段间隔𝑘,对编号进行分段.当Nn(𝑛是样本容量)是整数时,取Nkn;(3)在第1段用简单随机抽样确定第一个个体编号𝑙(𝑙≤𝑘);(4)按照一定的规则抽取样本.通常是将𝑙加上间隔𝑘得到第2个个体编号(𝑙+𝑘),再加𝑘得到第3个个体编号(𝑙+2𝑘),依次进行下去,直到获取整个样本.注意:如果遇到Nn不是整数的情况,可以先从总体中随机地剔除几个个体,使得总体中剩余的个体数能被样本容量整除.适用范围:总体含个体数较多.命题趋势考点清单专题9××统计概率3.分层抽样定义:一般地,在抽样时,将总体分成互不交叉的层,然后按照一定的比例,从各层独立地抽取一定数量的个体,将各层取出的个体合在一起作为样本,这种抽样方法叫分层抽样.适用范围:总体由差异明显的几部分构成.4.频率分布直方图极差:一组数据中最大值与最小值的差;频数:即个数;频率:频数与样本容量的比值,频率分布直方图中各小长方形的面积表示相应各组的频率;众数:出现次数最多的数,可以有多个.若无具体样本数据,则频率分布直方图中最高矩形的中点值可视为众数估计值;中位数:按大小顺序排列的一组数据中居于中间位置的数,若中间位置有两个数,则取它们的平均数,中位数只有一个.若无具体样本数据,则频率分布直方图中将所有矩形面积平分的直线对应的横坐标可视为中位数的估计值;平均数:所有样本数值之和除以样本个数的值.若无具体样本数据,则频率分布直方图中将每个矩形对应的区间中点值与该矩形面积相乘,然后全部相加得到的数值可视为该样本的平均值的估计值;标准差:考察样本数据的分散程度的大小,一般用𝑠表示.标准差越大,则数据离散程度越大;标准差越小,则数据离散程度越小.222121[()())nsxxxxxxn.方差:标准差的平方,用𝑠2表示,也是刻画样本数据的分散程度,与标准差一致.2222121[()())nsxxxxxxn.5.最小二乘法回归直线𝑦̂=𝑏̂𝑥+𝑎̂,其中1122211()ˆˆˆnniiiiiinniiiixxyyxynxybxxxnxaybx.6.相关系数12211()()niiinniiiixxyyrxxyy,当𝑟为正时,表明变量𝑥与𝑦正相关;当𝑟为负时,表明变量𝑥与𝑦负相关.𝑟∈[−1,1],𝑟的绝对值越大,说明相关性越强;𝑟的绝对值越小,说明相关性越弱.7.回归分析(1)样本点的中心(𝑥,𝑦)一定满足回归方程;(2)点(𝑥𝑖,𝑦𝑖)的残差𝑒̂𝑖=𝑦𝑖−𝑦̂𝑖;(3)22121()1(ˆ)niiiniiyyRyy,𝑅2越大,则模型的拟合效果越好;𝑅2越小,则模型的拟合效果越差.8.独立性检验𝐾2的观测值2()nadbckabcdacbd.9.概率的计算(1)古典概型𝑃(𝐴)=𝐴包含的基本事件的个数基本事件的总数.(2)几何概型每个事件发生的概率只与构成该事件区域的长度(面积或体积)成比例.𝑃(𝐴)=构成事件𝐴的区域长度(面积或体积)试验的全部结果所构成的区域长度(面积或体积).(3)互斥事件概率的计算公式𝑃(𝐴∪𝐵)=𝑃(𝐴)+𝑃(𝐵)(4)对立事件的计算公式𝑃(𝐴)=1−𝑃(𝐴)(5)条件概率/PABPBAPA10.离散型随机变量(1)离散型随机变量的分布列的两个性质①01,2,3,,ipin;②121nppp(2)均值公式均值性质1122nnEXxpxpxp①𝐸(𝑎𝑋+𝑏)=𝑎𝐸(𝑋)+𝑏;②若𝑋~𝐵(𝑛,𝑝),则𝐸(𝑋)=𝑛𝑝;③若𝑋服从两点分布,则𝐸(𝑋)=𝑝(3)方差公式与方差性质2221122nnDXXEXpXEXpXEXp.①𝐷(𝑎𝑋+𝑏)=𝑎2𝐷(𝑋)②若𝑋~𝐵(𝑛,𝑝),则𝐷(𝑋)=𝑛𝑝(1−𝑝)(4)两个相互独立事件同时发生的概率𝑃(𝐴𝐵)=𝑃(𝐴)𝑃(𝐵)(5)独立重复试验的概率计算公式10,1,2,,kkknPXkCppkn,一、选择题.1.垃圾分类,人人有责.北京市从2020年5月1日开始实施《北京市生活垃圾管理条例》,北京将生活垃圾分为有害垃圾、可回收物、厨余垃圾和其他垃圾四类,并分别设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了某区四类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):“有害垃圾”箱“可回收物”箱“厨余垃圾”箱“其他垃圾”箱有害垃圾605510可回收物51851010厨余垃圾104054010其他垃圾5151080则下列结论中不正确的是()A.厨余垃圾占垃圾总量的60%B.有害垃圾投放正确的概率为75%C.厨余垃圾投放正确的概率为90%D.生活垃圾投放错误的概率为15%2.某校有学生800人,其中女生有350人,为了解该校学生的体育锻炼情况,按男、女学生采用分层抽样法抽取容量为80的样本,则男生抽取的人数是()A.35B.40C.45D.603.庚子新春,病毒肆虐,某老师为了解某班50个同学宅家学习期间上课、休息等情况,决定将某班学生编号为01,02,…,50.利用下面的随机数表选取10个学生调查,选取方法是从下面随机数表的第1行的第2列和第3列数字开始由左到右依次选取两个数字,则选出来的第4个学生的编号为()7256081302583249870248129728019831049231493582093624486969387481A.25B.24C.29D.194.在对具有线性相关的两个变量𝑥和𝑦进行统计分析时,得到如下数据:𝑥4681012𝑦1.31.933.94.9由表中数据求得𝑦关于𝑥的回归直线方程,则4,13.,6,19.,8,3,10,39.这四个样本点中,距离回归直线最近的点是()精题集训(70分钟)经典训练题A.4,13.B.6,19.C.8,3D.10,39.5.在[−6,6]上随机地取一个数𝑏,则事件“直线𝑦=𝑥+𝑏与圆𝑥2+𝑦2−2𝑦−1=0有公共点”发生的概率为()A.23B.13C.16D.346.某校一次高三年级数学检测,经抽样分析,成绩𝜉占近似服从正态分布𝑁(95,𝜎2),且(9195)P025..若该校有700人参加此次检测,估计该校此次检测数学成绩不低于99分的人数为()A.100B.125C.150D.1757.已知随机变量满足1,0,1Pxaxbx,其中𝑎,𝑏∈𝐑.若13E,则𝐷(𝜉)=()A.29B.59C.89D.1198.(多选)2020年突如其来的新冠肺炎疫情对房地产市场造成明显的冲击,如图为某市2020年国庆节7天假期的楼房认购量与成交量的折线图,某同学根据折线图对这7天的认购量(单位:套)与成交量(单位:套)作出如下判断,则判断正确的是()A.日成交量的中位数是16B.日成交量超过平均成交量的只有1天C.10月7日认购量量的增长率大于10月7日成交量的增长率D.日认购量的方差大于日成交量的方差二、解答题.9.某校的课外兴趣小组的同学们进行了一次关于全市“双创双修”知识答题的问卷调查活动,收集到的200张问卷统计得分汇总制成了一张频率直方图.(1)求问卷得分的中位数和平均数;(2)若得分不低于80则为优秀,按分层抽样再次回访8名参加过问卷调查并得分优秀的人,在这8人中还需随机挑选2人做深入访谈,求这两名访谈对象中至少有一人问卷得分超过90的概率.10.某牛蛙养殖户2013年至2019年牛蛙养殖纯收入𝑦(单位:万元)的数据如下表:年份2013201420152016201720182019年份代号𝑥(年)1234567牛蛙养殖纯收入𝑦(万元)2.93.33.64.44.85.25.9(1)求𝑦关于𝑥的线性回归方程;(2)记2020年的年份代号为08x,将𝑥=𝑥0代入(1)中的回归方程求得𝑦=𝑦0,请根据牛蛙养殖户2013年至2019年牛蛙养殖纯收入的数据表,估计2020年牛蛙养殖实际纯收入大于𝑦0的概率.附:回归直线的斜率和截距的最小二乘法估计公式分别为:1122211nniiiiiinniiiixynxyxxyybxnxxx,𝑎̂=𝑦−𝑏̂𝑥.11.某大型现代化农场在种植某种大棚有机无公害的蔬菜时,为创造更大价值,提高亩产量,积极开展技术创新活动.该农场采用了延长光照时间的方案,该农场选取了20间大棚(每间一亩)进行试点,得到各间大棚产量数据绘制成散点图.光照时长为𝑥(单位:小时),大棚蔬菜产量为𝑦(单位:千斤每亩),记𝑤=ln𝑥.(1)根据散点图判断,𝑦=𝑎+𝑏𝑥与𝑦=𝑐+𝑑⋅ln𝑥,哪一个适宜作为大棚蔬菜产量𝑦关于光照时长𝑥的回归方程类型(给出判断即可,不必说明理由);(2)根据(1)的判断结果及表中数据,建立𝑦关于𝑥的回归方程;(结果保留小数点后两位)(3)根据实际种植情况,发现上述回归方程在光照时长位于6~14小时内拟合程度良好,利用(2)中所求方程估计当光照时长为𝑒2小时(自然对数的底𝑒≈2.71828),大棚蔬菜亩产约为多少.参数数据:201iix201iiy201iiw2021iix2021iiy2021iiw201iiixy201iiiwy290102.4524870540.281371578.2272.1参考公式:𝛽关于𝛼的线性回归方程𝛽=𝑚⋅𝛼+𝑛中,1221niiiniinmn,𝑛=𝛽−𝑚⋅𝛼.12.“直播带货”是指通过一些互联网平台,使用直播技术进行商品线上展示、咨询答疑、导购销售的新型服务方式.某高校学生会调查了该校100名学生2020年在直播平台购物的情况,这100名学生中有男生60名,女生40名.男生中在直播平台购物的人数占男生总数的23,女生中在直播平台购物的人数占女生总数的78.(1)填写2×2列联表,并判断能否有99%的把握认为校学生的性别与2020年在直播平台购物有关?男生女生合计2020年在直播平台购物2020年未在直播平台购物合计(2)若把这100名学生2020年在直播平台购物的频率作为该校每个学生2020年在直播平台购物的概率,从全校所有学生中随机抽取4人,记这4人中2020年在直播平台购物的人数与未在直播平台购物的人数之差为𝑋,求𝑋的分布列与期望.𝑃(𝐾2≥𝑘0)0.050.010.0050.001𝑘03.8416.6357.87910.828附:𝑛=𝑎+𝑏+𝑐+𝑑,22()nadbcKabcdacb