专题9-2概率与统计归类目录讲高考.........................................................................................................................................1题型全归纳..................................................................................................................................3【题型一】回归直线型................................................................................................................3【题型二】非线性回归型............................................................................................................5【题型三】直方图型...................................................................................................................6【题型四】柱状图(条形图)型.................................................................................................7【题型五】相关系数型................................................................................................................9【题型六】残差应用型..............................................................................................................11【题型七】数据调整型..............................................................................................................12【题型八】极差、方差、标准差型............................................................................................13专题训练...................................................................................................................................14讲高考1.(2022·全国·统考高考真题)在某地区进行流行病学调查,随机调查了100位某种疾病患者的年龄,得到如下的样本数据的频率分布直方图:(1)估计该地区这种疾病患者的平均年龄(同一组中的数据用该组区间的中点值为代表);(2)估计该地区一位这种疾病患者的年龄位于区间[20,70)的概率;(3)已知该地区这种疾病的患病率为0.1%,该地区年龄位于区间[40,50)的人口占该地区总人口的16%.从该地区中任选一人,若此人的年龄位于区间[40,50),求此人患这种疾病的概率.(以样本数据中患者的年龄位于各区间的频率作为患者的年龄位于该区间的概率,精确到0.0001).2.(2022·全国·统考高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2m)和材积量(单位:3m),得到如下数据:样本号i12345678910总和根部横截面积ix0.040.060.040.080.080.050.050.070.070.060.6材积量iy0.250.400.220.540.510.340.360.460.420.403.9并计算得10101022iiiii=1i=1i=10.038,1.6158,0.2474xyxy.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为2186m.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数iii=122iii=1i=1(,1.8961.377)()()()nnnxxyyrxxyy.3.(2021·全国·统考高考真题)某厂研制了一种生产高精产品的设备,为检验新设备生产产品的某项指标有无提高,用一台旧设备和一台新设备各生产了10件产品,得到各件产品该项指标数据如下:旧设备9.810.310.010.29.99.810.010.110.29.7新设备10.110.410.110.010.110.310.610.510.410.5旧设备和新设备生产产品的该项指标的样本平均数分别记为x和y,样本方差分别记为21s和22s.(1)求x,y,21s,22s;(2)判断新设备生产产品的该项指标的均值较旧设备是否有显著提高(如果2212210ssyx,则认为新设备生产产品的该项指标的均值较旧设备有显著提高,否则不认为有显著提高).4.(2020·全国·统考高考真题)某学生兴趣小组随机调查了某市100天中每天的空气质量等级和当天到某公园锻炼的人次,整理数据得到下表(单位:天):锻炼人次空气质量等级[0,200](200,400](400,600]1(优)216252(良)510123(轻度污染)6784(中度污染)720(1)分别估计该市一天的空气质量等级为1,2,3,4的概率;(2)求一天中到该公园锻炼的平均人次的估计值(同一组中的数据用该组区间的中点值为代表);(3)若某天的空气质量等级为1或2,则称这天“空气质量好”;若某天的空气质量等级为3或4,则称这天“空气质量不好”.根据所给数据,完成下面的2×2列联表,并根据列联表,判断是否有95%的把握认为一天中到该公园锻炼的人次与该市当天的空气质量有关?人次≤400人次400空气质量好空气质量不好附:22()()()()()nadbcKabcdacbd,P(K2≥k)0.0500.0100.001k3.8416.63510.8285.(2020·全国·统考高考真题)某沙漠地区经过治理,生态系统得到很大改善,野生动物数量有所增加.为调查该地区某种野生动物的数量,将其分成面积相近的200个地块,从这些地块中用简单随机抽样的方法抽取20个作为样区,调查得到样本数据(xi,yi)(i=1,2,…,20),其中xi和yi分别表示第i个样区的植物覆盖面积(单位:公顷)和这种野生动物的数量,并计算得20160iix,2011200iiy,2021)80iixx(,2021)9000iiyy(,201))800iiixyxy((.(1)求该地区这种野生动物数量的估计值(这种野生动物数量的估计值等于样区这种野生动物数量的平均数乘以地块数);(2)求样本(xi,yi)(i=1,2,…,20)的相关系数(精确到0.01);(3)根据现有统计资料,各地块间植物覆盖面积差异很大.为提高样本的代表性以获得该地区这种野生动物数量更准确的估计,请给出一种你认为更合理的抽样方法,并说明理由.附:相关系数r=12211))))niiiiinniixyxxyyyx((((,≈1.414.题型全归纳【题型一】回归直线型【讲题型】例题1.某公司为了解年营销费用x(单位:万元)对年销售量y(单位:万件)的影响,统计了近5年的年营销费用ix和年销售量(1,2,3,4,5)iyi,得到的散点图如图所示,对数据进行初步处理后,得到一些统计量的值如下表所示.51iiu51iiv51iiiuuvv521iiuu16.1026.020.401.60表中lniiux,lniivy,5115iiuu,5115iivv.已知byax可以作为年销售量y关于年营销费用x的回归方程.(1)求y关于x的回归方程;(2)若公司每件产品的销售利润为4元,固定成本为每年120万元,用所求的回归方程估计该公司每年投入多少营销费用,才能使得该产品一年的收益达到最大?(收益销售利润营销费用固定成本)参考数据:4.399e81,31339.参考公式:对于一组数据1122,,,,,,nnuvuvuv,其回归直线vu的斜率和截距的最小二乘估计分别为`121ˆniiiniiuuvvuu,ˆˆvu.【讲技巧】对于一组具有线性相关关系的成对样本数据1122,,,,,,nnxyxyxy,由最小二乘法得1122211ˆnniiiiiinniiiixxyyxynxybxxxnx,ˆˆaybx.将ˆˆˆybxa称为Y关于x的经验回归方程,也称经验回归函数或经验回归公式,其图形称为经验回归直线.这种求经验回归方程的方法叫做小二乘法,求得的b,a叫做b,a的最小二乘估计.(2)观测值:对于响应变量Y,通过观测得到的数据称为观测值.(3)预测值:通过经验回归方程得到的y称为预测值.【练题型】5G技术对社会和国家十分重要,从战略地位来看,业界一般将其定义为继蒸汽机革命、电气革命和计算机革命后的第四次工业革命.某科技公司生产一种5G手机的核心部件,下表统计了该公司2017-2021年在该部件上的研发投入x(单位:千万元)与收益y(单位:亿元)的数据,结果如下:年份20172018201920202021研发投入x23456收益y23334(1)求研发投入x与收益y的相关系数r(精确到0.01);(2)由表格可知y与x线性相关,试建立y关于x的线性回归方程,并估计当x为9千万元时,该公司生产这种5G手机的核心部件的收益为多少亿元;(3)现从表格中的5组数据中随机抽取2组数据并结合公司的其他信息作进一步调研,记其中抽中研发投入超出4千万元的组数为X,求X的分布列及数学期望.参考公式及数据:对于一组数据,iixy(i=1,2,3,⋯,n),相关系数12211niiinniiiixxyyrxxyy,其回归直线ybxa$$$的斜率和截距的最小二乘估计分别为121niiiniixxyybxx,aybx$$,52.236.【题型二】非线性回归型【讲题型】例题1..为了研究某种细菌随天数x变化的繁殖个数y,收集数据如下:天数x123456繁殖个数y36132545100(1)判断ˆˆˆybxa(ˆˆ,ab为常数)与2ˆ1ˆˆecxyc(12ˆ,ˆcc为常数,且120,0ˆˆcc)哪一个适宜作为繁殖个数y关于天数x变化的回归方程类型?(给出判断即可,不必说明理由)(2)对于非线性回归方程2ˆ1ˆˆecxyc(12ˆ,ˆcc为常数,且120,0ˆˆcc),令lnzy,可以得到繁殖个数的对数z关于天数x具有线性关系及一些统计量的值,xyz621iix