【一轮复习讲义】2024年高考数学高频考点题型归纳与方法总结(新高考通用)第49练成对数据的统计分析(精练)一、单选题1.(2023·天津·统考高考真题)调查某种群花萼长度和花瓣长度,所得数据如图所示,其中相关系数0.8245r,下列说法正确的是()A.花瓣长度和花萼长度没有相关性B.花瓣长度和花萼长度呈现负相关C.花瓣长度和花萼长度呈现正相关D.若从样本中抽取一部分,则这部分的相关系数一定是0.8245【答案】C【分析】根据散点图的特点可分析出相关性的问题,从而判断ABC选项,根据相关系数的定义可以判断D选项.【详解】根据散点的集中程度可知,花瓣长度和花萼长度有相关性,A选项错误散点的分布是从左下到右上,从而花瓣长度和花萼长度呈现正相关性,B选项错误,C选项正确;由于0.8245r是全部数据的相关系数,取出来一部分数据,相关性可能变强,可能变弱,即取出的数据的相关系数不一定是0.8245,D选项错误故选:C二、解答题2.(2023·全国·统考高考真题)一项试验旨在研究臭氧效应,试验方案如下:选40只小白鼠,随机地将其中20只分配到试验组,另外20只分配到对照组,试验组的小白鼠饲养在高浓度臭氧环境,对照组的小白刷真题明导向鼠饲养在正常环境,一段时间后统计每只小白鼠体重的增加量(单位:g).试验结果如下:对照组的小白鼠体重的增加量从小到大排序为15.218.820.221.322.523.225.826.527.530.132.634.334.835.635.635.836.237.340.543.2试验组的小白鼠体重的增加量从小到大排序为7.89.211.412.413.215.516.518.018.819.219.820.221.622.823.623.925.128.232.336.5(1)计算试验组的样本平均数;(2)(ⅰ)求40只小白鼠体重的增加量的中位数m,再分别统计两样本中小于m与不小于m的数据的个数,完成如下列联表mm对照组试验组(ⅱ)根据(i)中的列联表,能否有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异?附:22()nadbcKabcdacbd,2PKk0.1000.0500.010k2.7063.8416.635【答案】(1)19.8(2)(i)23.4m;列联表见解析,(ii)能【分析】(1)直接根据均值定义求解;(2)(i)根据中位数的定义即可求得23.4m,从而求得列联表;(ii)利用独立性检验的卡方计算进行检验,即可得解.【详解】(1)试验组样本平均数为:1(7.89.211.412.413.215.516.518.018.819.219.820.22039621.622.823.623.925.128.232.336.5)19.820(2)(i)依题意,可知这40只小鼠体重的中位数是将两组数据合在一起,从小到大排后第20位与第21位数据的平均数,由原数据可得第11位数据为18.8,后续依次为19.2,19.8,20.2,20.2,21.3,21.6,22.5,22.8,23.2,23.6,,故第20位为23.2,第21位数据为23.6,所以23.223.623.42m,故列联表为:mm合计对照组61420试验组14620合计202040(ii)由(i)可得,2240(661414)6.4003.84120202020K,所以能有95%的把握认为小白鼠在高浓度臭氧环境中与在正常环境中体重的增加量有差异.3.(2022·全国·统考高考真题)甲、乙两城之间的长途客车均由A和B两家公司运营,为了解这两家公司长途客车的运行情况,随机调查了甲、乙两城之间的500个班次,得到下面列联表:准点班次数未准点班次数A24020B21030(1)根据上表,分别估计这两家公司甲、乙两城之间的长途客车准点的概率;(2)能否有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关?附:22()()()()()nadbcKabcdacbd,2PKk…0.1000.0500.010k2.7063.8416.635【答案】(1)A,B两家公司长途客车准点的概率分别为1213,78(2)有【分析】(1)根据表格中数据以及古典概型的概率公式可求得结果;(2)根据表格中数据及公式计算2K,再利用临界值表比较即可得结论.【详解】(1)根据表中数据,A共有班次260次,准点班次有240次,设A家公司长途客车准点事件为M,则24012()26013PM;B共有班次240次,准点班次有210次,设B家公司长途客车准点事件为N,则210()27840PN.A家公司长途客车准点的概率为1213;B家公司长途客车准点的概率为78.(2)列联表准点班次数未准点班次数合计A24020260B21030240合计4505050022()()()()()nadbcKabcdacbd=2500(2403021020)3.2052.70626024045050,根据临界值表可知,有90%的把握认为甲、乙两城之间的长途客车是否准点与客车所属公司有关.4.(2022·全国·统考高考真题)某地经过多年的环境治理,已将荒山改造成了绿水青山.为估计一林区某种树木的总材积量,随机选取了10棵这种树木,测量每棵树的根部横截面积(单位:2m)和材积量(单位:3m),得到如下数据:样本号i12345678910总和根部横截面积ix0.040.060.040.080.080.050.050.070.070.060.6材积量iy0.250.400.220.540.510.340.360.460.420.403.9并计算得10101022iiiii=1i=1i=10.038,1.6158,0.2474xyxy.(1)估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)求该林区这种树木的根部横截面积与材积量的样本相关系数(精确到0.01);(3)现测量了该林区所有这种树木的根部横截面积,并得到所有这种树木的根部横截面积总和为2186m.已知树木的材积量与其根部横截面积近似成正比.利用以上数据给出该林区这种树木的总材积量的估计值.附:相关系数iii=122iii=1i=1(,1.8961.377)()()()nnnxxyyrxxyy.【答案】(1)20.06m;30.39m(2)0.97(3)31209m【分析】(1)计算出样本的一棵根部横截面积的平均值及一棵材积量平均值,即可估计该林区这种树木平均一棵的根部横截面积与平均一棵的材积量;(2)代入题给相关系数公式去计算即可求得样本的相关系数值;(3)依据树木的材积量与其根部横截面积近似成正比,列方程即可求得该林区这种树木的总材积量的估计值.【详解】(1)样本中10棵这种树木的根部横截面积的平均值0.60.0610x样本中10棵这种树木的材积量的平均值3.90.3910y据此可估计该林区这种树木平均一棵的根部横截面积为20.06m,平均一棵的材积量为30.39m(2)1010iiiii=1i=110101010222222iiiii=1i=1i=1i=1101010xxyyxyxyrxxyyxxyy22(0.038100.06)(1.615810.2474100.060.390.01340.01340.970.013770.0000018996.3),则0.97r(3)设该林区这种树木的总材积量的估计值为3mY,又已知树木的材积量与其根部横截面积近似成正比,可得0.06186=0.39Y,解之得3=1209mY.则该林区这种树木的总材积量估计为31209m5.(2021·全国·统考高考真题)甲、乙两台机床生产同种产品,产品按质量分为一级品和二级品,为了比较两台机床产品的质量,分别用两台机床各生产了200件产品,产品的质量情况统计如下表:一级品二级品合计甲机床15050200乙机床12080200合计270130400(1)甲机床、乙机床生产的产品中一级品的频率分别是多少?(2)能否有99%的把握认为甲机床的产品质量与乙机床的产品质量有差异?附:22()()()()()nadbcKabcdacbd2PKk0.0500.0100.001k3.8416.63510.828【答案】(1)75%;60%;(2)能.(3)【分析】根据给出公式计算即可【详解】(1)甲机床生产的产品中的一级品的频率为15075%200,乙机床生产的产品中的一级品的频率为12060%200.(2)224001508012050400106.63527013020020039K,故能有99%的把握认为甲机床的产品与乙机床的产品质量有差异.【A组在基础中考查功底】一、单选题1.已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程ˆˆˆybxa必过点()A.(0.5,3)B.(1.5,0)C.(1,2)D.(1.5,4)【答案】D【分析】根据线性回归方程过样本中心点进行求解即可.【详解】由题中数据可得:012313571.5,444xy,所以该线性回归方程必过点1.5,4,故选:D2.中国茶文化博大精深、茶水的口感与茶叶的类型和水的温度有关,某数学建模小组建立了茶水冷却时间x和茶水温度y的一组数据,iixy,经过分析,提出了四种回归模型,①②③④四种模型的残差平方和21niiiyy的值分别是1.23、0.80、0.12、1.36.则拟合效果最好的模型是()A.模型①B.模型②C.模型③D.模型④【答案】C【分析】根据残差平方和与拟合效果的关系判定即可.【详解】残差平方和越小则拟合效果越好,而模型③的值最小,所以C正确.故选:C3.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:文化程度与月收入列联表(单位:人)收入文化程度月收入2000元以下月收入2000元及以上合计高中文化以上104555高中文化及以下203050合计3075105由上表中数据计算得22105103045206.10955503075.如果认为文化程度与月收入有关系,那么犯错误的概率不会超过()附表:α0.100.050.0100.0050.001xα2.7063.8416.6357.87910.828A.0.01B.0.025C.0.03D.0.05【答案】D【分析】根据卡方的计算,由表中数据即可得到求解.【详解】因为20.056.1093.841x,所以认为文化程度与月收入有关系,那么犯错误的概率不会超过0.05.故选:D.4.下列说法错误的是()A.决定系数2R越大,模型的拟合效果越好B.若变量x和y之间的样本相关系数为0.982r,则变量x和y之间的负相关程度很强C.残差平方和越小的模型,拟合的效果越好D.在经验回归方程30.8yx中,当解释变量x每增加1个单位时,响应变量y平均增加3个单位【答案】D【分析】根据已知条件,结合相关系数、决定系数的定义,以及线性回归方程的性质,即可求解.【详解】用决定系数2R来刻画回归效果,2R越大,表示残差平方和越小,即模型的拟合效果越好,故A正确;若变量x和y之间的样本相关系数为0.982r,r接近-1,则变量x和y之间的负相关很强,故B正确;比较两个模型的拟合效果,可以比较残差平方和的大小,残差平方和越小的模型,拟合效果越好,故C正确;在经验回归方程30.8yx中,当解释变量x每增加1个单位时,响应变量y平均减小3个单位,故D错误.故选:D.5.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优