考点10-2回归分析与独立检验1.(2022·河南·高三开学考试(文))在研究线性回归模型时,样本数据,1,2,3,,iixyin所对应的点均在直线132yx上,用2R表示解释变量对于预报变量变化的贡献率,则2R()A.1B.12C.1D.2【答案】C【分析】结合决定系数的知识确定正确答案.【详解】因为样本数据所对应的点都在直线132yx上,所以21R.故选:C2.(2023·全国·高三专题练习)如图是一组实验数据构成的散点图,以下函数中适合作为y与x的回归方程的类型是()A.yaxbB.2yaxcC.logaybxcD.xybac【答案】D【分析】由散点图中各点的变化趋势,结合题中选项给出的函数的性质,用排除法一一排除得出答案.【详解】由散点图中各点的变化趋势知,各点不在一条直线上,排除A.由散点图中各点呈单调递减趋势,排除B.又图中点的横坐标有正有负,故排除C.故选:D.3.(2023·全国·高三专题练习)甲、乙、丙、丁四位同学分别对一组变量进行线性相关试验,并分别计算出相关指数2R,则线性相关程度最高的是()甲乙丙丁2R0.870.910.580.83A.甲B.乙C.丙D.丁【答案】B【分析】利用相关指数2R的性质,通过比较四位同学的2R,即可得到线性相关程度最高的同学【详解】2R越接近于1,两个变量的线性相关程度越高.0.910.870.830.58,则线性相关程度最高的是乙故选:B.4.(2023·全国·高三专题练习)下列是关于出生男婴与女婴调查的22列联表晚上白天总计男婴45AB女婴E35C总计98D180那么D=__________.【答案】82【分析】根据22列联表,可得方程,解之即可得到结论.【详解】解:由题意,4598E,35AD,45AB,35EC,180BC47A,92B,88C,82D,53E故答案为:82.5.(2023·全国·高三专题练习)设变量y与x的回归模型A、模型B、模型C相应的相关系数r的值分别为0.28、0.35、0.3,则拟合效果最好的是模型______.【答案】B【分析】根据相关系数的绝对值越接近于1,则回归模型的拟合效果越好,可得答案.【详解】因为相关系数的绝对值越接近于1,则回归模型的拟合效果越好,又因为0.350.30.28,所以拟合效果最好的是模型B.故答案为:B.6.(2023·全国·高三专题练习)用模型ekxya拟合一组数,1,2,,10iixyi,若121010xxx,701210eyyy,设lnzy,得变换后的线性回归方程为4zbx,则ak()A.12B.43eC.34eD.7【答案】B【分析】由已知,可根据121010xxx,701210eyyy先计算出,xz,然后把样本中心点带入线性回归方程为4zbx中计算出b,从而得到线性回归方程,然后将方程化为指数形式,通过待定系数法分别对应出a、k的值,即可完成求解.【详解】由已知,121010xxx,所以1210110xxxx,701210eyyy,lnzy,所以12011210lnlnln1010yyyzzzz121070ln()lne71010yyy,由题意,,xz满足线性回归方程为4zbx,所以714b,所以3b,此时线性回归方程为34zx,即ln34yx,可将此式子化为指数形式34exy,即为43eexy,因为模型为模型ekxya,所以4ea,3k,所以ak43e.故选:B.7.(2023·全国·高三专题练习)下列命题中正确的是()A.数据1,2,3,3,4,5的众数大于中位数B.对一组数据1,2,3,,ixin,如果将它们变为1,2,3,,ixCin,其中0C,则平均数和标准差均发生改变C.有甲、乙、丙三种个体按3:1:2的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为30D.一般可用相关指数2R来比较两个模型的拟合效果,2R越大,模型拟合效果越好【答案】D【分析】根据中位数和众数的定义判断A;根据平均数和标准差的性质可判断B;根据分层抽样的性质判断C;根据相关指数的定义和性质判断D.【详解】对于A,数据1,2,3,3,4,5的众数是3,中位数是3332,众数等于中位数,故A错误;对于B,数据1,2,3,,ixin,如果将它们变为1,2,3,,ixCin,其中0C,则平均数增加C,标准差不变,故B错误;对于C,有甲、乙、丙三种个体按3:1:2的比例分层抽样调查,如果抽取的甲个体数为9,则样本容量为9312183,故C错误;对于D,由相关指数的性质可得可以通过比较相关指数2R的大小比较两个模型的拟合效果,且2R越大,模型拟合效果越好,故D正确.故选:D.8.(2022·全国·高三专题练习)如下表,根据变量x与y之间的对应数据可求出ˆ0.32yxb.其中8y.现从这5个样本点对应的残差中任取一个值,则残差不大于0的概率为()x1015202530y111086A.15B.25C.35D.45【答案】C【分析】计算20x,y的最后一个数据为5,带入回归方程得到14.4b,计算每个样本点对应残差,得到概率.【详解】由表中的数据可知,1015202530205x,设y的最后一个数据为n,则11108685yn,5n,将x,y代入ˆ0.32yxb得14.4b,这5个样本点对应的残差分别为:11110.321014.40.2ˆyy,22ˆ100.321514.40.4yy,3380.3220.ˆ1440yy,4460.322514.40ˆ.4yy,5550.323014.4ˆ0.2yy,所以残差不大于0的概率为35.故选:C.9.(2023·全国·高三专题练习)一只红铃虫产卵数y和温度x有关,现测得一组数据,1,2,,10iixyi,可用模型21ecxyc拟合,设lnzy,其变换后的线性回归方程为4zbx,若1210300xxx,501210eyyy,e为自然常数,则12cc________.【答案】40.3e【分析】经过lnzy变换后将非线性问题转化为线性问题,在求样本点的中心,回归直线一定过该点,即可求出参数.【详解】21ecxyc经过lnzy变换后,得到21lnlnzycxc,根据题意1ln4c,故41ec,又1210300xxx,故30x,5012101210elnlnln50yyyyyy,故5z,于是回归方程为4zbx一定经过(30,5),故ˆ3045b,解得ˆ0.3b,即20.3c,于是12cc40.3e.故答案为:40.3e.10.(2023·全国·高三专题练习)已知变量x,y的关系可以用模型ekxyc拟合,设lnzy,其变换后得到一组数据如下:x46810z2356由上表可得线性回归方程0.7zxa,则c______.【答案】0.9e##0.91e【分析】根据表格数据求,xz,代入回归方程求参数a,结合lnzy得lnzckx,由方程的形式可知lnac,即可求c.【详解】由表格数据知:4681023567,444xz.由0.7zxa,得4ˆ70.7a,则ˆ0.9a.∴0.70.9zx,由kxyce,得lnln()lnlnlnkxkxzycececkx,∴ln0.9c,即0.9ec.故答案为:0.9e.11.(2020·河南郑州·一模(理))根据最小二乘法由一组样本点,iixy(其中1,2,,300iL),求得的回归方程是ˆˆˆybxa,则下列说法正确的是A.至少有一个样本点落在回归直线ˆˆˆybxa上B.若所有样本点都在回归直线ˆˆˆybxa上,则变量同的相关系数为1C.对所有的解释变量ix(1,2,,300iL),ˆˆibxa的值一定与iy有误差D.若回归直线ˆˆˆybxa的斜率ˆ0b,则变量x与y正相关【答案】D【分析】对每一个选项逐一分析判断得解.【详解】回归直线必过样本数据中心点,但样本点可能全部不在回归直线上﹐故A错误;所有样本点都在回归直线ˆˆˆybxa上,则变量间的相关系数为1,故B错误;若所有的样本点都在回归直线ˆˆˆybxa上,则ˆˆbxa的值与yi相等,故C错误;相关系数r与ˆb符号相同,若回归直线ˆˆˆybxa的斜率ˆ0b,则0r,样本点分布应从左到右是上升的,则变量x与y正相关,故D正确.故选D.【点睛】本题主要考查线性回归方程的性质,意在考查学生对该知识的理解掌握水平和分析推理能力.12.(2019·黑龙江·佳木斯一中高三阶段练习(文))针对时下的“抖音热”,某校团委对“学生性别和喜欢抖音是否有关”作了一次调查,其中被调查的女生人数是男生人数的12,男生喜欢抖音的人数占男生人数的16,女生喜欢抖音的人数占女生人数23,若有99%的把握认为是否喜欢抖音和性别有关,则男生至少有()参考公式:22nadbcKabcdacbd2PKk0.100.050.0250.0100.0050.001k2.7063.8415.0246.6357.87910.828A.12人B.18人C.24人D.30人【答案】B【分析】设男生人数为x,女生人数为2x,完善列联表,计算26.635K解不等式得到答案.【详解】设男生人数为x,女生人数为2x喜欢抖音不喜欢抖音总计男生16x56xx女生13x16x2x总计2xx32x222353266366.63517.69822xxxxxxxxxxnadbcKabcdaxcbd男女人数为整数故答案选B【点睛】本题考查了独立性检验,意在考查学生的计算能力和应用能力.13.(2020·辽宁·蒙古族高级中学模拟预测(理))某次测量发现一组数据(,)iixy具有较强的相关性,并计算得1.5yx,其中数据1(1,)y因书写不清楚,只记得1y是[0,3]上的一个值,则该数据对应的残差(残差=真实值-预测值)的绝对位不大于0.5的概率为()A.16B.56C.13D.23【答案】C【分析】求得估计值,用真实值减去估计值求得残差,根据已知残差的绝对位不大于0.5列不等式,解不等式求得1y的取值范围,根据几何概型概率计算公式计算出所求概率.【详解】依题意可知,估计值为11.52.5,残差为12.5y,依题意得12.50.5y,解得123y,根据几何概型概率计算公式可得所求概率为32133,故选C.【点睛】本小题主要考查残差的概念及计算,考查几何概型的计算,属于基础题.14.(2022·全国·高三专题练习)有两个分类变量x和y,其中一组观测值为如下的2×2列联表:1y2y总计1xa15a152x20a30a50总计204565其中a,15a均为大于5的整数,则a__________时,在犯错误的概率不超过0.01的前提下为“x和y之间有关系”.附:22nadbcKabcdacbd2PKk0.100.050.0250.0100.005k2.7063.8415.0246.6357.879【答案】9【分析】由题意,计算2K,列出不等式求出a的取值范围,再根据题意求得a的值.【详解】解:由题意知:26.635K,则22653020151313606.635204515505400aaaaa