1考点66变量间的相关关系、统计案例1.(湖南省师范大学附属中学2019届高三下学期模拟三理)某社区消费者协会为了解本社区居民网购消费情况,随机抽取了100位居民作为样本,就最近一年来网购消费金额(单位:千元)购次数和支付方式等进行了问卷调査.经统计这100位居民的网购消费金额均在区间0,30内,按0,5,5,10,10,15,15,20,20,25,25,30分成6组,其频率分布直方图如图所示.(1)估计该社区居民最近一年来网购消费金额的中位数;(2)将网购消费金额在20千元以上者称为购迷”,补全下面的22列联表,并判断有多大把握认为购迷与性别有关系”;男女合计网购迷20非网购迷45合计100(3)调査显示,甲、乙两人每次网购采用的支付方式相互独立,两人网购时间与次数也互不.影响.统计最近一年来两人网购的总次数与支付方式,所得数据如下表所示:网购总次数支付宝支付次数银行卡支付次数微信支付次数甲80401624乙90601812将频率视为概率,若甲、乙两人在下周内各自网购2次,记两人采用支付宝支付的次数之和为,求的数学期望.2附:观测值公式:22abcdadbcKabcdacbd临界值表:20PKk≥0.010.050.0250.0100.0050.0010k2.7063.8415.0246.6357.87910.828【答案】(1)中位数估计为17.5千元.(2)见解析;(3)73【解析】(1)在直方图中,从左至右前3个小矩形的面积之和为(0.010.020.04)50.35,后2个小矩形的面积之和为(0.040.03)50.35,所以中位数位于区间15,20内.设直方图的面积平分线为15x,则0.060.50.350.15x,得2.5x,所以该社区居民网购消费金额的中位数估计为17.5千元.(2)由直方图知购消费金额在20千元以上的频数为0.3510035,所以购迷”共有35人,由列联表知,其中女性有20人,则男性有15人.所以补全的列联表如下:男女合计网购迷152035非网购迷452065合计6040100因为22100(45201520)6006.5935.0246040356591K,查表得25.0240.025PK,所以有97.5%的把握认为购迷与性别有关系”.(3)由表知,甲,乙两人每次网购采用支付宝支付的概率分别为12,23.设甲,乙两人采用支付宝支付的次数分别为X,Y,据题意,12,2XB,22,3YB.3所以1()212EX,24()233EY.因为XY,则7()()()3EEXEY,所以的数学期望为73.2.(山东省实验中学等四校2019届高三联合考试理)随着科技的发展络已逐渐融入了人们的生活购是非常方便的购物方式,为了了解网购在我市的普及情况,某调查机构进行了有关网购的调查问卷,并从参与调查的市民中随机抽取了男女各100人进行分析,从而得到表(单位:人)经常网购偶尔或不用网购合计男性50100女性70100合计(1)完成上表,并根据以上数据判断能否在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关?(2)①现从所抽取的女市民中利用分层抽样的方法抽取10人,再从这10人中随机选取3人赠送优惠券,求选取的3人中至少有2人经常网购的概率;②将频率视为概率,从我市所有参与调查的市民中随机抽取10人赠送礼品,记其中经常网购的人数为X,求随机变量X的数学期望和方差.参考公式:22nadbcKabcdacbd20PKK0.150.100.050.0250.0100.0050.0010K2.0722.7063.8415.0246.6357.87910.828【答案】(Ⅰ)详见解析;(Ⅱ)①4960;②数学期望为6,方差为2.4.【解析】(1)完成列联表(单位:人):经常网购偶尔或不用网购合计4男性5050100女性7030100合计12080200由列联表,得:2220050305070258.3336.635120801001003K,∴能在犯错误的概率不超过0.01的前提下认为我市市民网购与性别有关.(2)①由题意所抽取的10名女市民中,经常网购的有70107100人,偶尔或不用网购的有30103100人,∴选取的3人中至少有2人经常网购的概率为:2137373104960cccPc.②由22列联表可知,抽到经常网购的市民的频率为:1200.6200,将频率视为概率,∴从我市市民中任意抽取一人,恰好抽到经常网购市民的概率为0.6,由题意100.6XB,,∴随机变量X的数学期望100.66EX,方差D(X)=100.60.42.4DX.3.(华大新高考联盟2018届高三上学期11月教学质量测评理)某种子公司对一种新品种的种子的发芽多少与昼夜温差之间的关系进行分析研究,以便选择最合适的种植条件.他们分别记录了10块试验地每天的昼夜温差和每块实验地里50颗种子的发芽数,得到如下资料:(1)从上述十组试验数据来看,是否可以判断昼夜温差与发芽数之间具有相关关系?是否具有线性相关关5系?(2)若在一定温度范围内,昼夜温差与发芽数近似满足相关关系:ˆˆybza(其中2(12)zx).取后五组数据,利用最小二乘法求出线性回归方程ˆˆybza(精确到0.01);(3)利用(2)的结论,若发芽数试验值与预测值差的绝对值不超过3个就认为正常,否则认为不正常.从上述十组试验中任取三组,至少有两组正常的概率是多少?附:回归直线方程ˆˆybza的斜率和截距的最小二乘估计公式分别为1221ˆniiiniixynxybxnx,ˆˆaybx【答案】(1)可以判断昼夜温差与发芽数之间具有相关关系,不具有线性相关关系;(2)0.8427.ˆ84yz(3)1415p【解析】(1)可以判断昼夜温差与发芽数之间具有相关关系,不具有线性相关关系;(2)6,22.8zy,1221ˆ5386840.84354180niiiniixynxybxnx,22.ˆˆ80.84627.84aybz,0.8427.ˆ84yz.(3)十组数据中有两组不正常,128231014115CCPC(或32188231056561412015CCCPC).4.(湖南省2017届高三高考冲刺预测卷六理)已知某蔬菜商店买进的土豆x(吨)与出售天数y(天)之间的关系如下表所示:6x234567912y12334568(1)请根据上表数据在下列网格纸中绘制散点图;(2)请根据上表提供的数据,用最小二乘法求出y关于x的线性回归方程ˆybxa(其中,ab保留三位小数);(注:1221,niiiniixynxybaybxxnx)(3)在表格中(,xy的8个对应点中,任取3个点,记这3个点在直线ybxa的下方的个数为X,求X的分布列和数学期望.【答案】(1)见解析(2)0.68400ˆ.14yx(3)见解析【解析】(1)散点图如下所示:7(2)依题意,123456791268x,11233456848y,821491625364981144364iix,8126121524355496244iiixy,81822218244864520.68436486768iiiiixyxybxx,∴40.68460.104a;∴回归直线方程为0.68400ˆ.14yx(注:0.68400ˆ.15yx也可)(3)在,xy对应的8个点中,有4个点在直线ybxa的下方,所以X的可能取值为0,1,2,3,3211234444443333888813310,1,2,3147714CCCCCCPXPXPXPXCCCC,∴X的分布列为X0123P1143737114X的数学期望1331301231477142EX.5.(山东省栖霞市2019届高三高考模拟卷数学理)李克强总理在2018年政府工作报告指出,要加快建设创新型国家,把握世界新一轮科技革命和产业变革大势,深入实施创新驱动发展战略,不断增强经济创新力和竞争力.某手机生产企业积极响应政府号召,大力研发新产品,争创世界名牌.为了对研发的一批最新款手机进行合理定价,将该款手机按事先拟定的价格进行试销,得到一组销售数据,(1,2,,6)iixyi,如表所示:8单价x(千元)345678销量y(百件)7065625956t已知611606iiyy.(1)若变量,xy具有线性相关关系,求产品销量y(百件)关于试销单价x(千元)的线性回归方程ˆˆˆybxa;(2)用(1)中所求的线性回归方程得到与ix对应的产品销量的估计值iy.当销售数据,iixy对应的残差的绝对值ˆ1iiyy时,则将销售数据,iixy称为一个“好数据”.现从6个销售数据中任取3个子,求“好数据”个数的分布列和数学期望()E.(参考公式:线性回归方程中ˆˆ,ba的估计值分别为1221ˆˆˆ,)niiiniixynxybaybxxnx.【答案】(1)ˆ482yx(2)见解析【解析】(1)由611606iiyy,可求得48t,故11910niiixy,=1980nxy,21199niix,2=181.5nx,代入可得122119101980704199181.517.5niiiniixynxybxnx,ˆˆ6045.582aybx,所以所求的线性回归方程为ˆ482yx.(2)利用(1)中所求的线性回归方程ˆ482yx可得,当13x时,170y;当24x时,266y;当35x时,362y;当46x时,458y;当57x时,554y;当68x时,650y.9与销售数据对比可知满足||1(1,2,,6)iiyyi的共有4个“好数据”:(3,70)、(4,65)、(5,62)、(6,59)于是的所有可能取值为1,2,31242361(1)5CCPC,2142363(2)5CCPC,3042361(3)5CCPC,∴的分布列为:123P153515所以1311232555E.6.(江西省鹰潭市2019届高三第一次模拟考试理)近年来,随着我国汽车消费水平的提高,二手车流通行业得到迅猛发展.某汽车交易市场对2017年成交的二手车交易前的使用时间(以下简称“使用时间”)进行统计,得到频率分布直方图如图1.附注:①对于一组数据11,uv,22,uv,…,,nnuv,其回归直线vu的斜率和截距的最小二乘估计分别为121niiiniiuuvvuu,ˆavu;②参考数据:2.9519.1e,1.755.75e,0.551.73e,0.650.52e,1.850.16e.(Ⅰ)记“在2017年成交的二手车中随机选取一辆,该车的使用年限在(8,16]”为事件A,试估计A的概率;(Ⅱ)根据该汽车交易市场的历史资料,得到散点图如图2,其中x(单位:年)表示二手车的使用时间,10y(单位:万元)表示相应的二手车的平均交易价格.由散点图看出,可采用abxye作为二手车平均交易价格y关于其使用年限x的回归方程,相关数据如下表(表中lniiYy,1110niiYY):xyY101iiixy101iiixY