11-4变量间的相关关系、统计案例课时作业A组——基础对点练1.(2019·湖北七市联考)为研究语文成绩和英语成绩之间是否具有线性相关关系,统计某班学生的两科成绩得到如图所示的散点图(x轴、y轴的单位长度相同),用回归直线方程y^=b^x+a^近似地刻画其相关关系,根据图形,以下结论最有可能成立的是()A.线性相关关系较强,b的值为1.25B.线性相关关系较强,b的值为0.83C.线性相关关系较强,b的值为-0.87D.线性相关关系较弱,无研究价值【解析】由散点图可以看出两个变量所构成的点在一条直线附近,所以线性相关关系较强,且应为正相关,所以回归直线方程的斜率应为正数,且从散点图观察,回归直线方程的斜率应该比y=x的斜率要小一些,综上可知应选B.【答案】B2.(2019·兰州、张掖联考)对具有线性相关关系的变量x,y有一组观测数据(xi,yi)(i=1,2,…,8),其回归直线方程是y^=13x+a^,且x1+x2+x3+…+x8=2(y1+y2+y3+…+y8)=6,则实数a^的值是()A.116B.18C.14D.12【解析】依题意可知样本中心点为34,38,则38=13×34+a^,解得a^=18.【答案】B3.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),算得K2=110×(40×30-20×20)260×50×60×50≈7.8.附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”【解析】根据独立性检验的定义,由K2≈7.86.635,可知我们在犯错误的概率不超过0.01的前提下,即有99%以上的把握认为“爱好该项运动与性别有关”,故选C.【答案】C4.为了研究某班学生的脚长x(单位:厘米)和身高y(单位:厘米)的关系,从该班随机抽取10名学生,根据测量数据的散点图可以看出y与x之间有线性相关关系,设其回归直线方程为该班某学生的脚长为24,据此估计其身高为()A.160B.163C.166D.170【解析】由已知=160,∴a^=160-4×22.5=70,y=4×24+70=166,选C.【答案】C5.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀合计甲班10b乙班c30合计附:P(K2≥k0)0.050.0250.0100.005k03.8415.0246.6357.879已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是()A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按97.5%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按97.5%的可靠性要求,不能认为“成绩与班级有关系”【解析】由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,得到K2=105×(10×30-20×45)255×50×30×75≈6.1095.024,因此有97.5%的把握认为“成绩与班级有关系”.【答案】C6.已知变量x,y具有线性相关关系,它们之间的一组数据如下表所示,若y关于x的线性回归方程为y^=1.3x-1,则m=__________.x1234y0.11.8m4【解析】由题意,=2.5,代入线性回归方程为y^=1.3x-1,可得=2.25,∴0.1+1.8+m+4=4×2.25,∴m=3.1.故答案为3.1.【答案】3.17.(2019·济宁模拟)已知下表所示数据的回归直线方程为y^=4x+242,则实数a=________.x23456y251254257a266【解析】回归直线y^=4x+242必过样本点的中心(,),而=2+3+4+5+65=4,=251+254+257+a+2665=1028+a5,∴1028+a5=4×4+242,解得a=262.【答案】2628.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:理科文科总计男131023女72027总计203050已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=50×(13×20-10×7)223×27×20×30≈4.844,则有________的把握认为选修文科与性别有关.【解析】由题意知,k=50×(13×20-10×7)223×27×20×30≈4.844,因为5.024>4.844>3.841,所以有95%的把握认为选修文科与性别有关.【答案】95%9.“一带一路”国际合作高峰论坛圆满落幕了,相关话题在网络上引起了网友们的高度关注,为此,21财经APP联合UC推出“一带一路”大数据微报告,在全国抽取的7亿网民(其中30%为高学历)中有2亿人(其中70%为高学历)对此关注.(1)根据以上统计数据填写下面2×2列联表.高学历网民非高学历网民总计关注不关注总计(2)根据列联表,用独立性检验的方法分析,能否有99%的把握认为“一带一路”的关注度与学历有关系?附参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),n=a+b+c+d.P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828【解析】(1)高学历网民非高学历网民总计关注1.4×1080.6×1082×108不关注0.7×1084.3×1085×108总计2.1×1084.9×1087×108(2)K2的观测值k=7×108×(1.4×108×4.3×108-0.6×108×0.7×108)22.1×108×4.9×108×2×108×5×108≈2.13×108,因为2.13×1086.635,所以有99%的把握认为“一带一路”的关注度与学历有关系.10.从某居民区随机抽取10个家庭,获得第i个家庭的月收入xi(单位:千元)与月储蓄yi(单位:千元)的数据资料,(1)求家庭的月储蓄y对月收入x的线性回归方程y^=b^x+a^.(2)判断变量x与y之间是正相关还是负相关.(3)若该居民区某家庭月收入为7千元,预测该家庭的月储蓄.【解析】(1)由题意知n=10,x=1ni=1nxi=8010=8,y-=1ni=1nyi=2010=2,a^=-b^=2-0.3×8=-0.4,故所求线性回归方程为y^=0.3x-0.4.(2)由于变量y的值随x值的增加而增加(b^=0.30),故x与y之间是正相关.(3)将x=7代入回归方程可以预测该家庭的月储蓄为y=0.3×7-0.4=1.7(千元).B组——能力提升练1.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y^=3-5x,变量x增加一个单位时,y平均增加5个单位;③回归方程y^=b^x+a^必过(x-,y-);④有一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是()A.0B.1C.2D.3【解析】一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y^=3-5x,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y^=b^x+a^必过点(x-,y-),③正确;因为K2=13.0796.635,故有99%的把握确认这两个变量有关系,④正确.故选B.【答案】B2.已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归方程y^=b^x+a^,若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y^=b′x+a′,则以下结论正确的是()A.b^b′,a^a′B.b^b′,a^a′C.b^b′,a^a′D.b^b′,a^a′【解析】b′=2,a′=-2,∴b^b′,a^a′.选C.【答案】C3.某车间为了规定工时定额,需要确定加工零件所花费的时间,为此进行了5次试验.根据收集到的数据(如下表),由最小二乘法求得回归方程y=0.67x+54.9.零件数x(个)1020304050加工时间y(min)62758189现发现表中有一个数据看不清,请你推断出该数据的值为__________.【解析】a+62+75+81+895=75,计算得a=68.【答案】684.为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球总计男生20525女生101525总计302050则有__________的把握认为喜爱打篮球与性别有关(请用百分数表示).【解析】K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d)=50×(20×15-5×10)225×25×30×20≈8.3336.635,所以有99%的把握认为喜爱打篮球与性别有关.【答案】99%5.电视传媒公司为了解某地区电视观众对某个类体育节目的收视情况,随机抽取了100名观众进行调查,其中女性有55名,下图是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”,已知“体育迷”中有10名女性.(1)根据已知条件完成下面的2×2列联表,并据此资料判断是否有95%的把握认为“体育迷”与性别有关?非体育迷体育迷合计男女合计(2)将日均收看该体育节目不低于50分钟的观众称为“超级体育迷”,已知“超级体育迷”中有2名女性,若从“超级体育迷”中任意选取2人,求至少有1名女性观众的概率.附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d.P(K2≥k0)0.050.01k03.8416.635【解析】(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而完成2×2列联表如下:非体育迷体育迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得K2=100×(30×10-45×15)275×25×45×55=10033≈3.030因为3.030<3.841,所以我们没有95%的把握认为“体育迷”与性别有关.(2)由频率分布直方图可知,“超级体育迷”为5人,从而一切可能结果所组成的基本事件为(a1,a2),(a1,a3),(a2,a3),(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2),其中ai表示男性,i=1,2,3,bj表示女性,j=1,2.由10个基本事件组成,而且这些基本事件的出现是等可能的.用A表示“任选2人中,至少有1人是女性”这事件,则A={(a1,b1),(a1,b2),(a2,b1),(a2,b2),(a3,b1),(a3,b2),(b1,b2)},事件A由7个基本事件组成,因而P(A)=710