11.3变量间的相关关系、统计案例一、选择题1.有五组变量:①汽车的重量和汽车每消耗1升汽油所行驶的平均路程;②平均日学习时间和平均学习成绩;③某人每日吸烟量和身体健康情况;④圆的半径与面积;⑤汽车的重量和每千米耗油量.其中两个变量成正相关的是()A.①③B.②④C.②⑤D.④⑤解析由变量的相关关系的概念知,②⑤是正相关,①③是负相关,④为函数关系,故选C.答案C2.通过随机询问110名不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由2222()110(40302030)7.8()()()()60506050nadbcKKabcdacbd算得,附表:2()PKk0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”解析由27.86.635K,而2(6.635)0.010PK,故由独立性检验的意义可知选A.答案A3.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的,则下列说法中正确的是().A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析统计的结果只是说明事件发生可能性的大小,具体到一个个体不一定发生.答案D4.设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是().A.直线l过点(x,y)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同解析由样本的中心(x,y)落在回归直线上可知A正确;x和y的相关系数表示为x与y之间的线性相关程度,不表示直线l的斜率,故B错;x和y的相关系数应在-1到1之间,故C错;分布在回归直线两侧的样本点的个数并不绝对平均,即无论样本点个数是奇数还是偶数,故D错.答案A5.某产品的广告费用x与销售额y的统计数据如下表:广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时销售额为().A.63.6万元B.65.5万元C.67.7万元D.72.0万元解析x=4+2+3+54=3.5(万元),y=49+26+39+544=42(万元),∴a^=y-b^x=42-9.4×3.5=9.1,∴回归方程为y^=9.4x+9.1,∴当x=6(万元)时,y^=9.4×6+9.1=65.5(万元).答案B6.已知数组(x1,y1),(x2,y2),…,(x10,y10)满足线性回归方程y^=bx+a,则“(x0,y0)满足线性回归方程y^=bx+a”是“x0=x1+x2+…+x1010,y0=y1+y2+…+y1010”的().A.充分不必要条件B.必要不充分条件C.充要条件D.既不充分也不必要条件解析x0,y0为这10组数据的平均值,又因为线性回归方程y^=bx+a必过样本中心(x,y),因此(x,y)一定满足线性回归方程,但满足线性回归方程的除了(x,y)外,可能还有其他样本点.答案B7.在第29届奥运会上,中国健儿取得了51金、21银、28铜的好成绩,稳居世界金牌榜榜首,由此许多人认为中国进入了世界体育强国之列,也有许多人持反对意见.有网友为此进行了调查,在参加调查的2548名男性公民中有1560名持反对意见,2452名女性公民中有1200人持反对意见,在运用这些数据说明中国的奖牌数是否与中国进入体育强国有无关系时,用什么方法最有说服力().A.平均数与方差B.回归直线方程C.独立性检验D.概率解析由于参加讨论的公民按性别被分成了两组,而且每一组又被分成了两种情况:认为有关与无关,故该资料取自完全随机统计,符合2×2列联表的要求,故用独立性检验最有说服力.答案C二、填空题8.在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为________.解析根据样子相关系数的定义可知,当所有样本点都在直线上时,相关系数为1.答案189.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.解析K2≈3.9183.841,而P(K2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①.答案①10.调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y^=0.254x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.解析由题意,知其回归系数为0.254,故家庭年收入每增加1万元,年饮食支出平均增加0.254万元.答案0.25411.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:气温(℃)181310-1杯数24343864由表中数据算得线性回归方程y^=bx+a中的b≈-2,预测当气温为-5℃时,热茶销售量为________杯(已知回归系数解析根据表格中的数据可求得x=14×(18+13+10-1)=10,y=14×(24+34+38+64)=40(杯).∴a=y-bx=40-(-2)×10=60,∴y^=-2x+60,当x=-5时,y^=-2×(-5)+60=70(杯).答案7012.某医疗研究所为了了解某种血清预防感冒的作用,把500名使用过血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表知P(K2≥3.841)≈0.05.则下列结论中,正确结论的序号是________.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.解析因为K2≈3.918≥3.841,而P(K2≥3.814)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”.要注意我们检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆.答案①三、解答题13.在某地区的12~30岁居民中随机抽取了10个人的身高和体重的统计资料如表:身高(cm)143156159172165171177161164160体重(kg)41496179686974696854根据上述数据,画出散点图并判断居民的身高和体重之间是否有相关关系.解析以x轴表示身高,y轴表示体重,可得到相应的散点图如图所示:由散点图可知,两者之间具有相关关系,且为正相关.14.某地最近十年粮食需求量逐年上升,下表是部分统计数据:年份20022004200620082010需求量(万吨)236246257276286(Ⅰ)利用所给数据求年需求量与年份之间的回归直线方程ybxa;(Ⅱ)利用(Ⅰ)中所求出的直线方程预测该地2012年的粮食需求量。15.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩后,得到如下的列联表.优秀非优秀总计甲班10乙班30合计105已知从全部105人中随机抽取1人为优秀的概率为27.(1)请完成上面的列联表;(2)根据列联表的数据,若按95%的可靠性要求,能否认为“成绩与班级有关系”;(3)若按下面的方法从甲班优秀的学生中抽取一人:把甲班优秀的10名学生从2到11进行编号,先后两次抛掷一枚均匀的骰子,出现的点数之和为被抽取人的序号.试求抽到6号或10号的概率.附K2=nad-bc2a+bc+da+cb+d,解析(1)优秀非优秀总计甲班104555乙班203050合计3075105(2)根据列联表中的数据,得到k=-255×50×30×75≈6.109>3.841,因此有95%的把握认为“成绩与班级有关系”.(3)设“抽到6号或10号”为事件A,先后两次抛掷一枚均匀的骰子,出现的点数为(x,y),则所有的基本事件有(1,1)、(1,2)、(1,3)、…、(6,6),共36个.事件A包含的基本事件有(1,5),(2,4),(3,3),(4,2),(5,1),(4,6),(5,5),(6,4),共8个,∴P(A)=836=29.16.地震、海啸、洪水、森林大火等自然灾害频繁出现,紧急避险常识越来越引起人们的重视.某校为了了解学生对紧急避险常识的了解情况,从七年级和八年级各选取100名同学进行紧急避险常识知识竞赛.图K55-2(1)和图K55-2(2)分别是对七年级和八年级参加竞赛的学生成绩按[40,50),[50,60),[60,70),[70,80]分组,得到的频率分布直方图.图K55-2(1)分别计算参加这次知识竞赛的两个年级学生的平均成绩;(注:统计方法中,同一组数据常用该组区间的中点值作为代表)(2)完成下面2×2列联表,并回答是否有99%的把握认为“两个年级学生对紧急避险常识的了解有差异”?成绩小于60分人数成绩不小于60分人数合计七年级八年级合计附:K2=nad-bc2a+bc+da+cb+d.临界值表:P(K2≥k)0.100.050.010k2.7063.8416.635解析(1)七年级学生竞赛平均成绩为(45×30+55×40+65×20+75×10)÷100=56(分),八年级学生竞赛平均成绩为(45×15+55×35+65×35+75×15)÷100=60(分).(2)2×2列联表如下:成绩小于60分人数成绩不小于60分人数合计七年级7030100八年级5050100合计12080200∴K2=-2100×100×120×80≈8.3336.635,∴有99%的把握认为“两个年级学生对紧急避险常识的了解有差异”.