数学教师用书配套习题课时提升作业(六十一)94相关性最小二乘估计回归分析与独立性检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

-1-课时提升作业(六十一)相关性、最小二乘估计、回归分析与独立性检验(25分钟60分)一、选择题(每小题5分,共25分)1.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为y=0.01x+0.5,则加工600个零件大约需要的时间为()A.6.5hB.5.5hC.3.5hD.0.5h【解析】选A.将x=600代入线性回归方程即得A.2.下列关于χ2的说法中正确的是()A.χ2在任何相互独立问题中都可以用来检验有关还是无关B.χ2的值越大,两个事件的相关性就越大C.χ2是用来判断两个分类变量是否有关系的随机变量,只对于两个分类变量适合D.χ2的计算公式为χ2=【解析】选C.χ2值是用来判断两个分类变量是否有关系的一个随机变量,并不是适用于任何独立问题的相关性检验.3.某卫生机构对366人进行健康体检,阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,则有的把握认为糖尿病患者与遗传有关系.()A.0.1%B.0.5%C.99%D.95%【解析】选D.可以先作出如下列联表(单位:人):-2-糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计阳性家族史1693109阴性家族史17240257总计33333366根据列联表中的数据,得χ2=≈6.0673.841.故有95%的把握认为糖尿病患者与遗传有关系.4.冶炼某种金属可以用旧设备和改造后的新设备,为了检验用这两种设备生产的产品中所含杂质的关系,调查结果如表所示:杂质高杂质低旧设备37121新设备22202根据以上数据,则()A.含杂质的高低与设备是否改造有关B.含杂质的高低与设备是否改造无关C.设备是否改造不能决定含杂质的高低D.以上答案都不对【解析】选A.由已知数据得到如下2×2列联表:杂质高杂质低总计-3-旧设备37121158新设备22202224总计59323382由公式得χ2=≈13.11,由于13.116.635,故有99%的把握认为含杂质的高低与设备是否改造有关.5.某著名纺织集团为了减轻生产成本继续走高的压力,计划提高某种产品的价格,为此销售部在10月1日至10月5日连续五天对某个大型批发市场中该产品一天的销售量及其价格进行了调查,其中该产品的价格x(元)与销售量y(万件)之间的数据如下表所示:日期10月1日10月2日10月3日10月4日10月5日价格x(元)99.51010.511销售量y(万件)1110865已知销售量y与价格x之间具有线性相关关系,其回归直线方程为:=-3.2x+,若该集团提高价格后该批发市场的日销售量为7.36万件,则该产品的价格约为()A.14.2元B.10.8元C.14.8元D.10.2元【解析】选D.依题意=10,=8.因为线性回归直线必过样本点的中心(,),所以8=-3.2×10+,解得=40.所以回归直线方程为=-3.2x+40.-4-令y=7.36,则7.36=-3.2x+40,解得x=10.2.所以该产品的价格约为10.2元.二、填空题(每小题5分,共15分)6.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得χ2≈3.918,P(χ2≥3.841)≈0.05.则下列结论中,正确结论的序号是.①有95%的把握认为“这种血清能起到预防感冒的作用”;②若某人未使用该血清,那么他在一年中有95%的可能性得感冒;③这种血清预防感冒的有效率为95%;④这种血清预防感冒的有效率为5%.【解析】χ2≈3.9183.841,而P(χ2≥3.841)≈0.05,所以有95%的把握认为“这种血清能起到预防感冒的作用”;但检验的是假设是否成立和该血清预防感冒的有效率是没有关系的,不是同一个问题,不要混淆,正确序号为①.答案:①7.考古学家通过始祖鸟化石标本发现:其股骨长度x(cm)与肱骨长度y(cm)的线性回归方程为y=1.197x-3.660,由此估计,当股骨长度为50cm时,肱骨长度的估计值为cm.【解析】根据线性回归方程y=1.197x-3.660,将x=50代入得y=56.19,则肱骨长度的估计值为56.19cm.-5-答案:56.198.(2015·咸阳模拟)某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:x16171819y50344131由上表,可得线性回归方程y=bx+a中的b=-4,据此模型预计零售价定为15元时,每天的销售量为.【解析】=17.5,=39,因为b=-4,=b+a,所以a=39+4×17.5=109,所以线性回归方程为y=-4x+109,所以当x=15时,y=-4×15+109=49(件).答案:49三、解答题(每小题10分,共20分)9.(2015·重庆模拟)假设关于某市的房屋面积x(平方米)与购房费用y(万元),有如下的统计数据:x(平方米)8090100110y(万元)42465359(1)用最小二乘法求出y关于x的线性回归方程y=bx+a.(假设已知y对x呈线性相关)(2)若在该市购买120平方米的房屋,估计购房费用是多少?-6-【解析】(1)=95,=50,代入公式求得b=0.58,a=-5.1.所以线性回归方程为y=0.58x-5.1.(2)将x=120代入线性回归方程得y=64.5(万元).所以购买120平方米的房屋时,估计购房费用是64.5万元.【加固训练】假定小麦基本苗数x(千棵)与成熟期有效穗数y(千棵)之间存在相关关系,今测得5组数据如下:x(千棵)15.025.830.036.644.4y(千棵)39.442.942.943.149.2(1)以x为解释变量,y为预报变量,作出散点图.(2)求y与x之间的线性回归方程.【解析】(1)散点图如图所示:(2)由散点图可以看出x与y之间具有线性相关关系,设线性回归方程为y=bx+a.计算可得b≈0.291,a≈34.664.故所求线性回归方程为y=0.291x+34.664.10.(2015·宜春模拟)“开门大吉”是某电视台推出的游戏益智节目.选手面对1-4号4扇大门,依次按响门上的门铃,门铃会播放一段音乐(将一首经典流行歌曲以单音色旋律的方式演绎),选手需正确回答出这首歌的名字,方可获得该扇门对应的家庭梦想基金.在一次场外调查-7-中,发现参加比赛的选手多数分为两个年龄段:20~30;30~40(单位:岁),其猜对歌曲名称与否的人数如图所示.(1)写出2×2列联表:判断是否有90%的把握认为猜对歌曲名称与年龄有关?说明你的理由.(2)现计划在这次场外调查中按年龄段选取6名选手,并抽取3名幸运奖项,求至少有一人年龄在20~30岁之间的概率.【解析】(1)2×2列联表如下正确错误合计20~30(岁)10304030~40(岁)107080合计20100120根据列联表所给的数据可得χ2==3,因为32.706,所以有90%的把握认为猜对歌曲名称与年龄有关.(2)按照分层抽样方法可知:20~30(岁)抽取:6×=2(人);30~40(岁)抽取:6×=4(人),在上述抽取的6名选手中,年龄在20~30(岁)有2人,年龄在30~40(岁)有4人.-8-年龄在20~30(岁)记为(A,B);年龄在30~40(岁)记为(a,b,c,d),则从6名选手中任取3名的所有情况为:(A,B,a),(A,B,b),(A,B,c),(A,B,d),(A,a,b),(A,a,c),(A,a,d),(A,b,c),(A,b,d),(A,c,d),(B,a,b),(B,a,c),(B,a,d),(B,b,c),(B,b,d),(B,c,d),(a,b,c),(a,b,d),(a,c,d),(b,c,d)共20种情况.其中至少有一人年龄在20~30情况有:(A,B,a),(A,B,b),(A,B,c),(A,B,d),(A,a,b),(A,a,c),(A,a,d),(A,b,c),(A,b,d),(A,c,d),(B,a,b),(B,a,c),(B,a,d),(B,b,c),(B,b,d),(B,c,d),共16种情况.记至少有一人年龄在20~30岁为事件C,则P(C)==.所以至少有一人年龄在20~30岁之间的概率为.(20分钟40分)1.(5分)(2013·福建高考改编)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归方程为y=bx+a,若某同学根据上表中的前两组数据和求得的直线方程为y′=b′x+a′,则以下结论正确的是()A.bb′,aa′B.bb′,aa′C.bb′,aa′D.bb′,aa′-9-【解题提示】审题时,要注意“直线方程”和“回归方程”的区别.【解析】选C.过(1,0)和(2,2)的直线方程为y=2x-2,画出六点的散点图,回归直线的大概位置如图所示,显然b′b,aa′.2.(5分)(2015·吉林模拟)某社区医院为了了解社区老人与儿童每月感冒的人数y(人)与月平均气温x(℃)之间的关系,随机统计了某4个月的月患病(感冒)人数与当月平均气温,其数据如下表:月平均气温x(℃)171382月患病y(人)24334055由表中数据算出线性回归方程y=bx+a中的b=-2,气象部门预测下个月的平均气温约为6℃,据此估计该社区下个月老年人与儿童患病人数约为()A.38B.40C.46D.58【解析】选C.由表格得(,)为(10,38),因为y=bx+a中的b=-2,所以38=10×(-2)+a,解得:a=58,所以y=-2x+58,当x=6时,y=-2×6+58=46.-10-故选C.【加固训练】某炼钢厂废品率x(%)与成本y(元/吨)的线性回归方程为y=105.492+42.569x.当成本控制在176.5元/吨时,可以预计生产1000吨钢中,约有吨钢是废品.【解析】因为176.5=105.492+42.569x,所以x≈1.668,即成本控制在176.5元/吨时,废品率约为1.668%.所以生产1000吨钢中,约有1000×1.668%=16.68(吨)钢是废品.答案:16.683.(5分)某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2的列联表,根据列联表的数据,判断该学校15至16周岁的男生的身高和体重之间有关系的把握为.超重不超重总计偏高415不偏高31215总计71320【解析】由表可得a+b=5,c+d=15,a+c=7,b+d=13,ad=48,bc=3,n=20,所以χ2==≈5.934,由于5.9343.841,所以有95%的把握认为该学校15至16周岁的男生-11-的身高和体重之间有关系.答案:95%4.(12分)(2015·大庆模拟)2014年春晚过后,为了研究演员上春晚次数与受关注度的关系,某网站对其中一位经常上春晚的演员上春晚次数与受关注度进行了统计,得到如下数据:上春晚次数x(单位:次)246810粉丝数量y(单位:万人)10204080100(1)若该演员的粉丝数量y与上春晚次数x满足线性回归方程,试求回归方程y=bx+a,并就此分析,该演员上春晚12次时的粉丝数.(2)若用(i=1,2,3,4,5)表示统计数据时粉丝的“即时均值”(精确到整数),①求这5次统计数据时粉丝的“即时均值”的方差;②从“即时均值”中任选3组,求这三组数据之和不超过20的概率.【解析】(1)由题意可知,xiyi=1980,=220,=(2+4+6+8+10)=6,=(10+20+40+80+100)=50,所以b==12,所以a=-b=50-12×6=-22,所以y=12x-22.当x=12时,y=12×12-22=122.-12-即该演员上春晚12次时的粉丝数约为122万人.(2)经计算可知,这五组数据对应的“即时均值”分别为:5,5,7,10,10.①这五组

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功