章末综合测评(一)统计案例(时间120分钟,满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的.)1.在下列各量与量的关系中是相关关系的为()①正方体的体积与棱长之间的关系;②一块农田的水稻产量与施肥量之间的关系;③人的身高与年龄之间的关系;④家庭的支出与收入之间的关系;⑤某户家庭用电量与电费之间的关系.A.①②③B.③④C.④⑤D.②③④【解析】①⑤是一种确定性关系,属于函数关系.②③④正确.【答案】D2.(2016·哈尔滨高二检测)散点图在回归分析过程中的作用是()A.查找个体个数B.比较个体数据大小关系C.探究个体分类D.粗略判断变量是否线性相关【解析】由散点图可以粗略地判断两个变量是否线性相关,故选D.【答案】D3.身高与体重有关系可以用________来分析.()A.残差B.回归分析C.等高条形图D.独立性检验【解析】因为身高与体重是两个具有相关关系的变量,所以要用回归分析来解决.【答案】B4.一位母亲记录了她儿子3岁到9岁的身高,建立了她儿子身高与年龄的回归模型y^=73.93+7.19x,她用这个模型预测儿子10岁时的身高,则下面的叙述正确的是()A.她儿子10岁时的身高一定是145.83cmB.她儿子10岁时的身高一定是145.83cm以上C.她儿子10岁时的身高在145.83cm左右D.她儿子10岁时的身高一定是145.83cm以下【解析】由回归模型得到的预测值是可能取值的平均值,而不是精确值,故选C.【答案】C5.下列关于等高条形图的叙述正确的是()A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条形图中可以看出两个变量频数的相对大小C.从等高条形图可以粗略地看出两个分类变量是否有关系D.以上说法都不对【解析】在等高条形图中仅能粗略地判断两个分类变量的关系,故A错.在等高条形图中仅能够找出频率,无法找出频数,故B错.【答案】C6.(2016·咸阳高二检测)已知一个线性回归方程为y^=1.5x+45,其中x的取值依次为1,7,5,13,19,则y=()A.58.5B.46.5C.60D.75【解析】∵x=15(1+7+5+13+19)=9,回归直线过样本点的中心(x-,y-),∴y-=1.5×9+45=58.5.【答案】A7.若两个变量的残差平方和是325,i=1n(yi-y^i)2=923,则随机误差对预报变量的贡献率约为()A.64.8%B.60%C.35.2%D.40%【解析】相关指数R2表示解释变量对于预报变量变化的贡献率,故随机误差对预报变量的贡献率为残差平方和总偏差平方和×100%=325923×100%≈35.2%,故选C.【答案】C8.在研究吸烟与患肺癌的关系中,通过收集数据并整理、分析,得到“吸烟与患肺癌有关”的结论,并且有99%的把握认为这个结论成立.下列说法正确的个数是()①在100个吸烟者中至少有99个人患肺癌;②如果一个人吸烟,那么这个人有99%的概率患肺癌;③在100个吸烟者中一定有患肺癌的人;④在100个吸烟者中可能一个患肺癌的人也没有.【导学号:19220008】A.4B.3C.2D.1【解析】有99%的把握认为“吸烟与患肺癌有关”,指的是“吸烟与患肺癌有关”这个结论成立的可能性或者可信程度有99%,并不表明在100个吸烟者中至少有99个人患肺癌,也不能说如果一个人吸烟,那么这个人就有99%的概率患肺癌;更不能说在100个吸烟者中一定有患肺癌的人,反而有可能在100个吸烟者中,一个患肺癌的人也没有.故正确的说法仅有④,选D.【答案】D9.下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图1中可以看出()图1A.性别与喜欢理科无关B.女生中喜欢理科的百分比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的百分比为60%【解析】从题图中可以分析,男生喜欢理科的可能性比女生大一些.【答案】C10.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35,若判断变量X和Y有关出错概率不超过2.5%,则c等于()A.3B.4C.5D.6【解析】列2×2列联表如下:x1x2总计y1ab31y2cd35总计10+c21+d66故K2的观测值k=66×[1035-c-21c]231×35×10+c56-c≥5.024.将选项A、B、C、D代入验证可知选A.【答案】A11.在两个学习基础相当的班级实行某种教学措施的试验,测试结果见下表,则试验效果与教学措施()优、良、中差总计实验班48250对比班381250总计8614100A.有关B.无关C.关系不明确D.以上都不正确【解析】随机变量K2的观测值为k=100×48×12-38×2250×50×86×14≈8.3067.879,则认为“试验效果与教学措施有关”的概率为0.995.【答案】A12.为预测某种产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取了8组观测值.计算知i=18xi=52,i=18yi=228,i=18x2i=478,i=18xiyi=1849,则y对x的回归方程是()A.y^=11.47+2.62xB.y^=-11.47+2.62xC.y^=2.62+11.47xD.y^=11.47-2.62x【解析】由已知数据计算可得b^=2.62,a^=11.47,所以回归方程是y^=11.47+2.62x,故选A.【答案】A二、填空题(本大题共4小题,每小题5分,共20分.将答案填在题中的横线上.)13.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2的值为________.【解析】由ei恒为0,知yi=y^i,即yi-y^i=0,故R2=1-∑ni=1yi-y^i2∑ni=1yi-y-2=1-0=1.【答案】114.已知方程y^=0.85x-82.71是根据女大学生的身高预报体重的回归方程,其中x的单位是cm,y的单位是kg,那么针对某个体(160,53)的随机误差是________.【解析】因为回归方程为y^=0.85x-82.71,所以当x=160时,y^=0.85×160-82.71=53.29,所以针对某个体(160,53)的随机误差是53-53.29=-0.29.【答案】-0.2915.为了判断高中三年级学生是否选修文科与性别的关系,现随机抽取50名学生,得到如下2×2列联表:理科文科男1310女720已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到k=50×13×20-10×7223×27×20×30≈4.844,则认为“选修文科与性别有关系”出错的可能性为________.【解析】k≈4.8443.841,故判断出错的概率为0.05.【答案】0.0516.若对于变量y与x的10组统计数据的回归模型中,相关指数R2=0.95,又知残差平方和为120.53,那么i=110(yi-y)2的值为________.【解析】∵R2=1-i=110yi-y^i2i=110yi-y2,残差平方和i=110(yi-y^i)2=120.53,∴0.95=1-120.53i=110yi-y2,∴i=110(yi-y)2=2410.6.【答案】2410.6三、解答题(本大题共6小题,共70分.解答时应写出必要的文字说明、证明过程或演算步骤.)17.(本小题满分10分)假设某农作物基本苗数x与有效穗y之间存在相关关系,今测得5组数据如下:x15.025.830.036.644.4y39.442.942.943.149.2请画出散点图,并用散点图粗略地判断x,y是否线性相关.【解】散点图如图所示.从散点图可以看出这些点大致分布在一条直线附近,所以x,y线性相关.18.(本小题满分12分)吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表:男女总计喜欢吃零食51217不喜欢吃零食402868总计454085请问喜欢吃零食与性别是否有关?【解】k=nad-bc2a+bc+da+cb+d,把相关数据代入公式,得k=85×5×28-40×12217×68×45×40≈4.7223.841.因此,在犯错误的概率不超过0.05的前提下,可以认为“喜欢吃零食与性别有关”.19.(本小题满分12分)(2016·曲阜师大附中高二检测)为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483m7568根据最小二乘法建立的回归直线方程为y^=-20x+250.(1)试求表格中m的值;(2)预计在今后的销售中,销量与单价仍然服从建立的回归方程,且该产品的成本是5元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)【导学号:19220009】【解】(1)由于x=16(8+8.2+8.4+8.6+8.8+9)=8.5,所以y=-20×8.5+250=80,故16(90+84+83+m+75+68)=80,解得m=80.(2)设工厂获得的利润为L元,依题意得L=(x-5)(-20x+250)=-20x2-352x+1252(x0),所以x=8.75时,L取得最大值.故当单价定为8.75元/件时,工厂可获得最大利润.20.(本小题满分12分)如图2是对用药与不用药,感冒已好与未好进行统计的等高条形图.若此次统计中,用药的患者是70人,不用药的患者是40人,试问:能否在犯错误的概率不超过0.001的前提下认为“感冒已好与用药有关”?图2【解】根据题中的等高条形图,可得在用药的患者中感冒已好的人数为70×810=56,在不用药的患者中感冒已好的人数为40×310=12.2×2列联表如下:感冒已好感冒未好总计用药561470不用药122840总计6842110根据表中数据,得到k=110×56×28-12×14270×40×68×42≈26.9610.828.因此,能在犯错误的概率不超过0.001的前提下认为感冒已好与用药有关系.21.(本小题满分12分)(2016·湛江高二检测)某车间为了规定工时定额,需要确定加工零件所花费的时间,为此作了四次试验,得到的数据如下:零件个数x(个)2345加工时间y(小时)2.5344.5(1)在给定的坐标系中画出表中数据的散点图;图3(2)求出y关于x的线性回归方程y^=b^x+a^,并在坐标系中画出回归直线;(3)试预测加工10个零件需要多少时间?参考公式:回归直线y^=b^x+a^,其中b^=i=1nxi-xyi-yi=1nxi-x2=i=1nxiyi-nx-y-i=1nx2i-nx2,a^=y^-b^x-.【解】(1)散点图如图:(2)由表格计算得i=14xiyi=52.5,x=3.5,y=3.5,i=14x2i=54,所以b^=0.7,a^=1.05,所以y^=0.7x+1.05,回归直线如上图;(3)将x=10代入回归直线方程得y^=0.7×10+1.05=8.05(小时),所以预测加工10个零件需要8.05小时.22.(本小题满分12分)为了研究某种细菌随时间x变化时,繁殖个数y的变化,收集数据如下:天数x/天123456繁殖个数y/个612254995190(1)用天数x作解释变量,繁殖个数y作预报变量,作出这些数据的散点图;(2)描述解释变量x与预报变量y之间的关系;(3)计算相关指数.【解】(1)所作散点图如图所示.(2)由散点图看出样本点分布在一条指数型函数y=c1ec2x的周围,于是令z=lny,则x123456z1.792.483.223.894.555.25由计算得