阶段质量检测(一)统计案例(时间120分钟满分150分)一、选择题(本大题共12小题,每小题5分,共60分.在每小题给出的四个选项中,只有一项是符合题目要求的)1.对有线性相关关系的两个变量建立的回归直线方程y^=a^+b^x中,回归系数b^()A.可以小于0B.大于0C.能等于0D.只能小于0解析:选A∵b^=0时,则r=0,这时不具有线性相关关系,但b^可以大于0也可以小于0.2.每一吨铸铁成本y(元)与铸件废品率x%建立的回归方程y^=56+8x,下列说法正确的是()A.废品率每增加1%,成本每吨增加64元B.废品率每增加1%,成本每吨增加8%C.废品率每增加1%,成本每吨增加8元D.如果废品率增加1%,则每吨成本为56元解析:选C根据回归方程知y是关于x的单调增函数,并且由系数知x每增加一个单位,y平均增加8个单位.3.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()x45678910y14181920232528A.线性函数模型B.二次函数模型C.指数函数模型D.对数函数模型解析:选A画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.4.试验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y^=x+1B.y^=x+2C.y^=2x+1D.y^=x-1解析:选A由题意发现,(x,y)的四组值均满足y^=x+1,故y^=x+1为回归直线方程.5.下列关于等高条形图说法正确的是()A.等高条形图表示高度相对的条形图B.等高条形图表示的是分类变量的频数C.等高条形图表示的是分类变量的百分比D.等高条形图表示的是分类变量的实际高度解析:选C由等高条形图的特点及性质进行判断.6.根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn)的散点图分析存在线性相关关系,求得其回归方程y^=0.85x-85.7,则在样本点(165,57)处的残差为()A.54.55B.2.45C.3.45D.111.55解析:选B把x=165代入y^=0.85x-85.7,得y=0.85×165-85.7=54.55,由57-54.55=2.45,故选B.7.有甲、乙两个班级进行数学考试,按照大于等于85分为优秀,85分以下为非优秀统计成绩,得到如下所示的列联表:优秀非优秀总计甲班10b乙班c30总计105已知在全部105人中随机抽取1人,成绩优秀的概率为27,则下列说法正确的是()A.列联表中c的值为30,b的值为35B.列联表中c的值为15,b的值为50C.根据列联表中的数据,若按95%的可靠性要求,能认为“成绩与班级有关系”D.根据列联表中的数据,若按95%的可靠性要求,不能认为“成绩与班级有关系”解析:选C由题意知,成绩优秀的学生数是30,成绩非优秀的学生数是75,所以c=20,b=45,选项A、B错误.根据列联表中的数据,得到K2=105×10×30-20×45255×50×30×75≈6.1093.841,因此有95%的把握认为“成绩与班级有关系”,选项C正确.8.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为y^=0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%解析:选A将y=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83≈83%,即约为83%.9.为了研究男子的年龄与吸烟的关系,抽查了100个男子,按年龄超过和不超过40岁,吸烟量每天多于和不多于20支进行分组,如下表:年龄总计不超过40岁超过40岁吸烟量不多于20支/天501565吸烟量多于20支/天102535总计6040100则在犯错误的概率不超过__________的前提下认为吸烟量与年龄有关()A.0.001B.0.01C.0.05D.没有理由解析:选AK2=100×50×25-10×15265×35×60×40≈22.16>10.828,所以我们在犯错误的概率不超过0.001的前提下认为吸烟量与年龄有关.10.为了考察两个变量x和y之间的线性相关性,甲、乙两个同学各自独立做了10次和15次试验,并且利用线性回归方法,求得回归直线为l1和l2,已知在两人的试验中发现对变量x的观测数据的平均值恰好相等,都为s,对变量y的观测数据的平均值也恰好相等,都为t,那么下列说法正确的是()A.直线l1和直线l2有交点(s,t)B.直线l1和直线l2相交,但交点未必是点(s,t)C.直线l1和直线l2由于斜率相等,所以必定平行D.直线l1和直线l2必定重合解析:选Al1与l2都过样本中心(x,y).11.假设有两个分类变量X和Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表如下:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d对于以下数据,对同一样本能说明X与Y有关的可能性最大的一组为()A.a=9,b=8,c=7,d=6B.a=9,b=7,c=6,d=8C.a=8,b=6,c=9,d=7D.a=6,b=7,c=8,d=9解析:选B对于同一样本|ad-bc|越小,说明X与Y之间的关系越弱,|ad-bc|越大,故检验知选B.12.两个分类变量X和Y,值域分别为{x1,x2}和{y1,y2},其样本频数分别是a=10,b=21,c+d=35.若X与Y有关系的可信程度不小于97.5%,则c等于()A.3B.4C.5D.6解析:选A列2×2列联表如下:x1x2总计y1102131y2cd35总计10+c21+d66故K2的观测值k=66×[1035-c-21c]231×35×10+c56-c≥5.024.把选项A,B,C,D代入验证可知选A.二、填空题(本大题共4小题,每小题5分,共20分.请把正确答案填在题中的横线上)13.已知某车间加工零件的个数x与所花费时间y(h)之间的线性回归方程为y^=0.01x+0.5,则加工600个零件大约需要________h.解析:当x=600时,y^=0.01×600+0.5=6.5.答案:6.514.若一组观测值(x1,y1),(x2,y2),…,(xn,yn)之间满足yi=bxi+a+ei(i=1,2,…,n),若ei恒为0,则R2为________.解析:ei恒为0,说明随机误差总为0,于是yi=y^,故R2=1.答案:115.下列是关于出生男婴与女婴调查的列联表晚上白天总计男婴45AB女婴E35C总计98D180那么A=______,B=______,C______,D=________,E=________.解析:∵45+E=98,∴E=53,∵E+35=C,∴C=88,∵98+D=180,∴D=82,∵A+35=D,∴A=47,∵45+A=B,∴B=92.答案:479288825316.已知x,y之间的一组数据如表,对于表中数据,甲、乙两同学给出的拟合直线分别为l1:y=13x+1与l2:y=12x+12,利用最小二乘法判断拟合程度更好的直线是________.x13678y12345解析:用y=13x+1作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S1=1-432+(2-2)2+(3-3)2+4-1032+5-1132=73.用y=12x+12作为拟合直线时,所得y的实际值与y的估计值的差的平方和为:S2=(1-1)2+(2-2)2+3-722+(4-4)2+5-922=12.因为S2S1,故用直线l2:y=12x+12,拟合程度更好.答案:y=12x+12三、解答题(本大题共6小题,共70分,解答时写出必要的文字说明、证明过程或演算步骤)17.(本小题满分10分)对某校小学生进行心理障碍测试得如下列联表:(其中焦虑、说谎、懒惰都是心理障碍)焦虑说谎懒惰总计女生5101530男生20105080总计252065110试说明在这三种心理障碍中哪一种与性别关系最大?解:对于上述三种心理障碍分别构造三个随机变量K21,K22,K23,由表中数据可得K21=110×5×60-25×20230×80×25×85≈0.863,K22=110×10×70-20×10230×80×20×90≈6.366,K23=110×15×30-15×50230×80×65×45≈1.410.因为K22的值最大,所以说谎与性别关系最大.18.(本小题满分12分)有人统计一个省的6个城市某一年的人均国内生产总值(人均GDP)x和这一年各城市患白血病的儿童数量y,其数据如下表所示:人均GDPx/万元1086431患白血病的儿童数量y/人351312207175132180(1)画出散点图,并判断是否线性相关;(2)求y与x之间的回归方程.解:(1)作散点图(如下图所示).由散点图可知y与x具有线性相关关系.(2)将数据代入公式,可得b^≈23.253,a^≈102.151.故y与x之间的线性回归方程是y^=23.253x+102.151.19.(本小题满分12分)某校在两个班进行教学方式对比试验,两个月后进行了一次检测,试验班与对照班成绩统计如下表所示(单位:人):80及80分以上80分以下总计试验班351550对照班20m50总计5545n(1)求m,n;(2)能否在犯错误的概率不超过0.005的情况下认为教学方式与成绩有关系?解:(1)m=45-15=30,n=50+50=100.(2)由表中的数据,得K2的观测值为k=100×35×30-15×20250×50×55×45≈9.091.因为9.0917.879,所以能在犯错误的概率不超过0.005的前提下认为教学方式与成绩有关系.20.(本小题满分12分)某工厂用甲、乙两种不同工艺生产一大批同一种零件,零件尺寸均在[21.7,22.3](单位:cm)之间,把零件尺寸在[21.9,22.1)的记为一等品,尺寸在[21.8,21.9)∪[22.1,22.2)的记为二等品,尺寸在[21.7,21.8)∪[22.2,22.3]的记为三等品,现从甲、乙工艺生产的零件中各随机抽取100件产品,所得零件尺寸的频率分布直方图如图所示:(1)根据上述数据完成下列2×2列联表,根据此数据你认为选择不同的工艺与生产出一等品是否有关?甲工艺乙工艺总计一等品非一等品总计附:P(K2≥k0)0.100.050.01k02.7063.8416.635K2=nad-bc2a+bc+da+cb+d(2)以上述各种产品的频率作为各种产品发生的概率,若一等品、二等品、三等品的单件利润分别为30元、20元、15元,你认为以后该工厂应该选择哪种工艺生产该种零件?请说明理由.解:(1)2×2列联表如下甲工艺乙工艺总计一等品5060110非一等品504090总计100100200K2=200×50×40-60×502110×90×100×100≈2.022.706,所以没有理由认为选择不同的工艺与生产出一等品有关.(2)由题知运用甲工艺生产单件产品的利润X的分布列为X302015P0.50.30.2X的数学期望为E(X)=30×0.5+20×0.3+15×0.2=24,X的方差为D(X)=(30-24)2×0.5+(20-24)2×0.3+(15-24)2×0.2=39.乙工艺生产单件产品的利润Y的分布列为Y302015P0.60.10.3Y的数学期望为E(Y)=30×0.6+20×0.1+15×0.3=24.5,Y的方差为D(Y)=(30-24.5)2×0.6+(20-24.5)2×0.1+(15-24.5)2×0.3=47.25.由上述结果可以看出D(X)D(Y),即甲工艺波动小,虽然E(X)E(Y