第一章综合素质检测时间120分钟,满分150分。一、选择题(本大题共12个小题,每小题5分,共60分,在每小题给出的四个选项中,只有一项是符合题目要求的)1.(2014·湖南益阳市箴言中学模拟)四名同学根据各自的样本数据研究变量x,y之间的相关关系,并求得回归直线方程,分别得到以下四个结论:①y与x负相关且y^=2.347x-6.423;②y与x负相关且y^=-3.476x+5.648;③y与x正相关且y^=5.437x+8.493;④y与x正相关且y^=-4.326x-4.578.其中一定不正确的结论的序号是()A.①②B.②③C.③④D.①④[答案]D[解析]y与x正(或负)相关时,线性回归直线方程y=b^x+a^中,x的系数b^0(或b^0),故①④错.2.如下图所示,4个散点图中,不适合用线性回归模型拟合其中两个变量的是()[答案]A[解析]题图A中的点不成线性排列,故两个变量不适合线性回归模型.故选A.3.在建立两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数R2如下,其中拟合得最好的模型为()A.模型1的相关指数R2为0.75B.模型2的相关指数R2为0.90C.模型3的相关指数R2为0.25D.模型4的相关指数R2为0.55[答案]B[解析]相关指数R2的值越大,意味着残差平方和越小,也就是说模型的拟合效果越好,故选B.4.预报变量的值与下列的哪些因素有关()A.受解释变量的影响,与随机误差无关B.受随机误差的影响,与解释变量无关C.与总偏差平方和有关,与残差无关D.与解释变量和随机误差的总效应有关[答案]D[解析]预报变量既受解释变量的影响,又受随机误差的影响.5.(2014·安徽示范高中联考)给出下列五个命题:①将A、B、C三种个体按的比例分层抽样调查,如果抽取的A个体为9个,则样本容量为30;②一组数据1,2,3,3,4,5的平均数、众数、中位数都相同;③甲组数据的方差为5,乙组数据为5,6,9,10,5,那么这两组数据中比较稳定的是甲;④已知具有相关关系的两个变量满足的回归直线方程为y=1-2x,则x每增加1个单位,y平均减少2个单位;⑤统计的10个样本数据为125,120,122,105,130,114,116,95,120,134,则样本数据落在[114.5,124.5)内的频率为0.4.其中真命题为()A.①②④B.②④⑤C.②③④D.③④⑤[答案]B[解析]①样本容量为9÷36=18,①是假命题;②数据1,2,3,3,4,5的平均数为16(1+2+3+3+4+5)=3,中位数为3,众数为3,都相同,②是真命题;③x-乙=5+6+9+10+55=7,s2乙=15[(5-7)2+(6-7)2+(9-7)2+(10-7)2+(5-7)2]=15×(4+1+4+9+4)=4.4,∵s2甲s2乙,∴乙稳定,③是假命题;④是真命题;⑤数据落在[114.5,124.5)内的有:120,122,116,120共4个,故所求概率为410=0.4,⑤是真命题.6.已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程y=b^x+a^必过()A.(2,2)点B.(1.5,0)点C.(1,2)点D.(1.5,4)点[答案]D[解析]计算得x=1.5,y=4,由于回归直线一定过(x,y)点,所以必过(1.5,4)点.7.利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X和Y有关系”的可信度,如果k5.024,那么就有把握认为“X和Y有关系”的百分比为()p(K2k)0.500.400.250.150.10k0.4550.7081.3232.0722.706p(K2k)0.050.0250.0100.0050.001k3.845.0246.6357.87910.83A.25%B.75%C.2.5%D.97.5%[答案]D[解析]查表可得K25.024.因此有97.5%的把握认为“x和y有关系”.8.下列说法正确的有()①最小二乘法指的是把各个离差加起来作为总离差,并使之达到最小值的方法;②最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法;③线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法;④因为由任何一组观测值都可以求得一个回归直线方程,所以没有必要进行相关性检验.A.1个B.2个C.3个D.4个[答案]B[解析]最小二乘法是指把各离差的平方和作为总离差,并使之达到最小值的方法,(2)是正确的;线性回归就是由样本点去寻找一条直线,贴近这些样本点的数学方法,这是线性回归的本质,(3)也是正确的.9.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为y^=0.66x+1.562,若某城市居民人均消费水平为7.675(千元),估计该城市人均消费额占人均收入的百分比约为()A.83%B.72%C.67%D.66%[答案]A[解析]当y^=7.675时,x=7.675-1.5620.66≈9.262,所以7.6759.262≈0.829,故选A.10.下面是调查某地区男女中学生是否喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从下图可以看出()A.性别与是否喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生中喜欢理科的比为60%[答案]C[解析]从图中可以看出,男生喜欢理科的比例为60%,而女生比例为仅为20%,这两个比例差别较大,说明性别与是否喜欢理科是有关系的,男生比女生喜欢理科的可能性更大一些.11.(2014·云南景洪市一中期末)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女合计爱好402060不爱好203050总计6050110由K2=nad-bc2a+bc+da+cb+d,得K2=110×40×30-20×20260×50×60×50≈7.8.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确的结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”C.有99%以上的把握认为“爱好该项运动与性别有关”D.有99%以上的把握认为“爱好该项运动与性别无关”[答案]C12.以下关于线性回归的判断,正确的个数是()①若散点图中所有点都在一条直线附近,则这条直线为回归直线;②散点图中的绝大多数都线性相关,个别特殊点不影响线性回归,如图中的A,B,C点;③已知直线方程为y^=0.50x-0.81,则x=25时,y的估计值为11.69;④回归直线方程的意义是它反映了样本整体的变化趋势.A.0B.1C.2D.3[答案]D[解析]能使所有数据点都在它附近的直线不止一条,而据回归直线的定义知,只有按最小二乘法求得回归系数a^,b^得到的直线y^=bx+a^才是回归直线,∴①不对;②正确;将x=25代入y^=0.50x-0.81,得y^=11.69,∴③正确;④正确,故选D.二、填空题(本大题共4个小题,每小题4分,共16分,将正确答案填在题中横线上)13.某镇居民2009~2013年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20092010201120122013收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.(填“正”或“负”)[答案]13正[解析]找中位数时,将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统计资料可以看出,年平均收入增多时,年平均支出也增多,因此两者正相关.14.有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠总计多看电视6842110少看电视203858总计8880168则在犯错误的概率不超过________的前提下认为多看电视与人变冷漠有关系.[答案]0.001[解析]可计算K2的观测值k=11.37710.828.15.在2013年春节期间,某市物价部门,对本市五个商场销售的某商品一天的销售量及其价格进行调查,五个商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.51010.511销售量y1110865通过分析,发现销售量y对商品的价格x具有线性相关关系,则销售量y对商品的价格x的回归直线方程为________.[答案]y^=-3.2x+40[解析]i=15xiyi=392,x-=10,y-=8,i=15(xi-x-)2=2.5,代入公式,得b^=-3.2,所以,a^=y--b^x-=40,故回归直线方程为y^=-3.2x+40.16.某小卖部为了了解热茶销售量y(杯)与气温x(℃)之间的关系,随机统计了某4天卖出的热茶的杯数与当天气温,并制作了对照表:气温(℃)181310-1杯数24343864由表中数据算得线性回归方程y^=bx+a中的b≈-2,预测当气温为-5℃时,热茶销售量为________杯.(已知回归系数b=i=1nxiyi-nx-y-i=1nx2i-nx-2,a=y--bx-)[答案]70[解析]根据表格中的数据可求得x-=14×(18+13+10-1)=10,y-=14×(24+34+38+64)=40.∴a=y--bx-=40-(-2)×10=60,∴y^=-2x+60,当x=-5时,y^=-2×(-5)+60=70.三、解答题(本大题共6个小题,共74分,解答应写出文字说明、证明过程或演算步骤)17.(本题满分12分)考察黄烟经过培养液处理与是否跟发生青花病的关系.调查了457株黄烟,得到下表中数据,请根据数据作统计分析.培养液处理未处理合计青花病25210235无青花病80142222合计105352457附:K2=nac-bd2a+bc+da+cb+dp(K2≥k)0.050.010.0050.001k3.8416.6357.87910.83[解析]根据公式K2=457×25×142-80×2102235×222×105×352≈41.61,由于41.6110.828,说明有99.9%的把握认为黄烟经过培养液处理与是否跟发生青花病是有关系的.18.(本题满分12分)某工业部门进行一项研究,分析该部门的产量与生产费用之间的关系,从该部门内随机抽选了10个企业为样本,有如下资料:产量x(千件)生产费用(千元)40150421404816055170651507916288185100165120190140185(1)计算x与y的相关系数;(2)对这两个变量之间是否线性相关进行检验;(3)设回归方程为y^=b^x+a^,求回归系数.[解析](1)根据数据可得:x=77.7,y=165.7,∑10i=1x2i=70903,∑10i=1y2i=277119,∑10i=1xiyi=132938,所以r=0.808,即x与y之间的相关系数r≈0.808;(2)因为r0.75,所以可认为x与y之间具有线性相关关系;(3)b^=0.398,a^=134.8.19.(本题满分12分)(2014·安徽文,17)某高校共有15000人,其中男生10500人,女生4500人,为调查该校学生每周平均体育运动时间的情况,采用分层抽样的方法,收集300位学生每周平均体育运动时间的样本数据(单位:小时).(1)应收集多少位女生的样本数据?(2)根据这300个样本数据,得到学生每周平均体育运动时间的频率分布直方图(如图所示),其中样本数据的分组区间为:[0,2],(2,4],(4,6],(6,8],(8,10],(10,12].估计该校学生每周平均体育运动时间超过4个小时的概率.(3)在样本数据