第1页共11页高考专题训练(十六)统计、统计案例时间:45分钟分值:75分一、选择题:本大题共6小题,每小题5分,共30分.在每小题给出的四个选项中,选出符合题目要求的一项填在括号里.1.(2011·湖南)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110K2=nad-bc2a+bc+da+cb+d算得,K2=110×40×30-20×20260×50×60×50=7.8.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828参照附表,得到正确结论是()A.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”B.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”C.有99%以上的把握认为“爱好该项运动与性别有关”第2页共11页D.有99%以上的把握认为“爱好该项运动与性别无关”解析∵K2=7.86.635,而P(K2≥6.635)=0.010,∴有99%以上的把握认为“爱好该运动与性别有关”.答案C2.(2011·江西)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1),r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2r10B.0r2r1C.r20r1D.r2=r1解析作出x,y对应散点图可知y与x正相关,∴r10.作出U,V对应散点图可知U与V负相关,∴r20.∴r20r1.答案C3.(2011·安徽“江南十校”联考)已知一组正数x1,x2,x3,x4的方差为s2=14(x21+x22+x23+x24-16),则数据x1+2,x2+2,x3+2,x4+2的平均数为()A.2B.3C.4D.6解析∵s2=14(x21+x22+x23+x24-16)=14[(x1-x)2+(x2-x)2+(x3-x)2+(x4-x)2],∴2x(x1+x2+x3+x4)-4x2=16,∴8x2-4x2=16,x=2,即x1+x2+x3+x4=8,∴x1+2+x2+2+x3+2+x4+24=4.故选C.第3页共11页答案C4.(2012·邹城一中模拟)在2011年12月12日那天,济宁市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.51010.511销售量y1110865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归直线方程是:y^=-3.2x+a,则a=()A.24B.35.6C.40.5D.40解析可解得样本中心为(10,8),代入回归方程可得a=40.答案D5.(2012·哈师大附中、东北师大附中、辽宁省实验中学高三第一次联合模拟)下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程y^=3-5x,变量x增加一个单位时,y平均增加5个单位;③线性回归方程y^=b^x+a^必过(x,y);④在一个2×2列联表中,由计算得K2=13.079,则有99%的把握确认这两个变量间有关系.其中错误的个数是()A.0B.1C.2D.3第4页共11页本题可以参考独立性检验临界值表:P(K2≥k)0.50.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.5357.87910.828解析一组数据都加上或减去同一个常数,数据的平均数有变化,方差不变(方差是反映数据的波动程度的量),①正确;回归方程中x的系数具备直线斜率的功能,对于回归方程y^=3-5x,当x增加一个单位时,y平均减少5个单位,②错误;由线性回归方程的定义知,线性回归方程y^=b^x+a^必过点(x,y),③正确;因为K2=13.07910.828,故有99%的把握确认这两个变量有关系,④正确.故选B.答案B6.甲、乙两名运动员的5次测试成绩如下图所示设s1,s2分别表示甲、乙两名运动员测试成绩的标准差,x1,x2分别表示甲、乙两名运动员测试成绩的平均数,则有()A.x1=x2,s1s2B.x1=x2,s1s2C.x1x2,s1s2D.x1=x2,s1=s2第5页共11页解析x1=15(17+15+22+28+28)=22,x2=15(16+18+23+26+27)=22,s21=15(25+49+0+36+36)=29.2,s22=15(36+16+1+9+25)=17.4,故选B.答案B二、填空题:本大题共4小题,每小题5分,共20分,把答案填在题中横线上.7.(2012·江苏)某学校高一、高二、高三年级的学生人数之比是3:3:4,现用分层抽样的方法从该校高中三个年级的学生中抽取容量为50的样本,则应从高二年级抽取________名学生.解析应从高二年级抽取的学生数为50×33+3+4=15.答案158.(2011·广东)某数学老师身高176cm,他爷爷、父亲和儿子的身高分别为173cm、170cm和182cm.因儿子的身高与父亲的身高有关,该老师用线性回归分析的方法预测他孙子的身高为________cm.解析记从爷爷起向下各代依次为1,2,3,4,5用变量x表示,其中5代表孙子.各代人身高为变量x,则有x1234y173170176182计算知x=2.5,y=175.25第6页共11页=3.3,a^=y-b^x=175.25-3.3×2.5=167∴回归方程为y^=3.3x+167当x=5时,y=3.3×5+167=183.5.答案183.59.(2011·济宁市高三模拟)为了解某班学生喜爱打篮球是否与性别有关,对该班50名学生进行了问卷调查,得到了如下的2×2列联表:喜爱打篮球不喜爱打篮球合计男生20525女生101525合计302050则至少有________的把握认为喜爱打篮球与性别有关?(请用百分数表示)附:K2=nad-bc2a+bc+da+cb+dP(K2k2)0.100.050.0250.0100.0050.001k02.7063.8415.0246.6357.87910.828解析由公式可得K2≈8.3337.829,故填99.5%.答案99.5%10.(2011·南京市高三第一次模拟考试)某校为了解高三男生的身第7页共11页体状况,检测了全部480名高三男生的体重(单位:kg),所得数据都在区间[50,75]中,其频率分布直方图如图所示.若图中从左到右的前3个小组的频率之比为1:2:3,则体重小于60kg的高三男生人数为________.解析依题意得,后两个小组的频率之和等于(0.0125+0.0375)×5=0.25,因此前三个小组的频率之和等于1-0.25=0.75,前两个小组的频率之和等于1+21+2+3×34=38,所以体重小于60kg的高三男生人数为480×38=180.答案180三、解答题:本大题共2小题,共25分.解答应写出文字说明、证明过程或演算步骤.11.(12分)(2012·北京)近年来,某市为促进生活垃圾的分类处理,将生活垃圾分为厨余垃圾、可回收物和其他垃圾三类,并分别设置了相应的垃圾箱,为调查居民生活垃圾分类投放情况,现随机抽取了该市三类垃圾箱中总计1000吨生活垃圾,数据统计如下(单位:吨):第8页共11页“厨余垃圾”箱“可回收物”箱“其他垃圾”箱厨余垃圾400100100可回收物3024030其他垃圾202060(1)试估计厨余垃圾投入正确的概率;(2)试估计生活垃圾投放错误的概率;(3)假设厨余垃圾在“厨余垃圾\”箱、“可回收物\”箱、“其他垃圾\”箱的投放量分别为a,b,c,其中a0,a+b+c=600.当数据a,b,c的方差s2最大时,写出a,b,c的值(结论不要求证明),并求此时s2的值.(注:s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中x为数据x1,x2,…,xn的平均数)解(1)厨余垃圾投入正确的概率约为“厨余垃圾”箱里厨余垃圾量厨余垃圾总量=400400+100+100=23.(2)设生活垃圾投放错误为事件A,则事件A表示生活垃圾投入正确.事件A的概率约为“厨余垃圾”箱里厨余垃圾量、“可回收物”箱里可回收物量与“其他垃圾”箱里其他垃圾量的总和除以生活垃圾总量,即P(A)约为400+240+601000=0.7,所以P(A)约为1-0.7=0.3.(3)当a=600,b=c=0时,s2取得最大值.因为x=13(a+b+c)=200,第9页共11页所以s2=13[(600-200)2+(0-200)2+(0-200)2]=80000.12.(13分)(2012·辽宁)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图:将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.(1)根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计(2)将上述调查所得到的频率视为概率.现在从该地区大量电视观众中,采用随机抽样方法每次抽取1名观众,抽取3次,记被抽取的3名观众中的“体育迷”人数为X.若每次抽取的结果是相互独立的,求X的分布列,期望E(X)和方差D(X).第10页共11页附:χ2=nn11n22-n12n212n1+n2+n+1n+2,解(1)由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:非体育迷体育迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得χ2=100×30×10-45×15275×25×45×55=10033≈3.030.因为3.0303.841,所以没有理由认为“体育迷”与性别有关.(2)由频率分布直方图知抽到“体育迷”的频率为0.25,将频率视为概率,即从观众中抽取一名“体育迷”的概率为14.由题意X~B3,14,从而X的分布列为X0123P27642764964164E(X)=np=3×14=34,D(X)=np(1-p)=3×14×34=916.第11页共11页