第一章1.2A级基础巩固一、选择题1.下列关于等高条形图的叙述正确的是导学号18674054(C)A.从等高条形图中可以精确地判断两个分类变量是否有关系B.从等高条例形图中可以看出两个变量频数的相对大小C.从等高条形图可以粗略地看出两个分类变量是否有关系D.以上说法都不对[解析]在等高条形图中仅能粗略判断两个分类变量的关系,故A错.在等高条形图中仅能找出频率,无法找出频数,故B错.2.在2×2列联表中,两个比值________相差越大,两个分类变量之间的关系越强导学号18674055(A)A.aa+b与cc+dB.ac+d与ca+bC.aa+d与cb+cD.ab+d与ca+c[解析]aa+b与cc+d相差越大,说明ad与bc相差越大,两个分类变量之间的关系越强.3.在吸烟与患肺病是否有关的研究中,下列属于两个分类变量的是导学号18674056(C)A.吸烟,不吸烟B.患病,不患病C.是否吸烟、是否患病D.以上都不对[解析]“是否吸烟”是分类变量,它的两个不同取值;吸烟和不吸烟;“是否患病”是分类变量,它的两个不同取值:患病和不患病.可知A、B都是一个分类变量所取的两个不同值.故选C.4.下列是一个2×2列联表:y1y2总计x1a2173x222527总计b46100则该表中a、b的值分别为导学号18674057(C)A.94,96B.52,50C.52,54D.54,52[解析]a=73-21=52,b=a+2=52+2=54.5.在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是导学号18674058(C)①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.①③C.③D.②[解析]①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.排除D,选C.6.假设有两个分类变量X与Y,它们的可能取值分别为{x1,x2}和{y1,y2},其2×2列联表为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为导学号18674059(D)A.a=5,b=4,c=3,d=2B.a=5,b=3,c=4,d=2C.a=2,b=3,c=4,d=5D.a=2,b=3,c=5,d=4[解析]比较|aa+b-cc+d|.选项A中,|59-35|=245;选项B中,|58-46|=124;选项C中,|25-49|=245;选项D中,|25-59|=745.故选D.二、填空题7.为了调查患慢性气管炎是否与吸烟有关,调查了339名50岁以下的人,调查结果如下表:导学号18674060患慢性气管炎未患慢性气管炎合计吸烟43162205不吸烟13121134合计56283339根据列表数据,求得K2的观测值k≈__7.469__.[解析]K=33943×121-162×13256×283×205×134≈7.469.8.调查者通过随机询问72名男女中学生喜欢文科还是理科,得到如下列联表(单位:名)导学号18674061性别与喜欢文科还是理科列联表喜欢文科喜欢理科总计男生82836女生201636总计284472中学生的性别和喜欢文科还是理科__有__关系.(填“有”或“没有”)[解析]通过计算K2的观测值k=72×16×8-28×20236×36×44×28≈8.427.879.故我们有99.5%的把握认为中学生的性别和喜欢文科还是理科有关系.三、解答题9.运动员参加比赛前往往做热身运动,下表是一体育运动的研究机构对160位专业运动员追踪而得的数据,试问:由此数据,你认为运动员受伤与不做热身运动有关吗?导学号18674062受伤不受伤总计做热身197695不做热身452065总计6496160[解析]∵a=19,b=76,c=45,d=20,a+b=95,c+d=65,a+c=64,b+d=96,n=160.∴由计算公式得K2=160×19×20-76×45295×65×64×96≈38.974.∵38.9746.635,∴有99%的把握认为运动员受伤与不做热身运动有关.B级素养提升一、选择题1.(2016·天津五区县高二检测)某研究中心为研究运动与性别的关系得到2×2列联表如下:喜欢运动不喜欢运动合计男生602080女生101020合计7030100则随机变量K2的观测值约为导学号18674063(A)A.4.762B.9.524C.0.0119D.0.0238[解析]K2=10060×10-20×10270×30×80×20≈4.762.2.某研究机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如下表:心脏病无心脏病秃发20300不秃发5450根据表中数据得到K2=775×20×450-5×300225×750×320×455≈15.9686.635,所以断定秃发与心脏病有关系,那么这种判断出错的可能性为导学号18674064(D)A.0.1B.0.05C.0.025D.0.01[解析]∵K26.635,∴有99%的把握说秃发与患心脏病有关,故这种判断出错的可能性有1-0.99=0.01.3.某班主任对全班50名学生进行了作业量多少的调查,数据如下表:认为作业多认为作业不多总数喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总数262450则认为喜欢玩电脑游戏与认为作业量的多少有关系的把握大约为导学号18674065(B)A.99%B.95%C.90%D.无充分依据[解析]由表中数据得k=50×18×15-8×9226×24×27×23≈5.0593.841.所以约有95%的把握认为两变量之间有关系.4.某卫生机构对366人进行健康体检,其中某项检测指标阳性家族史者糖尿病发病的有16人,不发病的有93人;阴性家族史者糖尿病发病的有17人,不发病的有240人,有______的把握认为糖尿病患者与遗传有关系.导学号18674066(D)A.99.9%B.99.5%C.99%D.97.5%[解析]可以先作出如下列联表(单位:人):糖尿病患者与遗传列联表糖尿病发病糖尿病不发病总计阳性家族史1693109阴性家族史17240257总计33333366根据列联表中的数据,得到K2的观测值为k=366×16×240-17×932109×257×33×333≈6.0675.024.故我们有97.5%的把握认为糖尿病患者与遗传有关系.5.有两个分类变量X,Y,其一组的2×2列联表如下所示,Y1Y2X1a20-aX215-a30+a其中a,15-a均为大于5的整数,若在犯错误的概率不超过0.05的前提下认为X,Y有关,则a的值为导学号18674067(C)A.8B.9C.8,9D.6,8[解析]根据公式,得K2的观测值k=65×[a30+a-15-a20-a]220×45×15×50=13×13a-60220×45×3×23.841,数据a5且15-a5,a∈Z,求得a=8,9满足题意.二、填空题6.某研究小组为了研究中学生的身体发育情况,在某中学随机抽出20名15至16周岁的男生将他们的身高和体重制成2×2列联表,根据列联表中的数据,可以在犯错误的概率不超过__0.25__的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.导学号18674068超重不超重总计偏高415不偏高31215总计71320[解析]根据公式K2=nad-bc2a+bc+da+cb+d得,K2的观测值k=20×4×12-1×325×15×7×13≈5.934,因为k5.024,因此在犯错误的概率不超过0.025的前提下认为该学校15至16周岁的男生的身高和体重之间有关系.7.两个分类变量X、Y,它们的取值分别为x1、x2和y1、y2,其列联表为:导学号18674069y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d若两个分类变量X、Y独立,则下列结论:①ad≈bc;②aa+b≈cc+d;③c+da+b+c+d≈b+da+b+c+d;④c+aa+b+c+d≈b+da+b+c+d;⑤a+b+c+dad-bca+bb+da+cc+d≈0.其中正确的序号是__①②⑤__.[解析]∵分类变量X、Y独立,∴aa+b+c+d≈a+ca+b+c+d×a+ba+b+c+d,化简得ad≈bc,故①⑤正确;②式化简得ad≈bc,故②正确.三、解答题8.(2016·重庆八中高二检测)2016年夏季奥运会在巴西里约热内卢举行.体育频道为了解某地区关于奥运会直播的收视情况.随机抽取了100名观众进行调查.其中40岁以上的观众有55名.下面奥运会直播时间的频率分布表(时间:min):导学号18674070分组[0,20)[20,40)[40,60)[60,80)[80,100)[100,120)频率0.10.180.220.250.20.05将每天收看奥运会直播的时间不低于80min的观众称为“奥运迷”.已知“奥运迷”中有10名40岁以上的观众.(1)根据已知条件完成下面的2×2列联表;非“奥运迷”“奥运迷”合计40岁以下40岁以上合计(2)并据此资料你是否有95%以上的把握认为“奥运迷”与年龄有关.附:K2=nad-bc2a+bb+da+cb+dP(K2≥k)0.050.01k3.8416.635[解析](1)由题意得100名观众中“奥运迷”共有(0.2+0.05)×100=25名,其中40岁以上的“奥运迷”有10名,∴40岁以下的“奥运迷”有15名,∴2×2列联表如下:非“奥运迷”“奥运迷”合计40岁以下30154540岁以上451055合计7525100(2)K2=10030×10-45×15275×25×45×55≈4.8623.841,∴有95%以上的把握认为“奥运迷”与年龄有关.C级能力提高1.某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:导学号18674071专业性别非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2=50×13×20-10×7223×27×20×30≈4.844,因为K2≥3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为5%.[解析]∵k3.841,所以有95%的把握认为主修统计专业与性别有关,出错的可能性为5%.2.下表是某地区的一种传染病与饮用水的调查表:导学号18674072得病不得病合计干净水52466518不干净水94218312合计146684830(1)这种传染病是否与饮用水的卫生程度有关,请说明理由;(2)若饮用干净水得病5人,不得病50人;饮用不干净水得病9人,不得病22人.按此样本数据分析这种传染病是否与饮用水的卫生程度有关,并比较两种样本在反映总体时的差异.[解析](1)提出假设H0:传染病与饮用水的卫生程度无关.由公式得K21=830×52×218-466×942518×312×146×684≈54.21.因为54.2110.828,因此我们有99.9%的把握认为该地区这种传染病与饮用水的卫生程度有关.(2)依题意得2×2列联表:得病不得病合计干净水55055不干净水92231合计147286由公式得K22=86×5×22-50×9255×31×14×72≈5.785.由5.7855.024,所以我们有97.5%的把握认为该种传染病与饮用水的卫生程度有关.两个样本都能统计得到传染病与饮用水的卫生程度有关这一相同结论,但(1)问中我们有99.9%的把握肯定结论的正确性,(2