课时作业20独立性检验的基本思想及其初步应用知识点一2×2列联表中数据的表示1.如表是关于新生婴儿的性别与出生时间段调查的列联表,那么,A=________,B=________,C=________,D=________.晚上白天总计男A4792女53BC总计D82180答案45358898解析A=92-47=45,D=180-82=98,B=82-47=35,C=180-92=88.知识点二利用图形进行独立性检验2.如图是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图中可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的百分比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%答案C解析从图中可以分析,男生喜欢理科的可能性比女生大一些.知识点三利用K2公式进行独立性检验3.在吸烟与患气管炎这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=3.842,那么在犯错误的概率不超过0.05的前提下认为吸烟与患气管炎有关系,那么在100个吸烟者中,必有95人患气管炎B.由独立性检验可知,在犯错误的概率不超过0.10的前提下认为吸烟与患气管炎有关系时,我们说某人吸烟,那么他有90%的可能患有气管炎C.若由独立性检验求出在犯错误的概率不超过0.01的前提下认为吸烟与患气管炎有关系,是指有1%的可能性使得推断出现错误D.以上三种说法都不正确答案C解析K2是检验吸烟与患气管炎相关程度的量,是相关关系,而不是确定关系,是反映有关和无关的概率,故说法A不正确;说法B中对“确定容许推断犯错误概率的上界”理解错误;说法C正确.4.某校对学生课外活动内容进行调查,结果整理成2×2列联表如表:体育文娱总计男生212344女生62935总计275279试分析“喜欢体育还是喜欢文娱”与“性别”之间有关系吗?解由公式K2=nad-bc2a+bc+da+cb+d,得k≈8.106.因为k≈8.1066.635,所以我们在犯错误概率不超过0.01的前提下可以判定“喜欢体育还是喜欢文娱”与“性别”之间有关系.知识点四独立性检验与统计的综合应用5.随着生活水平的提高,人们患肝病的越来越多,为了解中年人患肝病与经常饮酒是否有关,现对30名中年人进行了问卷调查得到如下列联表:常饮酒不常饮酒合计患肝病2不患肝病18合计30已知在全部30人中随机抽取1人,抽到肝病患者的概率为415.(1)请将上面的列联表补充完整,并判断是否有99.5%的把握认为患肝病与常饮酒有关?说明你的理由;(2)现从常饮酒且患肝病的中年人(恰有2名女性)中,抽取2人参加电视节目,则正好抽到一男一女的概率是多少?参考数据:P(K2≥k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828解(1)设患肝病中常饮酒的人有x人,x+230=415,x=6.常饮酒不常饮酒合计患肝病628不患肝病41822合计102030由已知数据可求得K2=-210×20×8×22≈8.523>7.879,因此有99.5%的把握认为患肝病与常饮酒有关.(2)设常饮酒且患肝病的男性为A,B,C,D,女性为E,F,则任取两人有AB,AC,AD,AE,AF,BC,BD,BE,BF,CD,CE,CF,DE,DF,EF,共15种.其中一男一女有AE,AF,BE,BF,CE,CF,DE,DF,共8种.故抽出一男一女的概率是P=815.一、选择题1.在一项中学生近视情况的调查中,某校男生150名中有80名近视,女生140名中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数与方差B.回归分析C.独立性检验D.概率答案C解析判断两个分类变量是否有关的最有效方法是进行独立性检验.2.对于分类变量X与Y的随机变量K2的观测值k,下列说法正确的是()A.k越大,“X与Y有关系”的可信程度越小B.k越小,“X与Y有关系”的可信程度越小C.k越接近于0,“X与Y没有关系”的可信程度越小D.k越大,“X与Y没有关系”的可信程度越大答案B解析k越大,“X与Y没有关系”的可信程度越小,则“X与Y有关系”的可信程度越大.即k越小,“X与Y有关系”的可信程度越小.3.假设有两个变量X与Y,它们的取值分别为x1,x2和y1,y2,其列联表为:y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d以下各组数据中,对于同一样本能说明X与Y有关系的可能性最大的一组为()A.a=50,b=40,c=30,d=20B.a=50,b=30,c=40,d=20C.a=20,b=30,c=40,d=50D.a=20,b=30,c=50,d=40答案D解析当(ad-bc)2的值越大,随机变量K2=nad-bc2a+bc+da+cb+d的值越大,可知X与Y有关系的可能性就越大.显然选项D中,(ad-bc)2的值最大.4.利用独立性检验对两个分类变量是否有关系进行研究时,若有99.5%的把握认为事件A和B有关系,则具体计算出的数据应该是()A.k≥6.635B.k<6.635C.k≥7.879D.k<7.879答案C解析有99.5%的把握认为事件A和B有关系,即犯错误的概率为0.5%,对应的k0的值为7.879,由独立性检验的思想可知应为k≥7.879.5.某科研机构为了研究中年人秃发与心脏病是否有关,随机调查了一些中年人的情况,具体数据如表:心脏病无心脏病秃发20300不秃发5450根据表中数据得到k=-225×750×320×455≈15.968,因为k6.635,则断定秃发与心脏病有关系,那么这种判断出错的可能性不超过()A.0.1B.0.05C.0.025D.0.01答案D解析因为k6.635,由P(k6.635)的临界值为0.01,故这种判断出错的可能性不超过0.01.故选D.二、填空题6.某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100由表中数据直观分析,收看新闻节目的观众是否与年龄有关:________(填“是”或“否”).答案是解析因为在20至40岁的58名观众中有18名观众收看新闻节目,而大于40岁的42名观众中有27名观众收看新闻节目,即ba+b=1858,dc+d=2742,两者相差较大,所以经直观分析,收看新闻节目的观众与年龄是有关的.7.下列关于K2的说法中,正确的有________.①K2的值越大,两个分类变量的相关性越大;②K2的计算公式是K2=nad-bca+bc+da+cb+d;③若求出K2=43.841,则有95%的把握认为两个分类变量有关系,即有5%的可能性使得“两个分类变量有关系”的推断出现错误;④独立性检验就是选取一个假设H0条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝H0的推断.答案③④解析对于①,K2的值越大,只能说明我们有更大的把握认为二者有关系,却不能判断相关性大小,故①错;对于②,(ad-bc)应为(ad-bc)2,故②错;③④对.8.为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如图所示2×2列联表:理科文科总计男131023女72027总计203050已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=5-223×27×20×30≈4.844,则有______的把握认为选修文科与性别有关.答案95%解析由题意知,K2=-223×27×20×30≈4.844,因为5.0244.8443.841,所以有95%的把握认为选修文科与性别有关.三、解答题9.为了调查胃病是否与生活规律有关,在某地对540名40岁以上的人进行了调查,结果是:患胃病者生活不规律的共60人,患胃病者生活规律的共20人,未患胃病者生活不规律的共260人,未患胃病者生活规律的共200人.(1)根据以上数据列出2×2列联表;(2)在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关系吗?为什么?解(1)由已知可列2×2列联表:患胃病未患胃病总计生活规律20200220生活不规律60260320总计80460540(2)根据列联表中的数据,由计算公式得K2的观测值k=-2220×320×80×460≈9.638.∵9.638>6.635,因此,在犯错误的概率不超过0.01的前提下认为40岁以上的人患胃病与否和生活规律有关.10.为了解某班学生喜爱打篮球是否与性别有关,对本班50人进行了问卷调查得到了如下的列联表:喜爱打篮球不喜爱打篮球合计男生ab=5女生c=10d合计50已知在全部50人中随机抽取1人抽到爱打篮球的学生的概率为35.(1)请将上面的列联表补充完整;(2)是否有99.5%的把握认为喜爱打篮球与性别有关;请说明理由.附参考公式:K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828解(1)列联表补充如下:喜爱打篮球不喜爱打篮球合计男生20525女生101525合计302050(2)∵K2=-230×20×25×25≈8.333>7.879,∴有99.5%的把握认为喜爱打篮球与性别有关.周周回馈练(十)(满分75分)一、选择题(本大题共6小题,每小题5分,共30分)1.对有线性相关关系的两个变量建立的回归直线方程y^=a^+b^x中,回归系数b^()A.可以小于0B.只能大于0C.能等于0D.只能小于0答案A解析当b^=0时,两个变量不具有线性相关性,但b^可以大于0也可小于0.2.下表显示出样本中变量y随变量x变化的一组数据,由此判断它最可能是()x45678910y14181920232528A.线性函数模型B.二次函数模型C.指数函数模型D.对数函数模型答案A解析画出散点图(图略)可以得到这些样本点在某一条直线上或该直线附近,故最可能是线性函数模型.3.下列关于等高条形图说法正确的是()A.等高条形图表示高度相对的条形图B.等高条形图表示的是分类变量的频数C.等高条形图表示的是分类变量的百分比D.等高条形图表示的是分类变量的实际高度答案C解析由等高条形图的特点及性质进行判断.4.根据一组样本数据(x1,y1),(x2,y2),…,(xn,yn)的散点图分析存在线性相关关系,求得其回归方程y^=0.85x-85.7,则在样本点(165,57)处的残差为()A.54.55B.2.45C.3.45D.111.55答案B解析把x=165代入y^=0.85x-85.7,得y=0.85×165-85.7=54.55,由57-54.55=2.45.故残差为2.45.5.某考察团对全国10大城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查,y与x具有相关关系,回归方程为y^=0.66x+1.562,若某城市居民人均消费水平为7.675千元,估计该城市人均消费额占人均工资收入的百分比约为()A.83%B.72%C.67%D.66%答案A解析将y=7.675代入回归方程,可计算得x≈9.262,所以该城市人均消费额占人均工资收入的百分比约为7.675÷9.262≈0.83=83%,即约为83%.6.根据下面的列联表得到如下四个判断:①至少有99.9%的把握认为“患肝病与嗜酒有关”;②至少有99%的把握认为“患肝病与嗜酒有关”;③在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒有关”;④在犯错误的概率不超过0.01的前提下,认为“患肝病与嗜酒无关”.嗜酒不嗜酒总计患肝病70060760未患肝病20032232总计90092992其中正确命题的个数