-*-1.2独立性检验的基本思想及其初步应用XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页学习目标思维脉络1.了解独立性检验(只要求2×2列联表)的基本思想、方法及其简单应用.2.了解假设检验的基本思想、方法及其简单应用.3.掌握利用列联表进行K2检验的方法与步骤.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页1231.分类变量和列联表(1)分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.(2)列联表①定义:列出的两个分类变量的频数表,称为列联表.②2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dXINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页123测一测1对服用某种维生素对婴儿头发稀疏和稠密的影响调查如下:服用维生素的婴儿有60人,其中头发稀疏的有5人;不服用维生素的婴儿有60人,其中头发稀疏的有46人.作出下面2×2列联表:头发稀疏头发稠密总计服用维生素5a60不服用维生素46b60总计51a+b120则表中a,b的值分别为()A.9,14B.55,14C.55,24D.69,14解析:a=60-5=55,b=60-46=14.答案:BXINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页1232.等高条形图(1)图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现𝑎𝑎+𝑏和𝑐𝑐+𝑑相差很大,就判断两个分类变量之间有关系.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页123测一测2下面是调查某地区男女中学生喜欢理科的等高条形图,阴影部分表示喜欢理科的百分比,从图可以看出()A.性别与喜欢理科无关B.女生中喜欢理科的比为80%C.男生比女生喜欢理科的可能性大些D.男生不喜欢理科的比为60%解析:由题图知女生中喜欢理科的比为20%,男生不喜欢理科的比为40%,故B,D不正确.由题图知,男生比女生喜欢理科的可能性大些.答案:CXINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页1233.独立性检验定义利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验公式K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑),其中n=a+b+c+d.具体步骤①根据实际问题的需要,确定容许推断“两个分类变量有关系”犯错误概率的上界α.然后查表确定临界值k0.②利用公式计算随机变量K2的观测值k.③如果k≥k0,就推断“X与Y有关系”,这种推断犯错误的概率不超过α;否则就认为在犯错误的概率不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中没有发现足够证据支持结论“X与Y有关系”.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页123测一测3在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的.下列说法中正确的是()A.在100个吸烟者中至少有99人患肺癌B.如果1个人吸烟,那么这个人至少有99%的概率患肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有解析:K2的观测值与临界值比较有多大把握是说两个分类变量之间的关系,但不是因果关系,因此,A,B,C均不正确,应选D.答案:DXINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四探究一列联表与等高条形图利用数形结合的思想,借助等高条形图来判断两个分类变量是否相关是判断变量相关的常见方法之一.一般地,在等高条形图中,𝑎𝑎+𝑏与𝑐𝑐+𝑑相差越大,两个分类变量有关系的可能性就越大.在作等高条形图时可以用列联表来寻找相关数据,作图要精确,且易于观察,以便对结论的判断不出现偏差.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四典型例题1研究人员选取170名青年男女大学生对他们进行一种心理测验.发现60名女生对该心理测验中的最后一个题目的反应是:作肯定的有18名,否定的有42名.110名男生在相同的题目上作肯定的有22名,否定的有88名.作出两个分类变量的列联表和相应的等高条形图,试判断性别与态度之间是否有关系.思路分析:通过阅读理解得出列联表,画出相应的条形图,得到变量的关联性.解:根据题目所给数据建立如下列联表:肯定否定总计女生184260男生2288110总计40130170XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四相应的等高条形图如图所示.比较来看,女生中肯定的人数的比例要高于男生中肯定的人数的比例,因此可以在某种程度上认为性别与态度之间有关系.点评大致判断两个分类变量是否有关,可以借助等高条形图,这种判断可加深对独立性检验基本思想的理解.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四变式训练1观察下列各图,其中两个分类变量X,Y之间关系最强的是()解析:在四幅图中,D图中两个深色条的高相差最明显,说明两个分类变量之间关系最强.答案:DXINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四探究二独立性检验解决一般的独立性检验问题,首先由所给的2×2列联表确定a,b,c,d,n的值,然后代入随机变量的计算公式求出观测值k,将k与临界值k0进行对比,确定有多大的把握认为两个分类变量有关系.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四典型例题2为了探究患慢性气管炎是否与吸烟有关,调查了339名50岁以上的人,调查结果如下表所示:患慢性气管炎未患慢性气管炎总计吸烟43162205不吸烟13121134总计56283339能否在犯错误的概率不超过1%的前提下认为50岁以上的人患慢性气管炎与吸烟有关系?思路分析:求出观测值k,对照临界值即可得出结论.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四解:由2×2列联表可知:a=43,b=162,c=13,d=121,a+b=205,c+d=134,a+c=56,b+d=283,n=a+b+c+d=339,代入公式得K2的观测值为k=339×(43×121-162×13)2205×134×56×283≈7.469.因为7.4696.635,所以在犯错误的概率不超过1%的前提下认为50岁以上的人患慢性气管炎与吸烟有关系.规律小结解决一般的独立性检验问题的步骤:(1)通过列联表确定a,b,c,d,n的值,根据实际问题需要的可信程度确定临界值k0;(2)利用K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑)求出K2的观测值k;(3)如果k≥k0,就推断“两个分类变量有关系”,这种推断犯错误的概率不超过α,否则就认为在犯错误的概率不超过α的前提下不能推断“两个分类变量有关系”.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四变式训练2吃零食是中学生中普遍存在的现象,吃零食对学生身体发育有诸多不利影响,影响学生的健康成长.下表是性别与吃零食的列联表.男女总计喜欢吃零食51217不喜欢吃零食402868总计454085能否在犯错误的概率不超过0.05的前提下认为吃零食与性别有关?解:把相关数据代入公式K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑),得K2的观测值k=85×(140-480)217×68×45×40=98260002080800≈4.7223.841.故在犯错误的概率不超过0.05的前提下认为“吃零食与性别有关”.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四探究三独立性检验的综合应用1.独立性检验类似于数学中的反证法,要确认“两个变量有关系”这一结论成立的可信度,首先假设结论不成立,在假设下,我们构造的统计量K2应该很小.如果由观测数据计算得到的K2值很大,则在一定程度上说明假设不合理,再根据不合理的程度与临界值的相关关系作出判断.2.统计的基本思维模式是归纳,它的特征之一是通过部分数据的性质来推测全部数据的性质,因此,统计推断是可能犯错误的,即从数据上体现的只是统计关系,而不是因果关系.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四典型例题3为了调查某生产线上质量监督员甲在不在生产现场对产品质量好坏有无影响,现统计数据如下:甲在生产现场时,990件产品中有合格品982件,次品8件;甲不在生产现场时,510件产品中有合格品493件,次品17件.试分别用列联表、独立性检验的方法分析监督员甲对产品质量好坏有无影响.能否在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关系?思路分析:解答本题的关键是准确把握数据作出2×2列联表,然后具体分析.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四解:(1)2×2列联表如下:合格品数次品数总计甲在生产现场9828990甲不在生产现场49317510总计1475251500由列联表可得|ad-bc|=|982×17-493×8|=12750,相差较大,可在某种程度上认为“质量监督员甲是否在生产现场与产品质量有关系”.(2)由2×2列联表中的数据,计算得到K2的观测值为k=1500×(982×17-493×8)2990×510×1475×25≈13.09710.828,因此在犯错误的概率不超过0.001的前提下,认为质量监督员甲是否在生产现场与产品质量有关系.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四变式训练3某校文理分科期中考试后,按照学生的数学考试成绩优秀和不优秀统计,得到如下的列联表:优秀不优秀总计文科60140200理科265335600总计325475800(1)画出列联表的等高条形图,并通过图形判断数学成绩与文理分科是否有关;(2)利用独立性检验,求在犯错误的概率不超过多少的前提下认为文理分科对学生的数学成绩有影响.XINZHIDAOXUE新知导学DANGTANGJIANCE当堂检测ZHONGNANTANJIU重难探究首页探究一探究二探究三探究四解:(1)等高条形图如图所示.由图形可以看出理科数学成绩的优秀率大,故数学成绩与文理分科有关.(2)由列联表中的数据得到K2的观测值k=𝑛(𝑎𝑑-𝑏�