-1-2.2独立性检验2.3独立性检验的基本思想目标导航1.理解独立性检验的基本思想.2.掌握利用统计量χ2检验变量之间是否独立的方法.知识梳理1.2×2列联表设A,B为两个变量,每一个变量都可以取两个值,若用a表示变量A取A1,且变量B取B1时的数据;用b表示变量A取A1,且变量B取B2时的数据;用c表示变量A取A2,且变量B取B1时的数据;用d表示变量A取A2,且变量B取B2时的数据,则会得到A,B之间的2×2列联表如下:BAB1B2总计A1aba+bA2cdc+d总计a+cb+dn=a+b+c+d根据表格中的数据来判断A,B之间是否独立,这一问题就称为2×2列联表的独立性检验.变量A:A1,A2=𝐴1;变量𝐵:𝐵1,𝐵2=𝐵1.在2×2列联表中,一定要注意A2=𝐴1,𝐵2=𝐵1.知识梳理2.制作2×2列联表的步骤第一步:合理选取两个变量,且每一个变量都取两个值;第二步:抽取样本,整理数据;第三步:画出2×2列联表.知识梳理【做一做1】下面是一个2×2列联表:YXy1y2总计x1a4268x2181230总计b54表中a,b处的值分别为()A.108,42B.26,34C.26,44D.44,26解析:由表可知a=68-42=26.所以b=a+18=26+18=44.答案:C知识梳理3.A,B相互独立的条件和结论若A,B是相互独立的,则有P(A1B1)=P(A1)P(B1),P(A1B2)=P(A1)P(B2),P(A2B1)=P(A2)P(B1),P(A2B2)=P(A2)P(B2),反之亦然.若A,B是相互独立事件,则P(AB)=P(A)P(B).知识梳理4.2×2列联表中的数据的作用设n=a+b+c+d,用𝑎𝑛估计𝑃(𝐴1𝐵1),用𝑎+𝑏𝑛估计𝑃(𝐴1),用𝑎+𝑐𝑛估计𝑃(𝐵1),若有式子𝑎𝑛=𝑎+𝑏𝑛·𝑎+𝑐𝑛,则可以认为𝐴1与𝐵1独立.同理,若𝑏𝑛=𝑎+𝑏𝑛·𝑏+𝑑𝑛,则可以认为𝐴1与𝐵2独立;若𝑐𝑛=𝑐+𝑑𝑛·𝑎+𝑐𝑛,则可以认为𝐴2与𝐵1独立;若𝑑𝑛=𝑐+𝑑𝑛·𝑏+𝑑𝑛,则可以认为𝐴2与𝐵2独立.知识梳理5.独立性检验统计学家选取统计量χ2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑)的大小来检验变量之间是否独立.在统计中,用以下结果对变量的独立性进行判断:(1)当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的;(2)当χ22.706时,有90%的把握判定变量A,B有关联;(3)当χ23.841时,有95%的把握判定变量A,B有关联;(4)当χ26.635时,有99%的把握判定变量A,B有关联.名师点拨使用χ2统计量作2×2列联表的独立性检验时,一般要求表中的4个数据都大于5,数据越大,越能说明结果的普遍性.知识梳理【做一做2】下列说法:①事件A与B经检验无关,即两个事件互不影响;②事件A与B关系越密切,χ2就越大;③χ2的大小是判断事件A与B是否相关的唯一数据;④若判定两事件A与B有关,则A发生B就一定发生.其中正确的有()A.1个B.2个C.3个D.4个解析:对于①,事件A与B经检验无关,只是说两事件的相关性较小,并不一定两事件互不影响,故①错误;②正确;对于③,判断A与B是否相关的方式很多,可以用列联表,也可以借助图形或概率运算,故③错误;对于④,两事件A与B有关,说明两者同时发生的可能性相对来说较大,但并不是A发生B就一定发生,故④错误.故选A.答案:A知识梳理【做一做3】考察棉花种子是否经过处理与得病之间的关系,得到如下表所示的数据(单位:株):处理情况得病情况种子处理种子未处理总计得病32101133不得病61213274总计93314407根据以上数据算得χ2的值约是.(精确到0.001)答案:0.164典例透析题型一题型二列出两个变量之间的2×2列联表【例1】某企业为了更好地了解设备改造与生产合格品的关系,随机抽取了180件产品进行分析.其中设备改造前生产的合格品有36件,不合格品有49件;设备改造后生产的合格品有65件,不合格品有30件.请根据数据,列出2×2列联表,可以用该列联表研究什么问题?分析:对产品进行分类,设备按改造前后分类,产品按合格、不合格分类,列出2×2列联表,研究设备改造对产品合格是否有影响.典例透析题型一题型二解:根据题意列出2×2列联表如下(单位:件):是否合格改造前后合格不合格总计设备改造前364985设备改造后653095总计10179180通过此2×2列联表可以研究设备改造对产品合格是否有影响.反思将文字叙述转为图表语言更为清晰,可为进一步研究问题做好充分的准备.典例透析题型一题型二【变式训练1】在调查的480名男性中有38名患有色盲,520名女性中有6名患有色盲,试作出性别与色盲的列联表.解:根据题目所给的数据计算得到如下的列联表(单位:人):患色盲情况性别患色盲不患色盲总计男38442480女6514520总计449561000典例透析题型一题型二独立性检验的基本思想【例2】某销售部门为了研究具有相关大学学历和销售能力的关系,对本部门200名销售人员进行调查,所得数据如下表所示(单位:人):能否按时完成销售任务情况学历情况能按时完成销售任务不能按时完成销售任务总计具有相关大学学历6043103不具有相关大学学历346397总计94106200对于销售部的研究,根据上述数据能得出什么结论?典例透析题型一题型二解:χ2=200×(60×63-43×34)2103×97×94×106≈10.79,因为10.796.635,所以有99%以上的把握认为销售人员具有相关大学学历与销售能力是有关的.反思利用χ2的计算公式求出χ2,再与临界值比较作出正确的结论.典例透析题型一题型二【变式训练2】某矿石粉厂在生产一种矿石粉时,数天内就有部分工人患职业性皮肤病,在生产季节开始,随机抽取75名车间工人穿上新防护服,其余仍穿原用的防护服,生产进行一个月后,对两组工人进行检查,结果如下(单位:人):问这种新防护服对预防工人职业性皮肤病是否有效?请说明你的理由.患皮肤病情况防护服种类患皮肤病未患皮肤病总计新57075旧101828总计1588103典例透析题型一题型二解法二通过计算χ2知,χ2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑)=103×(5×18-70×10)275×28×15×88≈13.8266.635,故有99%以上的把握说明新防护服对预防患这种皮肤病有效.解法一通过计算穿新、旧防护服的工人患皮肤病的发病率可知,穿新防护服工人的发病率为575×100%≈6.7%,而穿旧防护服工人的发病率为1028×100%≈35.7%,说明新防护服对预防皮肤病有一定效果.12341.经过对统计量χ2的研究,得出了统计中的三个值:2.706,3.841与6.635,下列说法正确的是()A.当χ23.841时,有95%的把握认为变量A与B有关联B.当χ26.635时,有99%的把握认为变量A与B有关联C.当χ2≥3.841时,可以认为变量A与B是无关联的D.当χ2≤2.706时,可以认为变量A与B是无关联的答案:D12342.有两个分类变量X与Y的一组数据,由其列联表计算,得χ2≈4.523,则认为“X与Y有关系”犯错的概率大约为()A.95%B.90%C.5%D.10%解析:χ2≈4.5233.841,这表明认为“X与Y有关系”是错误的可能性约为0.05,即认为“X与Y有关系”犯错误的概率为5%.答案:C12343.吃零食是中学生中普遍存在的现象.零食对学生身体发育有诸多不利的影响,影响学生的健康成长.下表给出性别与是否喜欢吃零食的列联表(单位:人):性别是否喜欢吃零食男女总计喜欢吃零食51217不喜欢吃零食402868总计454085则我们有的把握认为喜欢吃零食与性别有关系.解析:χ2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑)=85(140-480)217×68×45×40≈4.7223.841.故有95%的把握认为喜欢吃零食与性别有关.答案:95%12344.为了研究休闲方式是否与性别有关,共调查了120人,其中女性68人,男性52人,女性中有43人主要的休闲方式是看电视,另外25人主要的休闲方式是运动;男性中有19人主要的休闲方式是看电视,另外33人主要的休闲方式是运动,根据以上数据建立两个分类变量的列联表.解:根据数据可得两个分类变量的列联表如下(单位:人):休闲方式性别看电视运动总计女432568男193352总计6258120