1.2独立性检验的基本思想及其初步应用课前预习导学KEQIANYUXIDAOXUE课堂合作探索KETANGHEZUOTANSUO目标导航预习引导学习目标1.能用等高条形图反映两个分类变量之间是否有关系.2.能够根据条件列出列联表并会由公式求K2.3.能知道独立性检验的基本思想和方法.重点难点重点:根据题目所给数据列出列联表及求K2.难点:独立性检验的基本思想和方法.课前预习导学KEQIANYUXIDAOXUE课堂合作探索KETANGHEZUOTANSUO目标导航预习引导1.分类变量变量的不同“值”表示个体所属的不同类别,像这样的变量称为分类变量.2.2×2列联表一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:2×2列联表YXy1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d课前预习导学KEQIANYUXIDAOXUE课堂合作探索KETANGHEZUOTANSUO目标导航预习引导预习交流1下面是2×2列联表:y1y2总计x1a2173x222527总计b46则表中a,b的值分别为()A.94,96B.52,50C.52,54D.54,52答案:C课前预习导学KEQIANYUXIDAOXUE课堂合作探索KETANGHEZUOTANSUO目标导航预习引导3.等高条形图(1)图形与表格相比,更能直观地反映出两个分类变量间是否相互影响,常用等高条形图展示列联表数据的频率特征.(2)观察等高条形图发现𝑎𝑎+𝑏和𝑐𝑐+𝑑相差很大,就判断两个分类变量之间有关系.4.独立性检验(1)定义:利用随机变量K2来判断“两个分类变量有关系”的方法称为独立性检验.(2)公式K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑),其中n=a+b+c+d为样本容量.课前预习导学KEQIANYUXIDAOXUE课堂合作探索KETANGHEZUOTANSUO目标导航预习引导预习交流2在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且有99%以上的把握认为这个结论是成立的.下列说法中正确的是()A.100个吸烟者中至少有99人患肺癌B.1个人吸烟,那么这个人至少有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有答案:D课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二一、用列联表和等高条形图分析两变量间的关系活动与探究谈谈你对两个分类变量X,Y的2×2列联表的理解.答:设两个变量X,Y,每一个变量都可以取两个值,变量X:x1,x2,变量Y:y1,y2.YXy1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d其中,a表示变量X取x1,且变量Y取y1时的数据;b表示变量X取x1,且变量Y取y2时的数据;c表示变量X取x2,且变量Y取y1时的数据;d表示变量X取x2,且变量Y取y2时的数据.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二例1某生产线上,质量监督员甲在生产现场时,990件产品中有合格品982件,次品8件;不在生产现场时,510件产品中有合格品493件,次品17件.试利用列联表和等高条形图判断监督员甲在不在生产现场对产品质量好坏有无影响.思路分析:由题目所给数据列出列联表并画出相应的等高条形图,直观判断两个分类变量之间的关系.解:根据题目所给数据得如下2×2列联表:合格品数次品数总计甲在生产现场9828990甲不在生产现场49317510总计1475251500∴ad-bc=982×17-8×493=12750,|ad-bc|比较大,说明甲在不在生产现场与产品质量好坏有关系.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二相应的等高条形图如图所示.图中两个阴影部分的高分别表示甲在生产现场和甲不在生产现场时样本中次品数的频率.从图中可以看出,甲不在生产现场时样本中次品数的频率明显高于甲在生产现场时样本中次品数的频率.因此可以认为质量监督员甲在不在生产现场与产品质量好坏有关系.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二点拨提示:利用等高条形图可粗略地判断两个分类变量是否有关系,这种判断可加深对独立性检验基本思想的理解.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二迁移与应用某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中有332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,试利用列联表和等高条形图判断考前心情紧张与性格类型是否有关系.解:考前心情紧张与性格类型列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020∴ad-bc=332×381-213×94=106470,∴|ad-bc|比较大,说明考前心情是否紧张与性格类型有关.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情是否紧张与性格类型有关.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二1.利用列联表直接计算ad-bc,如果两者相差很大,就判断两个分类变量之间有关系.2.在等高条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论.这种直观判断的不足之处在于不能给出推断“两个分类变量有关系”犯错误的概率.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二二、独立性检验与应用活动与探究1.独立性检验的基本思想是什么?答:先假设两个分类变量X与Y无关系,即X与Y相互独立,计算出K2的观测值k,把k与临界值进行比较,可以判断X与Y有关系的程度或无关系.在该假设下,构造的随机变量K2应该很小,如果实际计算出的K2的观测值k很大,则在一定程度上说明假设不合理.根据K2的含义可以利用统计估算概率P(K2≥6.635)=0.01.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二2.独立性检验的一般步骤是怎样的?答:独立性检验的一般步骤:(1)假设两个分类变量X与Y无关系;(2)计算出K2的观测值k=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑);(3)把k的值与临界值比较确定X,Y有关系的程度或无关系.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二例2为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?附:P(K2≥k)0.0500.0100.001k3.8416.63510.828K2=𝑛(𝑎𝑑-𝑏𝑐)2(𝑎+𝑏)(𝑐+𝑑)(𝑎+𝑐)(𝑏+𝑑)课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二思路分析:(1)求出老年人中需要帮助的共有多少人,再求比值.(2)利用公式计算出K2,再进行判断.解:(1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)K2的观测值k=500×(40×270-30×160)2200×300×70×430≈9.967.由于9.9676.635,所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.点拨提示:在实际应用题中,结合给出的数据先求出K2,然后与临界值3.841和6.635比较大小,得出结论.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二迁移与应用网络对现代人的生活影响很大,尤其对青少年,为了了解网络对中学生学习成绩的影响,某地区教育管理部门从辖区初中生中随机抽取了1000人调查,其中经常上网的有200人,这200人中有80人期末考试不及格,而另外800人中有120人不及格.问:中学生经常上网是否影响学习?课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二解:列出2×2列联表如下:经常上网不经常上网合计不及格80120200及格120680800合计2008001000由公式可得K2=1000×(80×680-120×120)2200×800×200×800=62.5,因为62.56.635,所以,在犯错误的概率不超过0.01的前提下,认为经常上网会影响学习.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测一二进行独立性检验时,首先要根据题意列出两个分类变量的列联表,然后代入公式计算随机变量K2的观测值k,再对照相应的临界值给出结论,以决定两个变量是否有关,还是在犯错误的概率不超过多少的前提下有关系.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE1234问题导学当堂检测1.观察下列各图,其中两个分类变量x,y之间关系最强的是()答案:D解析:在四幅图中,D图中的两个深色条的高度相差最明显,说明两个分类变量之间关系最强.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测12342.为调查中学生近视情况,某校150名男生中有80名近视,140名女生中有70名近视,在检验这些中学生眼睛近视是否与性别有关时用什么方法最有说服力()A.平均数B.方差C.独立性检验D.概率答案:C课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测12343.某工厂为了调查工人文化程度与月收入的关系,随机抽取了部分工人,得到如下列联表:(单位:人)月收入2000元以下月收入2000元及以上总计高中文化以上104555高中文化及以下203050总计3075105由上表中数据计算得K2的观测值k=105×(10×30-20×45)255×50×30×75≈6.109,请估计在犯错误的概率不超过的前提下认为“文化程度与月收入有关系”.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测1234答案:0.025解析:由于6.1095.024,故在犯错误的概率不超过0.025的前提下认为“文化程度与月收入有关系”.课堂合作探索KETANGHEZUOTANSUO课前预习导学KEQIANYUXIDAOXUE问题导学当堂检测12344.某医疗研究所为了检验某种血清预防感冒的作用,把500名使用血清的人与另外500名未使用血清的人一年中的感冒记录作比较,提出假设H0:“这种血清不能起到预防感冒的作用”,利用2×2列联表计算得K2≈3.918,经查临界值表