高中数学人教版选修12同课异构教学课件12独立性检验的基本思想及其初步应用探究导学课型

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1.2独立性检验的基本思想及其初步应用【阅读教材】根据下面的知识结构图阅读教材,了解独立性检验的基本步骤及基本思想.【知识链接】1.散点图散点图可以形象地展示两个变量之间的关系,所以它的主要目的就是直观了解两个变量之间的关系.2.用样本估计总体的两种情况(1)用样本的频率分布估计总体分布.(2)用样本的数字特征估计总体数字特征.主题一:列联表与等高条形图【自主认知】1.某班主任对全班50名学生作了一次调查,所得数据如表:认为作业多认为作业不多总计喜欢玩电脑游戏18927不喜欢玩电脑游戏81523总计262450喜欢玩电脑游戏的学生中认为作业多的所占的比例是多少?不喜欢玩电脑游戏的学生中认为作业多的呢?提示:喜欢玩电脑游戏的学生中认为作业多的所占的比例是,不喜欢玩电脑游戏的学生中认为作业多的所占的比例是.238232.某校对学生课外活动(文娱和体育)进行调查,结果整理成下图(两个深色条的高分别表示男生与女生样本中喜欢文娱的学生的频率):喜欢文娱的学生中是男生还是女生所占的比例多?提示:女生.根据以上探究,完成以下填空.1.与列联表相关的概念(1)分类变量:变量的不同“值”表示个体所属的_________,这样的变量称为分类变量.不同类别(2)列联表:①列出的_____分类变量的_______,称为列联表.②一般地,假设有两个分类变量X和Y,它们的取值分别为{x1,x2}和{y1,y2},其样本频数列联表(称为2×2列联表)为:y1y2总计x1ab____x2cd____总计________________两个频数表a+bc+da+cb+da+b+c+d2.等高条形图直观性:与表格相比,等高条形图更能直观地反映出两个分类变量间是否_________.用途:(1)常用等高条形图展示列联表数据的_________.(2)判断两个分类变量之间有关系可以通过观察等高条形图相差很大的两个量是_____和_____.相互影响频率特征aabccd【合作探究】1.分类变量的值就是指的一些具体实数吗?提示:这里的“变量”和“值”都应作为广义的变量和值来理解,只要不属于同种类别都是变量和值,并不一定是取具体的数值,如:男、女;上、下;左、右等.2.等高条形图与列联表相比有何优点?提示:更直观,更明了.3.利用等高条形图能否精确地判断两个分类变量是否有关系?为什么?提示:不能,因为通过等高条形图,可以粗略地判断两个分类变量是否有关系,但这种判断无法精确地给出所得结论的可靠程度.【过关小练】1.观察下列各图,其中两个分类变量x,y之间关系最强的是()【解析】选D.在四幅图中,D图中两个阴影的高相差最明显,说明两个分类变量之间关系最强.2.对两个分类变量进行独立性检验的主要作用是()A.判断模型的拟合效果B.对两个变量进行相关分析C.给出两个分类变量有关系的可靠程度D.估计预报变量的平均值【解析】选C.独立性检验的目的就是明确两个分类变量有关系的可靠程度.主题二:独立性检验的基本思想【自主认知】1.列联表中|ad-bc|的值与两个分类变量之间相关的强弱有什么关系?提示:在列联表中,若两个分类变量没有关系,则|ad-bc|≈0,所以|ad-bc|的值越小,两个分类变量之间的关系越弱;|ad-bc|的值越大,两个分类变量之间的关系越强.2.在独立性检验中,计算得k=29.78,在判断变量相关时,P(K2≥6.635)≈0.01的含义是什么?提示:P(K2≥6.635)≈0.01的含义是在犯错误的概率不超过0.01的前提下认为两个变量相关.根据以上探究,完成以下填空.独立性检验的基本思想(1)定义:利用_________K2来判断“两个分类变量_______”的方法称为独立性检验.(2)公式:K2=,其中n=a+b+c+d.2n(adbc)abcdacbd-随机变量有关系(3)独立性检验的具体步骤:①定上界:根据实际问题的需要确定容许推断“两个分类变量有关系”犯错误概率的上界α,然后查表确定________.②计算:利用公式计算随机变量K2的________.③下结论:如果_____,就推断“X与Y有关系”,这种推断犯错误的概率不超过α,否则,就认为在_____________不超过α的前提下不能推断“X与Y有关系”,或者在样本数据中_________________支持结论“X与Y有关系”.临界值k0观测值kk≥k0犯错误的概率没有发现足够证据【合作探究】根据下表数据,回答下列问题:P(K2≥k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828(1)在判断变量是否有关系时,若K2的观测值k=7.123,则判断两变量有关系犯错误的概率不超过.提示:由表格可知P(K2≥6.635)≈0.010,而k=7.1236.635,故应填0.010.答案:0.010(2)若求得K2的观测值k=0.70,则由表格数据可知,两变量之间的关系应该表述为.提示:由于P(K2≥0.455)≈0.50,故由相关性可知,没有足够证据说明两变量有关系.答案:没有足够证据说明两变量有关系(3)若求得K2的观测值k=56.35,则在说明两变量有关系时应用表格中k0的值为.提示:由于k的数据比较大,故应利用P(K2≥10.828)≈0.001中的k0=10.828这一数据.答案:10.828【过关小练】1.在研究吸烟与患肺癌的关系中,通过收集数据、整理分析数据得“吸烟与患肺癌有关”的结论,并且在犯错误的概率不超过0.01的前提下认为这个结论是成立的,下列说法中正确的是()A.100个吸烟者中至少有99人患有肺癌B.1个人吸烟,那么这个人有99%的概率患有肺癌C.在100个吸烟者中一定有患肺癌的人D.在100个吸烟者中可能一个患肺癌的人也没有【解析】选D.独立性检验的结果与实际问题有差异,即独立性检验的结论是一个数学统计量,它与实际问题中的确定性存在差异.2.有两个分类变量X与Y的一组数据,由其列联表计算得k≈4.523,则认为“X与Y有关系”犯错误的概率为()A.95%B.90%C.5%D.10%【解析】选C.P(K2≥3.841)≈0.05,而k≈4.5233.841.这表明认为“X与Y有关系”是错误的可能性约为0.05,即认为“X与Y有关系”犯错误的概率为5%.【归纳总结】分类变量的概念及等高条形图的三个关注点(1)分类变量的取值特点:分类变量的取值一定是离散的,而且不同的取值仅表示个体所属的类别,如性别变量,只取男、女两个值,商品的等级变量只取一级、二级、三级等.(2)分类变量的表示:分类变量的不同取值可以用数字来表示,这时的数字没有其他的含义,不同值之间的大小没有意义.(3)分类变量的图示:作图应注意单位统一,图形准确,但它不能给出两个分类变量有关或无关的精确的可信程度.【拓展延伸】假设检验的思想与反证法的关系反证法假设检验要证明结论A假设H1在A不成立的前提下进行推理在H1不成立的条件下,即H0成立的条件下进行推理推出矛盾,意味着结论A成立推出有利于H1成立的小概率事件(概率不超过α的事件)发生,意味着H1成立的可能性(可能性为(1-α))很大没有找到矛盾,不能对A下任何结论,即反证法不成功推出有利于H1成立的小概率事件不发生,接受原假设类型一:列联表与等高条形图【典例1】(2015·青岛高二检测)某学校对高三学生作了一项调查发现:在平时的模拟考试中,性格内向的学生426人中332人在考前心情紧张,性格外向的学生594人中有213人在考前心情紧张,作出等高条形图,利用图形判断考前心情紧张与性格类别是否有关系.【解题指南】先作出2×2列联表,再根据列联表数据作等高条形图,最后对比乘积的差距判断两个分类变量是否有关.【解析】作列联表如下:性格内向性格外向总计考前心情紧张332213545考前心情不紧张94381475总计4265941020相应的等高条形图如图所示:图中阴影部分表示考前心情紧张与考前心情不紧张中性格内向的比例,从图中可以看出考前心情紧张的样本中性格内向占的比例比考前心情不紧张样本中性格内向占的比例高,可以认为考前心情紧张与性格类型有关.【规律总结】1.利用等高条形图判断两个分类变量是否相关的步骤2.直观判断两个分类变量是否有关的思路(1)利用列联表直接计算ad-bc,如果两者相差很大,就判断两个分类变量之间有关系.(2)在等高线条形图中展示列联表数据的频率特征,比较图中两个深色条的高可以发现两者频率不一样而得出结论.这种直观判断的不足之处在于不能给出推断“两个分类变量有关系”犯错误的概率.【巩固训练】为了了解铅中毒病人是否有尿棕色素增加现象,分别对病人组和对照组的尿液做尿棕色素定性检查,结果如下表,问铅中毒病人组和对照组的尿棕色素阳性数有无相关关系?组别阳性数阴性数总计铅中毒病人组29736对照组92837总计383573【解析】根据列联表作出等高条形图(如图).由图形可知,铅中毒病人组与对照组相比较,尿棕色素为阳性差异明显,因此铅中毒病人与尿棕色素为阳性存在相关关系.【补偿训练】在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲.下列说法正确的是()A.男、女患色盲的频率分别为0.038,0.006B.男、女患色盲的概率分别为C.男人中患色盲的比例比女人中患色盲的比例大,患色盲与性别是有关的D.调查人数太少,不能说明色盲与性别有关193240260,【解析】选C.男人中患色盲的比例为要比女人中患色盲的比例大,其差值为≈0.0676,差值较大.38480,6520386||480520类型二:独立性检验【典例2】在对人们休闲方式的一次调查中,共调查120人,其中女性70人、男性50人.女性中有40人主要的休闲方式是看电视,另外30人主要的休闲方式是运动;男性中有20人主要的休闲方式是看电视,另外30人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表.(2)休闲方式与性别是否有关?【解题指南】(1)利用题目中所给的数据列表.(2)利用公式求出K2的观测值k的值.再利用临界值的大小来判断.【解析】(1)2×2的列联表为休闲方式性别看电视运动总计女性403070男性203050总计6060120(2)计算K2的观测值为k=≈3.429.而2.7063.4293.841,因为P(K22.706)≈0.10,P(K23.841)≈0.05,所以,在犯错误的概率不超过0.10的前提下,认为休闲方式与性别有关.2120(40302030)70506060【延伸探究】本题条件不变的情况下,画出等高条形图.【解析】【规律总结】解决一般的独立性检验问题的三个步骤(1)通过所给列联表确定a,b,c,d,n的值.(2)利用K2=求随机变量K2的观测值.(3)将所得K2的观测值与相关临界值比较,得出两个变量是否有关系的结论.2n(adbc)abcdacbd-【巩固训练】(2015·昆明高二检测)国家虽然出台了多次限购令,但各地房地产市场依然热火朝天,主要是利益的驱使,有些开发商不遵守职业道德,违规使用未经淡化海砂;为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了如下的2×2列联表:混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂2530使用未经淡化海砂15总计补充完整表中的数据:利用独立性检验的方法判断,能否在犯错误的概率不超过0.01的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?【解析】列联表如表所示:混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530使用未经淡化海砂151530总计402060假设:是否使用淡化海砂与混凝土耐久性是否达标无关,由已知数据可求得:k==7.56.635,因此,能在犯错误的概率不超过0.01的前提下,认为使用淡

1 / 65
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功