2019-2020学年高中数学 第1章 统计案例 1-2 独立性检验的基本思想及其初步应用课件 新人

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

01统计案例§1.2独立性检验的基本思想及其初步应用目标导向1.知识与技能本节通过对典型案例吸烟与患肺癌是否有关系的讨论了解独立性检验的常用方法:三维柱形图和二维条形图,及K2=nad-bc2a+bc+da+cb+d的大小关系.并会用所学的知识对具体案例进行检验.2.过程与方法先从实际问题之中发现问题,并探求解决方法,正确把握独立性检验的方法与技巧,并会在此基础上总结出解决这一类问题的一般方法,形成规律,并把所学的知识应用于实际之中,对有关理论、公式不要死记硬背,生搬硬套,要合理建模,准确运用,正确计算.3.情感、态度与价值观从实例中发现问题,提高学习兴趣,激发学习积极性和主动性,不断自我完善,养成不断探求知识完善自我的良好态度,独立性检验是相对的而不是绝对的,也需要发现和完善,从知识的应用中去认识其规律性.知识导学知识点独立性检验1.变量的不同值表示个体所属的不同类别,这样的变量叫做分类变量,可以用列联表来表示.2.为了使不同样本容量的数据有统一的评判标准,我们构造一个变量.K2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.先假设两个变量X与Y无关系,利用上述公式求出K2的观测值,k=nad-bc2a+bc+da+cb+d,再得出X与Y有关系的程度.P(K2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828由上表可知:(1)如果k10.828,就能在出错的概率不超过0.001的前提下认为X与Y有关系.(2)如果k7.879,就能在出错的概率不超过0.005的前提下认为X与Y有关系.(3)如果k6.635,就能在出错的概率不超过0.010的前提下认为X与Y有关系.(4)如果k5.024,就能在出错的概率不超过0.025的前提下认为X与Y有关系.(5)如果k3.841,就能在出错的概率不超过0.05的前提下认为X与Y有关系.(6)如果k2.706,就能在出错的概率不超过0.10的前提下认为X与Y有关系.(7)如果k≤2.706,就认为没有充分证据显示X与Y有关系.综上所述,对于K2值表中的某一列如果K2的观测值kk0,我们有“在出错的概率不超过α的前提下,认为两个分类变量X与Y有关”,也就是“认为分类变量X与Y有关正确的把握至少为(1-α)·100%”.3.利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法称为两个分类变量的独立性检验.独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系,这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值k很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出k6.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信度为99%.4.一般地假设两个分类变量X和Y,它们的值域分别为{x1,x2}和{y1,y2},其样本频数列联表(也称为2×2列联表)为下表.y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+d若要推断的论述为:H1:X与Y有关系,可以按如下步骤判断H1成立的可能性:(1)通过三维柱形图和二维条形图,可以粗略地判断两个分类变量是否有关系,但是这种判断无法精确地给出所得结论的可靠程度.①在三维柱形图中,主对角线上两个柱形高度的乘积ad与副对角线上两个柱形高度的乘积bc相差越大,H1成立的可能性就越大.②在二维条形图中,可以估计满足条件X=x1的个体中具有Y=y1的个体所占比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例为cc+d,两个比例的值相差越大,H1成立的可能性就越大.(2)可以利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体的做法是:①先根据实际问题需要的可信程度确定临界值k0;②根据观测数据计算由公式K2=nad-bc2a+bc+da+cb+d给出的随机变量K2的值k;③如果k≥k0,就以(1-P(K2≥k0))×100%的把握认为“X与Y有关系”;否则,就认为由样本数据没有充分的证据显示“X与Y有关系”.重点导析重点对于独立性检验问题,主要以K2=nad-bc2a+bc+da+cb+d的计算及与临界值的比较来判断事件的相关与无关为主,以及相互独立检验的基本思想,前者将以解答题的形式出现,而后者会以选择题为主.思维导悟导悟关于K值的计算【例】某大型企业人力资源部为了研究企业员工工作积极性和对待企业改革态度的关系,随机抽取了189名员工进行调查,所得数据如下表所示:积极支持企业改革不太赞成企业改革合计工作积极544094工作一般326395合计86103189对于人力资源部的研究项目,根据上述数据能得出什么结论?【解析】由公式得K2=189×54×63-40×32294×95×86×103≈10.759.因为10.7597.879,所以有99.5%的把握说:抽样员工对待企业改革的态度与工作积极性是有关的,可以认为企业的全体员工对待企业改革的态度与其工作积极性是有关的.方法导拨1.三维柱形图与二维条形图可用于粗略地判断两个分类变量是否有关系.(1)在三维柱形图中,主对角线上两个柱形高的乘积ad与副对角线上两个柱形高的乘积bc相差越大,两个分类变量X与Y有关系的可能性就越大.(2)在二维条形图中,可以估计图形满足X=x1的个体中具有Y=y1的个体所占的比例aa+b,也可以估计满足条件X=x2的个体中具有Y=y1的个体所占的比例cc+d,两个比例相差越大,X与Y有关系的可能性就越大.但是三维柱形图和二维条形图无法精确地给出所得结论的可靠程度,因而只做粗略估计,而不做具体运算.2.利用随机变量K2进行判断检验,先假设两个分类变量X与Y无关系,计算出K2的观测值k,把k与临界值进行比较,可以判断X与Y有关系的程度或无关系.在该假设下,构造的随机变量K2应该很小,如果实际计算出的K2的观测值k很大,则在一定程度上说明假设不合理,根据K2的含义可以利用统计估算的概率P(k≥6.635)≈0.01.3.独立性检验的一般步骤为:(1)假设两个分类变量X与Y无关系.(2)计算出K2的观测值k=nad-bc2a+ba+cb+dc+d.(3)把k的值与临界值比较确定X与Y有关系的程度或无关系.【例1】为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.【解析】(1)调查的500位老人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)K2=500×40×270-30×1602200×300×70×430≈9.967,由于9.9676.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.【例2】(2019年高考·课标全国卷Ⅰ)某商场为提高服务质量,随机调查了50名男顾客和50名女顾客,每位顾客对该商场的服务给出满意或不满意的评价,得到下面列联表:满意不满意男顾客4010女顾客3020能否有95%的把握认为男、女顾客对该商场服务的评价有差异?附:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d).P(K2≥k)0.0500.0100.001k3.8416.63510.828【解析】K2=100×(40×20-30×10)250×50×70×30≈4.762.由于4.7623.841,故有95%的把握认为男、女顾客对该商场服务的评价有差异.【例3】有人发现,多看电视容易使人变冷漠,下表是一个调查机构对此现象的调查结果:冷漠不冷漠总计多看电视6842110少看电视203858总计8880168则至少有__________的把握认为多看电视与人变冷漠有关系.【解析】根据表中的数据,得到k=168×68×38-42×20288×80×110×58≈11.377≥10.828,所以至少有99.9%的把握认为多看电视与人变冷漠有关系.【例4】在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人.女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动.(1)根据以上数据建立一个2×2的列联表;(2)能否在出错的概率不超过0.025的前提下认为性别与休闲方式有关系?【解析】(1)2×2的列联表如下:看电视运动总计女432770男213354总计6460124(2)假设“休闲方式与性别无关”,计算k=124×43×33-27×21270×54×64×60≈6.201,因为K2≥5.024,所以,能在出错的概率不超过0.025的前提下认为“休闲方式与性别有关系”.【例5】现调查中学生性别与肥胖的关系,从一学校随机抽取300人,得到以下列联表:肥胖不肥胖总计女3590125男30145175总计65235300由表中数据计算得k≈5.064,能否在出错的概率不超过0.010的前提下认为中学生的性别是否与肥胖有关系?【解析】P(K2≥6.635)=0.010,而k≈5.0646.635∴不能在出错的概率不超过0.010的前提下,认为中学生的性别与肥胖有关.

1 / 32
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功