教学准备1.教学目标1、结合生活中的实例了解分类变量的概念,了解列联表和等高条形图的特点2、通过实例,让学生了解独立性性检验的基本思想及其初步应用3、理解独立性检验的基本思想,会根据K2的观测值得大小判断两个分类变量有关的可信度2.教学重点/难点教学重点:独立性检验基本思想的初步应用,利用独立性检验的基本思想解决实际问题教学难点:对独立性检验思想的理解3.教学用具多媒体4.标签教学过程一、复习引入【师】在现实生活中,会遇到各种各样的变量,如果要研究它们之间的关系,观察下面两组变量,分析在取不同的值时表示的个体有何差异?【板演/PPT】问题1:(1)体重、身高、学生的学习成绩(2)性别、国籍、宗教信仰、是否吸烟、是否患病【师】引导学生交流思想统一认识后回答【生】1中每个变量取不同“值”时,表示不同个体,2中变量每取不同“值”表示个体所属不同的类别【板演/PPT】变量:分类变量、定量变量【师】在日常生活中存在着大量分类变量,如何判断连个分类变量是否有关系也是我们需要解决的一个重要问题。【板演/PPT】问题2在日常生活中,我们常常关心分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等【师】我们在研究两个定量变量之间的关系时,运用回归分析的基本思想进行回归分析,那么对于分类变量之间的关系该如何分析呢?本节课就是要学习独立性检验思想在分析分类变量之间关系中的应用。【板演/PPT】引例1.为调查吸烟是否对肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果:那么吸烟是否对患肺癌有影响?估计吸烟者与不吸烟者患病的可能性差异?二、新知介绍[1]结合具体实例,引入列联表概念【板演/PPT】类似于上面的表格,我们称分类变量的汇总统计表为列联表,一般我们只研究两个分类变量只取两个值,这样的列联表称作2×2列联表.【师】由上述表格能否得出患病与吸烟有关?把握有多大?【生】引导学生根据数据进行分析1.利用频率分布表判断;由患肺癌在吸烟者与不吸烟者中的频率差异可粗略估计吸烟对患肺癌有影响;2.利用统计图直观判断(1)通过三维柱形图判断两个分类变量是否有关系:由图中能清晰看出各个频数的相对大小,由患肺癌在吸烟者与不吸烟者中的相对频数差异可粗略估计吸烟对患肺癌有影响;(2)通过二维条形图判断两个分类变量是否有关系:作出患肺癌在吸烟者与不吸烟者中的的频率条形图由图中可看出,吸烟者中患肺癌的比例高于不吸烟者中患肺癌的比例,可估计吸烟对患肺癌有影响.【师】教师引导:上面通过分析数据和图形,得到的直观印象是吸烟和患肺癌有关,那么事实是否如此呢?并且能够以多大的把握认为”吸烟与患肺癌有关”?能否用统计学观点进一步考察这个问题.【生】积极思考【板书/PPT】为研究的一般性,在列联表中用字母代替数字【师】若假设吸烟与患肺癌两个变量没有关系,则应得到什么结论?【生】在吸烟者中患肺癌的比例约等于不吸烟者中患肺癌的比例,即a/a+b≈c/c+da(c+d)≈c(a+b)ad-bc≈0【师】若计算ad–bc的结果,由此可以初步得出什么结论?【生】︱ad–bc︱越小,说明吸烟与患肺癌之间关系越弱;︱ad–bc︱越大,说明吸烟与患肺癌之间关系越强.【师】为使不同的样本容量的数据有统一的评判标准,可构造一个随机变量其中n=a+b+c+d为样本容量若假设成立,k2应该很小;若,k2很大,说明假设不成立,即两变量有关系.利用上述公式,可计算出问题中的k2的观测值为同学们肯定会提出同一问题:那么这个值是不是很大?怎样才算很大?【板书/PPT】在假设成立的情况下,统计学家估算出如下的概率:现在的观测值56.632远大于6.635,即假设成立的概率为0.01,是小概率事件,也就是假设不合理的程度约为99%,,因此可以下结论:有99%的把握认为“吸烟与患肺癌有关系”。这就是两个分类变量独立性检验的基本思想,可以表述为:当很大时,就认为两个变量有关系;否则就认为没有充分的证据显示两个变量有关系。【师】以上就是独立性检验的基本思想?同学们能否总结什么是独立性检验?【生】学生思考、交流、总结【板书/PPT】独立性检验的基本思想类似于数学中的反证法,要确认两个分类变量有关系这一结论成立的可信程度,首先假设该结论不成立,即假设结论“两个分类变量没有关系”成立,在该假设下用我们构造的随机变量K2应该很小,如果由观测数据计算得到的K2的观测值很大,则在一定程度上说明假设不合理,根据随机变量K2的含义,可以通过P(K2≥6.635)≈0.01来评价假设不合理的程度,由实际计算出K26.635,说明假设不合理的程度约为99%,即两个分类变量有关系这一结论成立的可信程度为99%.[2]新知应用【师】为了深刻的理解独立性检验思想和在生活中的应用,我们来看下列一个问题【板书/PPT】例2在某医院,因为患心脏病而住院的665名男性病人中,有214人秃顶;而另外772名不是因为患心脏病而住院的男性病人中有175人秃顶。分别利用图形和独立性检验方法判断秃顶与患心脏病是否有关系?你所得的结论在什么范围内有效?【师】能否根据引例中的检验方式进行相关分析【生】学生交流分析过程【板书/PPT】解:根据题中所给数据列出二联表相应的等高条形图如图所示:比较来说,秃顶的病人中患心脏病的比例大一些,可以在某种程度上认为“秃顶与患心脏病有关”.【师】根据数据有多大把握判断秃顶与患心脏病是否有关系?【生】在假设的前提下,,所以有99%的把握认为“秃顶与患心脏病有关”.[3]拓展迁移【师】下面我们看这样具体实例【板书/PPT】跟踪训练为了探究吸烟习惯与患慢性气管炎是否有关,调查了339名50岁以上的人,获数据如下:吸烟习惯与患慢性气管炎是否相关?试用独立性检验的思想说明理由.【生】结合例题进行计算,体会独立性检验思想【学生表达/PPT】解:根据列联表的数据得到K2的观测值:所以,在犯错误的概率不超过0.01的前提下认为“吸烟习惯与患慢性气管炎有关”.(1)利用随机变量K2进行独立性检验的步骤:①根据实际问题需要的可信度α确定临界值k0;②根据给出数据计算得出随机变量K2的观测值k;③如果k≥k0,就认为在犯错误的概率不超过α的前提下,认为两变量有关系;否则,认为两个分类变量没有关系.(2)独立性检验能精确判断可靠程度,而等高条形图的优点是直观,但只可以粗略判断两个分类变量是否有关系,一般在通过图表判断后还需要用独立性检验来确认.【师】引导学生共同总结独立性检验的基本步骤【生】交流总结,组织语言【学生表达/PPT】在实际应用中,要在获取样本数据之前通过下表确定临界值:[4]随堂练习【师】下面针对本节课所学,做几道练习题【板书/PPT】答:C答:D课堂小结1.列联表与等高条形图列联表由两个分类变量之间频率大小差异说明这两个变量之间是否有关联关系,而利用等高条形图能形象直观地反映它们之间的差异,进而推断它们之间是否具有关联关系.2.对独立性检验思想的理解独立性检验的基本思想类似于数学中的反证法.先假设“两个分类变量没有关系”成立,计算随机变量K2的值,如果K2值很大,说明假设不合理.K2越大,两个分类变量有关系的可能性越大.板书