独立性检验的基本思想及其初步应用2定量变量——回归分析(画散点图、相关系数r、变量相关指数R、残差分析)分类变量——研究两个变量的相关关系:定量变量:体重、身高、温度、考试成绩等等。变量分类变量:性别、是否吸烟、是否患肺癌、宗教信仰、国籍等等。两种变量:本节研究的是两个分类变量的独立性检验问题。在日常生活中,我们常常关心分类变量之间是否有关系:例如,吸烟是否与患肺癌有关系?性别是否对于喜欢数学课程有影响?等等。为调查吸烟是否对患肺有影响,某种瘤研究所随机地调查了9965人,得到如下结果(单位:人)表1-7吸烟与肺癌列联表不患肺癌患肺癌总计不吸烟7775427817吸烟2099492148总计9874919965那么吸烟是否对患肺癌有影响?像表1-7这样列出的两个分类变量的频数表,称为列联表。结论:吸烟群体和不吸烟群体患肺癌的可能性存在差异,吸烟者患肺癌的可能性大。0.0054在不吸烟者中患肺癌的比重是在吸烟者中患肺癌的比重是0.0228等高条形图不患病比例患病比例结论:吸烟更容易引发肺癌表1-9吸烟与肺癌联列表不患肺癌患肺癌总计不吸烟aba+b吸烟cdc+d总计a+cb+da+b+c+d结论是否可靠?假设吸烟与患肺癌没有关系越小,说明吸烟与患肺癌之间的关系越弱。越大,说明吸烟与患肺癌之间的关系越强。bcadbcaddccbaa则0bcad即))()()(()(22dbcadcbabcadnK随机变量(卡方统计量):)(dcban其中0.500.400.250.150.100.050.0250.0100.0050.0010.4550.7081.3232.0722.7063.8415.0246.6357.87910.8280k0)k2P(K临界值表210.828K26.635K22.706K0.1%把握认为A与B无关1%把握认为A与B无关99.9%把握认A与B有关99%把握认为A与B有关90%把握认为A与B有关10%把握认为A与B无关独立性检验的定义利用随机变量来判断两个分类变量有关系的方法。2K要推断“Ⅰ和Ⅱ有关系”,可按下面的步骤进行:(1)提出假设H0:Ⅰ和Ⅱ没有关系;(3)查对临界值,作出判断。(2)根据2X2列联表与公式计算的观测值k;2K1.对分类变量X与Y的随机变量K2的观测值k,说法正确的是()A.k越大,“X与Y有关系”可信程度越小B.k越小,“X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大B课堂练习1:通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由22()()()()()nadbcKadcdacbd算得,22110(40302020)7.860506050K附表:2()pKk0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”A所以根据列联表的数据,可以有%的把握认为该学校15至16周岁的男生的身高和体重之间有关系。独立性检验临界值表:P(K2≥k0)0.0250.0100.0050.001k05.0246.6357.87910.828超重不超重合计偏高415不偏高31215合计7132097.522nadbcKabcdacbd由独立性检验随机变量2K值的计算公式得:220412135157135.9341.(2011·广东执信中学)某中学一位高三班主任对本班50名学生学习积极性和对待班级工作的态度进行长期的调查,得到的统计数据如下表所示:积极参加班级工作不太主动参加班级工作合计学习积极性高18725学习积极性一般61925合计242650(1)如果随机调查这个班的一名学生,那么抽到积极参加班级工作的学生的概率是多少?抽到不太积极参加班级工作且学习积极性一般的学生的概率是多少?(2)能否在犯错误的概率不超过0.001的前提下认为学生的积极性与对待班级工作的态度有关系?所以,在犯错误的概率不超过0.001的前提下,认为“学生的学习积极性与对待班级工作的态度”有关系.1.(2013·深圳二模)2013年3月14CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关数据如下表:混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530使用未经淡化海砂151530总计402060(1)根据表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?解析:(1)提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.课堂小结•1、列联表2、22nadbcKabcdacbd3、22临界值表的使用