数学·选修1-2(人教A版)1.2独立性检验的基本思想及其初步应用►达标训练1.在研究两个分类变量之间是否有关时,可以粗略地判断两个分类变量是否有关的是()A.散点图B.等高条形图C.2×2列联表D.以上均不对答案:B2.在等高条形图形图中,下列哪两个比值相差越大,要推断的论述成立的可能性就越大()A.aa+b与dc+dB.ca+b与ac+dC.aa+b与cc+dD.aa+b与cb+c答案:C3.对分类变量X与Y的随机变量K2的观测值k,说法正确的是()A.k越大,“X与Y有关系”可信程度越小B.k越小,“X与Y有关系”可信程度越小C.k越接近于0,“X与Y无关”程度越小D.k越大,“X与Y无关”程度越大答案:B4.下面是一个2×2列联表:y1y2总计x1a2173x222527总计b46100则表中a、b的值分别为()A.94、96B.52、50C.52、54D.54、52答案:C5.性别与身高列联表如下:高(165cm以上)矮(165cm以下)总计男37441女61319总计431760那么,检验随机变量K2的值约等于()A.0.043B.0.367C.22D.26.87答案:C6.给出列联表如下:优秀不优秀总计甲班103545乙班73845总计177390根据表格提供的数据,估计“成绩与班级有关系”犯错误的概率约是()A.0.4B.0.5C.0.75D.0.85答案:B►素能提高1.在调查中发现480名男人中有38名患有色盲,520名女人中有6名患有色盲,下列说法中正确的是()A.男人、女人中患有色盲的频率分别为0.038、0.006B.男人、女人患色盲的概率分别为19240、3260C.男人中患色盲的比例比女人中患色盲的比例大,患色盲是与性别有关的D.调查人数太少,不能说明色盲与性别有关解析:男人患色盲的比例为38480,比女人中患色盲的比例6520大,其差值为38480-6520≈0.0676,差值较大.答案:C2.通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2=算得,K2=≈7.8.附表:P(K2≥k0)0.0500.0100.001k03.8416.63510.828参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”答案:A3.若由一个2×2列联表中的数据计算得K2=4.013,那么在犯错误的概率不超过0.05的前提下认为两个变量______(填“有”或“没有”)关系.答案:有4.(2013·韶关二模)以下四个命题:①在一次试卷分析中,从每个试室中抽取第5号考生的成绩进行统计,是简单随机抽样;②样本数据:3,4,5,6,7的方差为2;③对于相关系数r,|r|越接近1,则线性相关程度越强;④通过随机询问110名性别不同的行人,对过马路是愿意走斑马线还是愿意走人行天桥进行抽样调查,得到如下列联表:男女总计走天桥402060走斑马线203050总计6050110由K2=可得,K2==7.8,则有99%以上的把握认为“选择过马路方式与性别有关”,其中正确的命题序号是________.答案:②③④附表P(K2≥k0)0.050.0100.001k03.8416.63510.8285.某学校为了调查喜欢语文学科与性别的关系,随机调查了一些学生情况,具体数据如下表:类别性别不喜欢语文喜欢语文男1310女720为了判断喜欢语文学科是否与性别有关系,根据表中的数据,得到K2的观测值k=≈4.844,因为k≥3.841,根据下表中的参考数据:P(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.8415.0246.6357.87910.828判定喜欢语文学科与性别有关系,那么这种判断出错的可能性为________.答案:5%6.某学校课题组为了研究学生的数学成绩与物理成绩之间的关系,随机抽取高二年级20名学生某次考试成绩(满分100分)如下表所示:序号12345678910数学成绩95758094926567849871物理成绩90637287917158829381序号11121314151617181920数学成绩67936478779057837283若单科成绩85以上(含85分),则该科成绩优秀.(1)根据上表完成下面的2×2列联表(单位:人).数学成绩优秀数学成绩不优秀合计物理成绩优秀物理成绩不优秀合计解析:(1)2×2列联表为(单位:人):数学成绩优秀数学成绩不优秀合计物理成绩优秀527物理成绩不优秀11213合计61420(2)根据题(1)中表格的数据计算,能否在犯错误的概率不超过0.005的前提下认为学生的数学成绩与物理成绩之间有关系?参数数据:①假设有两个分类变量X和Y,它们的值域分别为(x1,x2)和(y1,y2),其样本频数列联表(称为2×2列联表)为:y1y2合计x1aba+bx2cdc+d合计a+cb+da+b+c+d则随机变量K2=,其中n=a+b+c+d为样本容量;②独立检验随机变量K2的临界值参考表如下:P(K2≥k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828物理成绩77824885699161847886解析:根据列联表可以求得K2的观测值k=≈8.8027.879.在犯错误的概率不超过0.005的前提下认为:学生的数学成绩与物理成绩之间有关系.7.2013年3月14日,CCTV财经频道报道了某地建筑市场存在违规使用未经淡化海砂的现象.为了研究使用淡化海砂与混凝土耐久性是否达标有关,某大学实验室随机抽取了60个样本,得到了相关数据如下表:混凝土耐久性达标混凝土耐久性不达标总计使用淡化海砂25530使用未经淡化海砂151530总计402060(1)根据表中数据,利用独立性检验的方法判断,能否在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关?解析:提出假设H0:使用淡化海砂与混凝土耐久性是否达标无关.根据表中数据,求得K2的观测值k==7.5>6.635.查表得P(K2≥6.635)=0.010.∴能在犯错误的概率不超过1%的前提下,认为使用淡化海砂与混凝土耐久性是否达标有关.(2)若用分层抽样的方法在使用淡化海砂的样本中抽取了6个,现从这6个样本中任取2个,则取出的2个样本混凝土耐久性都达标的概率是多少?参考数据:P(K2≥k)0.100.0500.0250.0100.001k2.7063.8415.0246.63510.828解析:用分层抽样的方法在使用淡化海砂的样本中抽取6个,其中应抽取“混凝土耐久性达标”的为2530×6=5,“混凝土耐久性不达标”的为6-5=1,“混凝土耐久性达标记”为A1,A2,A3,A4,A5”;“混凝土耐久性不达标”的记为B.在这6个样本中任取2个,有以下几种可能:(A1,A2),(A1,A3),(A1,A4),(A1,A5),(A1,B),(A2,A3),(A2,A4),(A2,A5),(A2,B),(A3,A4),(A3,A5),(A3,B),(A4,A5),(A4,B)(A5,B),共15种.设“取出的2个样本混凝土耐久性都达标”为事件A,它的对立事件A为“取出的2个样本至少有1个混凝土耐久性不达标”,包含(A1,B),(A2,B),(A3,B),(A4,B),(A5,B),共5种可能.∴P(A)=1-P(A)=1-515=23.即取出的2个样本混凝土耐久性都达标的概率是23.8.某食品厂为了检查甲、乙两条自动包装流水线的生产情况,随机在这两条流水线上各抽取40件产品作为样本称出它们的重量(单位:克),重量值落在(495,510]的产品为合格品,否则为不合格品.左下表是甲流水线样本频数分布表,右下图是乙流水线样本的频率分布直方图.产品重量/克频数(490,495]6(495,500]8(500,505]14(505,510]8(510,515]4甲流水线样本频数分布表(1)根据上表数据作出甲流水线样本的频率分布直方图;解析:甲流水线样本的频率分布直方图如下:(2)若以频率作为概率,试估计从两条流水线分别任取1件产品,该产品恰好是合格品的概率;解析:由题表知甲样本中合格品数为8+14+8=30,由题图知乙样本中合格品数为(0.06+0.09+0.03)×5×40=36,故甲样本合格品的频率为3040=0.75,乙样本合格品的频率为3640=0.9.据此可估计从甲流水线任取1件产品,该产品恰好是合格品的概率为0.75.从乙流水线任取1件产品,该产品恰好是合格品的概率为0.9.(3)由以上统计数据完成下面2×2列联表,能否在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关?甲流水线乙流水线合计合格品a=b=不合格品c=d=合计n=附表:P(K2≥k0)0.150.100.050.0250.0100.0050.001k02.0722.7063.8415.0246.6357.87910.828(参考公式:K2=,其中n=a+b+c+d)解析:2×2列联表如下:甲流水线乙流水线合计合格品a=30b=3666不合格品c=10d=414合计4040n=80∵K2=nad-bc2a+bc+da+cb+d=80×120-360266×14×40×40≈3.1172.706.∴在犯错误的概率不超过0.1的前提下认为产品的包装质量与两条自动包装流水线的选择有关.►品味高考1.为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中需要志愿者提供帮助的老年人的比例.解析:调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中需要帮助的老年人的比例的估计值为70500=14%.(2)能否在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要志愿者提供帮助与性别有关?解析:K2的观测值k=500×40×270-30×1602200×300×70×430≈9.967,由于9.9676.635所以在犯错误的概率不超过0.01的前提下认为该地区的老年人是否需要帮助与性别有关.(3)根据(2)的结论,能否提出更好的调查办法来估计该地区的老年人中需要志愿者提供帮助的老年人的比例?说明理由.解析:由于(2)的结论知,该地区的老年人是否需要帮助与性别有关,并且从样本数据能看出该地区男性老年人与女性老年人中需要帮助的比例有明显差异,因此在调查时,先确定该地区老年人中男、女的比例,再把老年人分成男、女两层并采用分层抽样方法比采用简单随机抽样方法更好.附:K2=P(K2≥k0)0.0500.0100.001k03.8416.63510.8282.某工厂有25周岁以上(含25周岁)工人300名,25周岁以下工人200名.为研究工人的日平均生产量是否与年龄有关,现采用分层抽样的方法,从中抽取了100名工人,先统计了他们某月的日平均生产件数,然后按工人年龄在“25周岁以上(含25周岁)”和“25周岁以下”分为两组,再将两组工人的日平均生产件数分为5组:[50,60),[60,70),[70,80),[80,90),[90,100)分别加以统计,得到如图所示的频率分布直方图.(1)从样本中日平均生产件数不足60件的工人中随机抽取2人,求至少抽到一名“25周岁以下组”工人的概