章末复习第一章统计案例1.会求线性回归方程,并用回归直线进行预报.2.理解独立性检验的基本思想及实施步骤.学习目标知识梳理达标检测题型探究内容索引知识梳理1.线性回归方程在线性回归方程y=a+bx中,b==,a=.其中一、线性回归分析x=,y=.∑ni=1xi-xyi-y∑ni=1xi-x2∑ni=1xiyi-nxy∑ni=1x2i-nx2y-bx1n∑ni=1xi1n∑ni=1yi(2)相关系数r的取值范围是,|r|值越大,变量之间的线性相关程度越高.(3)当r0时,b0,称两个变量正相关;当r0时,b0,称两个变量负相关;当r=0时,称两个变量线性不相关.2.相关系数(1)相关系数r的计算公式r=∑ni=1xiyi-nxy∑ni=1x2i-nx2∑ni=1y2i-ny2.[-1,1]1.条件概率的概念设A,B为两个事件,已知B发生的条件下,A发生的概率,称为B发生时A发生的条件概率,记为P(A|B).二、条件概率2.计算公式P(B|A)=PABPA=nABnA.1.独立事件的概念设A,B为两个事件,若P(AB)=,则称事件A与事件B相互独立.2.相互独立事件与互斥事件的对比三、独立事件P(A)P(B)互斥事件相互独立事件定义不可能同时发生的两个事件事件A是否发生对事件B发生的概率没有影响概率公式P(A+B)=P(A)+P(B)P(AB)=P(A)P(B)1.2×2列联表设A,B为两个变量,每一变量都可以取两个值,得到表格四、独立性检验BAB1B2总计A1ab_____A2cd_____总计__________n=___________a+bc+da+cb+da+b+c+d其中,a表示变量A取,且变量B取时的数据,b表示变量A取,且变量B取时的数据;c表示变量A取,且变量B取时的数据;d表示变量A取,且变量B取时的数据.上表在统计中称为2×2列联表.2.统计量χ2=.A1B1A1B2A2B1A2B2nad-bc2a+bc+da+cb+d3.独立性检验当χ2≤2.706时,没有充分的证据判定变量A,B有关联,可以认为变量A,B是没有关联的.当χ22.706时,有90%的把握判定变量A,B有关联.当χ23.841时,有95%的把握判定变量A,B有关联.当χ26.635时,有99%的把握判定变量A,B有关联.题型探究例1如图所示的是某企业2011年至2017年污水净化量(单位:吨)的折线图.(1)由折线图看出,可用线性回归模型拟合y和t的关系,请用相关系数加以说明;类型一回归分析解答(2)建立y关于t的回归方程,预测2019年该企业污水净化量.附注:参考数据:y=54,i=17(ti-t)(yi-y)=21,14≈3.74,i=17(yi-y)2=18.参考公式:相关系数r=i=1nti-tyi-yi=1nti-t2i=1nyi-y2,回归方程y=a+bt中斜率和截距的最小二乘法估计公式分别为b=i=1nti-tyi-yi=1nti-t2,a=y-bt.解答反思与感悟解决回归分析问题的一般步骤(1)画散点图.根据已知数据画出散点图.(2)判断变量的相关性并求回归方程.通过观察散点图,直观感知两个变量是否具有相关关系;在此基础上,利用最小二乘法求回归系数,然后写出回归方程.(3)实际应用.依据求得的回归方程解决实际问题.跟踪训练1某兴趣小组欲研究昼夜温差大小与患感冒人数之间的关系,他们分别到气象局与某医院抄录了1至6月份每月10号的昼夜温差x(℃)与因患感冒而就诊的人数y,得到如下资料:日期昼夜温差x(℃)就诊人数y(个)1月10日10222月10日11253月10日13294月10日12265月10日8166月10日612该兴趣小组确定的研究方案是:先从这六组数据中选取2组,用剩下的4组数据求线性回归方程,再用被选取的2组数据进行检验.(1)求选取的2组数据恰好是相邻两个月的概率;∴P(A)=515=13.解设抽到相邻两个月的数据为事件A.试验发生包含的事件是从6组数据中选取2组数据,共有15种情况,每种情况都是等可能出现的,其中抽到相邻两个月的数据的情况有5种,解答(2)若选取的是1月与6月的两组数据,请根据2至5月份的数据,求出y关于x的线性回归方程y=bx+a;解由数据求得x=11,y=24,由公式求得b=187,解答∴a=y-bx=-307,∴y关于x的线性回归方程为y=187x-307.(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2人,则认为得到的线性回归方程是理想的,试问该小组所得线性回归方程是否理想?(参考公式:b=i=1nxiyi-nxyi=1nx2i-nx2=i=1nxi-xyi-yi=1nxi-x2,a=y-bx)解当x=10时,y=1507,1507-222;当x=6时,y=787,787-122.∴该小组所得线性回归方程是理想的.解答类型二条件概率与独立事件例2(1)一个盒子中有6支好晶体管,4支坏晶体管,任取两次,每次取一支,第一次取后不放回,若已知第一支是好的,则第二支也是好的概率为___.59答案解析解析设Ai(i=1,2)表示“第i支是好的”.由题意,得P(A1)=610=35,P(A1A2)=610×59=13,∴P(A2|A1)=PA1A2PA1=1335=59.(2)小张参加某电视台举办的百科知识竞赛的预选赛,只有闯过了三关的人才能参加决赛.按规则:只有过了第一关,才能去闯第二关;只有过了第二关,才能去闯第三关.对小张来说,过第一关的概率为0.8,如果不按规则去闯第一关,而直接去闯第二关能通过的概率为0.75,直接去闯第三关能通过的概率为0.5.①求小张在第二关被淘汰的概率;解记“小张能过第一关”为事件A,“直接去闯第二关能通过”为事件B,“直接闯第三关能通过”为事件C,则P(A)=0.8,P(B)=0.75,P(C)=0.5.小张在第二关被淘汰的概率为P(AB)=P(A)[1-P(B)]=0.8×(1-0.75)=0.2.解答②求小张不能参加决赛的概率.解小张不能参加决赛的概率为1-P(ABC)=1-P(A)·P(B)P(C)=1-0.8×0.75×0.5=0.7.解答反思与感悟(1)要正确理解条件概率公式的意义,P(AB)为事件A,B同时发生的概率,P(A|B)表示在B发生的前提下,A发生的概率.(2)在解决互斥事件、对立事件与独立事件的综合问题时,一般先利用独立事件的定义求出各互斥事件发生的概率,然后利用概率加法公式求概率.(3)“至多”“至少”类题目可考虑利用对立事件的概率公式求解,以简化计算.跟踪训练2若某种动物由出生算起活到20岁的概率为0.8,活到25岁的概率为0.4,现有一只20岁的这种动物,则它能活到25岁的概率是_____.所以20岁的动物活到25岁的概率为P(B|A)=PABPA=PBPA=0.40.8=0.5.解析设“动物活到20岁”为事件A,“活到25岁”为事件B,则P(A)=0.8,P(B)=0.4,由于AB=B,所以P(AB)=P(B)=0.4.答案0.5解析类型三独立性检验思想及应用例3奥运会期间,为调查某高校学生是否愿意提供志愿者服务,用简单随机抽样方法从该校调查了60人,结果如下:解答是否愿意提供志愿者服务性别愿意不愿意男生2010女生1020(1)用分层抽样的方法在愿意提供志愿者服务的学生中抽取6人,其中男生抽取多少人?解由题意,可知男生抽取6×2020+10=4(人).(2)你能否在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关?下面的临界值表供参考:解答解χ2=60×20×20-10×10230×30×30×30≈6.667,P(χ2≥k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828独立性检验统计量χ2=nad-bc2a+bc+da+cb+d,其中n=a+b+c+d.由于6.667>6.635,所以能在犯错误的概率不超过0.01的前提下认为该高校学生是否愿意提供志愿者服务与性别有关.反思与感悟独立性检验问题的求解策略通过公式χ2=nad-bc2a+bc+da+cb+d先计算χ2的值,再与临界值表作比较,最后得出结论.跟踪训练3某学生对其亲属30人的饮食习惯进行了一次调查,并用茎叶图表示30人的饮食指数,如图所示.(说明:图中饮食指数低于70的人,饮食以蔬菜为主;饮食指数高于70的人,饮食以肉类为主).(1)根据茎叶图,帮助这位同学说明其亲属30人的饮食习惯;解答解30位亲属中50岁以上的人饮食多以蔬菜为主,50岁以下的人饮食多以肉类为主.(2)根据数据完成下列2×2列联表;解2×2列联表如表所示:解答主食蔬菜主食肉类总计50岁以下50岁以上总计主食蔬菜主食肉类总计50岁以下481250岁以上16218总计201030(3)在犯错误的概率不超过0.01的前提下,是否能认为“其亲属的饮食习惯与年龄有关”?故在犯错误的概率不超过0.01的前提下能够认为“其亲属的饮食习惯与年龄有关”.解答解χ2=30×8-128212×18×20×10=106.635,达标检测答案12341.下列相关系数r对应的变量间的线性相关程度最强的是A.r=0.90B.r=0.5C.r=-0.93D.r=05√则P(B|A)=PABPA=0.2+0.10.2+0.1+0.3=0.5,故选B.答案2.某工程施工在很大程度上受当地年降水量的影响,施工期间的年降水量X(单位:mm)对工期延误天数Y的影响及相应的概率P如下表所示:年降水量XX100100≤X200200≤X300X≥300工期延误天数Y051530概率P0.40.20.10.3在年降水量X至少是100的条件下,工期延误小于30天的概率为A.0.7B.0.5C.0.3D.0.2√解析12345解析设事件A为“年降水量X至少是100”,事件B为“工期延误小于30天”,答案1234解析答案3.某化妆品公司为了增加其商品的销售利润,调查了该商品投入的广告费用x与销售利润y的统计数据如下表:5广告费用x(万元)2356销售利润y(万元)57911由表中数据,得线性回归方程l:y=bx+a,则下列结论正确的是A.b<0B.a<0C.直线l过点(4,8)D.直线l过点(2,5)√解析4.在西非肆虐的“埃博拉病毒”的传播速度很快,这已经成为全球性的威胁.为了考察某种埃博拉病毒疫苗的效果,现随机抽取100只小鼠进行试验,得到如下列联表:感染未感染总计服用104050未服用203050总计3070100附表:P(χ2≥k)0.100.050.025k2.7063.8415.024参照附表,在犯错误的概率不超过____(填百分比)的前提下,认为“小鼠是否被感染与服用疫苗有关”.答案5%12345123455.对于线性回归方程y=bx+a,当x=3时,对应的y的估计值是17,当x=8时,对应的y的估计值是22,那么,该线性回归方程是_________,根据线性回归方程判断当x=___时,y的估计值是38.解析首先把两组值代入线性回归方程,得3b+a=17,8b+a=22,解得b=1,a=14.解析答案y=x+1424所以线性回归方程是y=x+14.令x+14=38,可得x=24,即当x=24时,y的估计值是38.1.建立回归模型的基本步骤(1)确定研究对象,明确变量.(2)画出散点图,观察它们之间的关系.(3)由经验确定回归方程的类型.(4)按照一定的规则估计回归方程中的参数.规律与方法其中(2)常用于古典概型的概率计算问题.3.独立性检验是研究两个分类变量间是否存在相关关系的一种案例分析方法.(1)定义法:计算P(A)