选修1-2第1章统计案例§1.1独立性检验重难点:了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用.考纲要求:①了解独立性检验(只要求22列联表)的基本思想、方法及其简单应用.②了解假设检验的基本思想、方法及其简单应用.经典例题:在一次恶劣气候的飞机航程中,调查了男女乘客在飞机上晕机的情况:男乘客晕机的有24人,不晕机的有31人;女乘客晕机的有8人,不晕机的有26人。请你根据所给数据判断是否在恶劣气候飞行中,男人比女人更容易晕机.当堂练习:1.独立性检验中的统计假设就是假设相关事件A,B()A.互斥B.不互斥C.相互独立D.不独立2.下列说法中正确的是()①独立性检验的基本思想是带有概率性质的反证法;②独立性检验就是选取一个假设0H条件下的小概率事件,若在一次试验中该事件发生了,这是与实际推断相抵触的“不合理”现象,则作出拒绝0H的推断;③独立性检验一定能给出明确的结论.A.①②B.①③C.②③D.①②③3.提出统计假设0H,计算出2的值,则拒绝0H的是()A.27.331B.22.9C.20.8D.21.94.独立性检验中的“小概率事件”是指某事件发生的概率()A.小于4%B.小于5%C.小于6%D.小于8%5.给出假设0H,下列结论中不能对0H成立与否作出明确判断的是()A.22.535B.27.723C.210.321D.220.1256.某班主任对全班50名学生进行了作业量的调查,数据如下表:则学生的性别与作业量的大小有关系的把握大约为()A.99%B.95%C.90%D.无充分根据7.研究某新药的疗效,给50个患者服用此药,跟踪调查后得如右表的数据。设0H:服用此药的效果与患者的性别无关.则2,从而得出结论8.在性别与吃零食这两个分类变量的计算中,下列说法正确的是①若2的观测值为k=6.635,我们有99%的把握认为吃零食与性别有关系,那么在100个吃零食的人中必有99人是女性;②从独立性检验可知有99%的把握认为吃零食与性别有关系时,我们说某人吃零食,那么此人是女性的可能性为99%;认为作业量大认为作业量不大总数男生18927女生81523总数262450无效有效合计男性患者153550女性患者44650合计1981100③若从统计量中求出有99%的把握认为吃零食与性别有关系,是指有1%的可能性使得出的判断出现错误.9.下列关于2的说法中,正确的是①2在任何相互独立问题中都可以用于检验是否相关;②2越大,两个事件的相关性越大;③2是用来判断两个相互独立事件相关与否的一个统计量,它可以用来判断两个事件是否相关这一类问题.10.某医疗机构为了了解肝病与酗酒是否有关,对成年人进行了一次随机抽样调查,结果如右表,则从直观上你能得到什么结论.11.为了调查服用某种新药是否会患某种慢性病,调查了200名服用此新药和100名未服用此种新药的人,调查结果如下表,试问此种患慢性病是否与服用新药有关?12.在对人们饮食习惯的一次调查中,共调查了124人,其中六十岁以上的70人,六十岁以下的54人,六十岁以上的人中有43人的饮食以蔬菜为主,另外27人则以肉类为主;六十岁以下的人中有21人饮食以蔬菜为主,另外33人则以肉类为主。(1)根据以上数据建立一个2×2的列联表;(2)判断人的饮食习惯是否与年龄有关.患肝病未患肝病合计酗酒30170200不酗酒20280300合计50450500患慢性病未患慢性病合计服用新药40160200乙工作1387100合计53247300选修1-2第1章统计案例§1.2回归分析重难点:解聚类分析的基本思想、方法及其简单应用;了解回归的基本思想、方法及其简单应用.考纲要求:①了解聚类分析的基本思想、方法及其简单应用.②了解回归的基本思想、方法及其简单应用.经典例题:某校医务室抽查了10名学生在高一和高二时的体重(单位:kg)如下表:高一成绩x74717268767367706574高二成绩y76757170767965776272(1)利用相关系数r判断y与x是否具有相关关系?(2)若y与x具有相关关系,试估计高一体重为78kg的学生在高二时的体重.当堂练习:1.下列两个变量之间的关系中,哪个是函数关系()A.学生的性别与他的数学成绩B.人的工作环境与健康状况C.女儿的身高与父亲的身高D.正三角形的边长与面积2.从某大学随机选取8名女大学生,其身高x(cm)和体重y(kg)的回归方程为ˆ0.84985.712yx,则身高172cm的女大学生,由回归方程可以预报其体重()A.为60.316kgB.约为60.316kgC.大于60.316kgD.小于60.316kg3.为研究变量x和y的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l和2l,两人计算知x相同,y也相同,则1l与2l的关系为()A.重合B.平行C.相交于点),(yxD.无法判断4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的回归系数为ˆb,回归截距是ˆa,那么必有()A.ˆb与r的符号相同B.ˆa与r的符号相同C.ˆb与r的符号相反D.ˆa与r的符号相反5.工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ160180yx,下列判断正确的是()A.劳动生产率为1000元时,工资为340元B.劳动生产率提高1000元时,工资提高180元C.劳动生产率提高1000元时,工资平均提高180元D.工资为520元时,劳动生产率为2000元6.由右表可计算出变量,xy的线性回归方程为()A.ˆ0.350.15yxB.ˆ0.350.25yxC.ˆ0.350.15yxD.ˆ0.350.25yx7.若回归直线方程中的回归系数b=0时,则相关系数r=8.下列结论中,能表示变量,xy具有线性相关关系的是①0.05||rr②0.05||rr③0.05||rr④0.05||rr9.下列说法中正确的是(填序号)x54321y21.5110.5①回归分析就是研究两个相关事件的独立性;②回归模型都是确定性的函数;③回归模型都是线性的;④回归分析的第一步是画散点图或求相关系数r;⑤回归分析就是通过分析、判断,确定相关变量之间的内在的关系的一种统计方法.10.变量x与y具有线性相关关系,当x取值为16,14,12,8时,通过观测得到y的值分别为11,9,8,5.若在实际问题中,y的预报最大取值是10,则x的最大取值不能超过多少?11.在某年一项关于16艘轮船的研究中,船的吨位区间从192吨到3246吨,船员的数目从5人到32人.船员人数y关于船的吨位x的线性回归方程为ˆ9.50.0062yx(1)假设两艘轮船吨位相差1000吨,则船员平均人数相差多少?(2)对于最小的船估计的船员数是多少?对于最大的船估计的船员数是多少?(本小题保留整数)12.已知10只狗的血球体积及红血球的测量值如下(x(血球体积,mm),y(血红球数,百万)):x45424648423558403950y6.536.309.257.506.995.909.496.206.557.72(1)画出上表的散点图;(2)求x,y,101iiixy,1021iix;(3)由散点图判断能否用线性回归方程来刻画x与y之间的关系,若能,求出线性回归方程.选修1-2第1章统计案例§1.3统计案例单元测试参考公式Pk2(K)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.8281、在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x轴上,预报变量在y轴上(C)可以选择两个变量中任意一个变量在x轴上(D)可以选择两个变量中任意一个变量在y轴上2、设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有()(A)b与r的符号相同(B)a与r的符号相同(C)b与r的相反(D)a与r的符号相反3、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是()(A)身高一定是145.83cm(B)身高在145.83cm以上(C)身高在145.83cm以下(D)身高在145.83cm左右4、两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数2R如下,其中拟合效果最好的模型是()(A)模型1的相关指数2R为0.98(B)模型2的相关指数2R为0.80(C)模型3的相关指数2R为0.50(D)模型4的相关指数2R为0.255、工人月工资(元)依劳动生产率(千元)变化的回归直线方程为ˆ6090yx,下列判断正确的是()(A)劳动生产率为1000元时,工资为50元(B)劳动生产率提高1000元时,工资提高150元(C)劳动生产率提高1000元时,工资提高90元(D)劳动生产率为1000元时,工资为90元6、为研究变量x和y的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l和2l,两人计算知x相同,y也相同,下列正确的是()(A)1l与2l重合(B)1l与2l一定平行(C)1l与2l相交于点),(yx(D)无法判断1l和2l是否相交7、考察棉花种子经过处理跟生病之间的关系得到如下表数据:种子处理种子未处理合计得病32101133不得病61213274合计93314407根据以上数据,则()(A)种子经过处理跟是否生病有关(B)种子经过处理跟是否生病无关(C)种子是否经过处理决定是否生病(D)以上都是错误的8、变量x与y具有线性相关关系,当x取值16,14,12,8时,通过观测得到y的值分别为11,9,8,5,若在实际问题中,y的预报最大取值是10,则x的最大取值不能超过()(A)16(B)17(C)15(D)129、在研究身高和体重的关系时,求得相关指数2R______________,可以叙述为“身高解释了64%的体重变化,而随机误差贡献了剩余的36%”所以身高对体重的效应比随机误差的效应大得多。10、某大学在研究性别与职称(分正教授、副教授)之间是否有关系,你认为应该收集哪些数据?11、某高校“统计初步”课程的教师随机调查了选该课的一些学生情况,具体数据如下表:性别专业非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到250(1320107)4.84423272030k因为23.841K,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为_____________12、许多因素都会影响贫穷,教育也许是其中之一,在研究这两个因素的关系时收集了美国50个州的成年人受过9年或更少教育的百分比(x)和收入低于官方规定的贫困线的人数占本州人数的百分比(y)的数据,建立的回归直线方程如下ˆ0.84.6yx,斜率的估计等于0.8说明,成年人受过9年或更少教育的百分比(x)和收入低于官方的贫困线的人数占本州人数的百分比(y)之间的相关系数(填充“大于0”或“小于0”)13、在对人们的休闲方式的一次调查中,共调查了124人,其中女性70人,男性54人。女性中有43人主要的休闲方式是看电视,另外27人主要的休闲方式是运动;男性中有21人主要的休闲方式是看电视,另外33人主要的休闲方式是运动。(1)根据以上数据建立一个2×2的列联表;(2)判断性别与休闲方式是否有关系。14、某种书每册的成本费y(元)与印刷册数x(千册)有关,经统计得到数据如下:x123510203050100200y10.155.524.082.852.111.621.411.301.211.15检验每册书的成本费y与印刷册数的倒数1x之间是否具有线性相关关系,