统计案例专题练习(高二文)一、知识点归纳1.线性回归方程①变量之间的两类关系:函数关系与相关关系;②制作散点图,判断线性相关关系③线性回归方程:abxy(最小二乘法)1221niiiniixynxybxnxaybx注意:线性回归直线经过定点),(yx。2.相关系数(判定两个变量线性相关性):niniiiniiiyyxxyyxxr11221)()())((注:⑴r0时,变量yx,正相关;r0时,变量yx,负相关;(2)||r越接近于1,两个变量的线性相关性越强;||r接近于0时,两个变量之间几乎不存在线性相关关系。3.回归分析中归效果的判定:(1)回归平方和:niiyy12)(-21)(niyiyi相关指数niiiniiiyyyyR12122)()(1。注:①2R得知越大,说明残差平方和越小,则模型拟合效果越好;②2R越接近于1,,则回归效果越好。4.独立性检验(分类变量关系):随机变量2K越大,说明两个分类变量,关系越强,反之,越弱。y1y2总计x1aba+bx2cdc+d总计a+cb+da+b+c+dK2=一、选择题1.下列属于相关现象的是()A.利息与利率B.居民收入与储蓄存款C.电视机产量与苹果产量D.某种商品的销售额与销售价格2.如果有95%的把握说事件A和B有关,那么具体算出的数据满足()A.23.841KB.23.841KC.26.635KD.26.635K3.下列变量之间:①人的身高与年龄、产品的成本与生产数量;②商品的销售额与广告费;③家庭的支出与收入.其中不是函数关系的有()A.0个B.1个C.2个D.3个4.当23.841K时,认为事件A与事件B()A.有95%的把握有关B.有99%的把握有关C.没有理由说它们有关D.不确定5.已知回归直线方程ybxa,其中3a且样本点中心为(12),,则回归直线方程为()A.3yxB.23yxC.3yxD.3yx6.为了考察中学生的性别与是否喜欢数学课程之间的关系,在某校中学生中随机抽取了300名学生,得到如下列联表:喜欢数学不喜欢数学合计男3785122女35143178合计72228300你认为性别与是否喜欢数学课程之间有关系的把握有()A.0B.95%C.99%D.100%8.在回归直线方程yabx中,回归系数b表示()A.当0x时,y的平均值B.x变动一个单位时,y的实际变动量C.y变动一个单位时,x的平均变动量D.x变动一个单位时,y的平均变动量9.对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的C.回归分析中,如果21r,说明x与y之间完全相关D.样本相关系数(11)r,10.在画两个变量的散点图时,下面哪个叙述是正确的()(A)预报变量在x轴上,解释变量在y轴上(B)解释变量在x轴上,预报变量在y轴上(C)可以选择两个变量中任意一个变量在x轴上(D)选择两个变量中任意一个变量在y轴上11、一位母亲记录了儿子3~9岁的身高,由此建立的身高与年龄的回归模型为y=7.19x+73.93用这个模型预测这个孩子10岁时的身高,则正确的叙述是()A.身高一定是145.83cm;B.身高在145.83cm以上;C.身高在145.83cm以下;D.身高在145.83cm左右.12、两个变量y与x的回归模型中,分别选择了4个不同模型,它们的相关指数2R如下,其中拟合效果最好的模型是()A.模型1的相关指数2R为0.98B.模型2的相关指数2R为0.80C.模型3的相关指数2R为0.50D.模型4的相关指数2R为0.2514、工人月工资y(元)依劳动生产率x(千元)变化的回归直线方程为ˆ6090yx,下列判断正确的是()A.劳动生产率为1000元时,工资为50元B.劳动生产率提高1000元时,工资提高150元C.劳动生产率提高1000元时,工资提高90元D.劳动生产率为1000元时,工资为90元15、在三维柱形图中,主对角线上两个柱形高度的乘积与副对角线上的两个柱形的高度的乘积相差越大两个变量有关系的可能性就()A.越大B.越小C.无法判断D.以上都不对16、对分类变量X与Y的随机变量2K的观测值K,说法正确的是()A.k越大,X与Y有关系”可信程度越小;B.k越小,X与Y有关系”可信程度越小;C.k越接近于0,X与Y无关”程度越小D.k越大,X与Y无关”程度越大17、在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;B.从独立性检验可知有99%的把握认为吸烟与患肺病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推判出现错误;D.以上三种说法都不正确.18、设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的相反D.a与r的符号相反19、已知x与y之间的一组数据:x0123y1357则y与x的线性回归方程为y=bx+a必过()A.(2,2)点B.(1.5,0)点C.(1,2)点D.(1.5,4)点20、已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是()A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.2321、为研究变量x和y的线性相关性,甲、乙二人分别作了研究,利用线性回归方法得到回归直线方程1l和2l,两人计算知x相同,y也相同,下列正确的是()A.1l与2l重合B.1l与2l一定平行C.1l与2l相交于点),(yxD.无法判断1l和2l是否相交22、下列说法正确的有()①回归方程适用于一切样本和总体。②回归方程一般都有时间性。③样本取值的范围会影响回归方程的适用范围。④回归方程得到的预报值是预报变量的精确值。A.①②B.②③C.③④D.①③23、考察棉花种子经过处理跟生病之间的关系得到如下表数据:根据以上数据,则()A.种子经过处理跟是否生病有关B.种子经过处理跟是否生病无关C.种子是否经过处理决定是否生病D.以上都是错误的24.某化工厂为预测某产品的回收率y,需要研究它和原料有效成份含量之间的相关关系,现取了8对观测值,计算得:8152iix,81228iiy,821478iix,811849iiixy,则y与x的回归直线方程是()A.11.472.62yxB.11.472.62yxC.2.6211.47yxxD.11.472.62yx25.如图所示,图中有5组数据,去掉B组数据后,剩下的4组数据的线性相关性最大()A.EB.CC.DD.A种子处理种子未处理合计得病32101133不得病61213274合计9331440726.为调查吸烟是否对患肺癌有影响,某肿瘤研究所随机地调查了9965人,得到如下结果(单位:人)不患肺病患肺病合计不吸烟7775427817吸烟2099492148合计9874919965根据表中数据,你认为吸烟与患肺癌有关的把握有()A.90%B.95%C.99%D.100%27.调查某医院某段时间内婴儿出生的时间与性别的关系,得到下面的数据表:晚上白天合计男婴243155女婴82634合计325789你认为婴儿的性别与出生时间有关系的把握为()A.80%B.90%C.95%D.99%28.已知线性相关关系的两个变量建立的回归直线方程为yabx,方程中的回归系数b()A.可以小于0B.只能大于0C.可以为0D.只能小于029.每一吨铸铁成本cy(元)与铸件废品率x%建立的回归方程568cyx,下列说法正确的是()A.废品率每增加1%,成本每吨增加64元B.废品率每增加1%,成本每吨增加8%C.废品率每增加1%,成本每吨增加8元D.如果废品率增加1%,则每吨成本为56元30.下列说法中正确的有:①若0r,则x增大时,y也相应增大;②若0r,则x增大时,y也相应增大;③若1r,或1r,则x与y的关系完全对应(有函数关系),在散点图上各个散点均在一条直线上()A.①②B.②③C.①③D.①②③二、填空题31.对于回归直线方程4.75257yx,当28x时,y的估计值为.32.直线回归方程yabx恒过定点.34、若一组观测值(x1,y1)(x2,y2)…(xn,yn)之间满足yi=bxi+a+ei(i=1、2.…n)若ei恒为0,则R2为35、若有一组数据的总偏差平方和为100,相关指数为0.5,则期残差平方和为_____回归平方和为____37、某考察团对全国10大城市进行职工人均平均工资x与居民人均消费y进行统计调查,y与x具有相关关系,回归方程562.166.0ˆxy(单位:千元),若某城市居民消费水平为7.675,估计该城市消费额占人均工资收入的百分比为()三、解答题38、某教育机构为了研究人具有大学专科以上学历(包括大学专科)和对待教育改革态度的关系,随机抽取了392名成年人进行调查,所得数据如下表所示:积极支持教育改革不太赞成教育改革合计大学专科以上学历39157196大学专科以下学历29167196合计68324392对于教育机构的研究项目,根据上述数据能得出什么结论.39、某企业为考察生产同一种产品的甲、乙两条生产线的产品合格率,同时各抽取100件产品,检验后得到如下联表:生产线与产品合格率列联表合格不合格总计甲线973100乙线955100总计1928200请问甲、乙两线生产的产品合格率在多大程度上有关系?40、若两个分类变量X与Y的列联表为:则“X与Y之间有关系”这个结论出错的可能性为多少?、1y2y1x10152x4016四、课下练习1.在画两个变量的散点图时,下面哪个叙述是正确的()A.预报变量在x轴上,解释变量在y轴上B.解释变量在x轴上,预报变量在y轴上C.可以选择两个变量中任意一个在x轴上D.以选择两个变量中任意一个在y轴上2.下列说法正确的有()①回归方程适用于一切样本和总体。②回归方程一般都有时间性。③样本取值的范围会影响回归方程的适用范围。④回归方程得到的预报值是预报变量的精确值。A.①②B.②③C.③④D.①③3.在回归分析中,代表了数据点和它在回归直线上相应位置的差异的是()A.总偏差平方和B.残差平方和C.回归平方和D.相关指数R24.下列结论正确的是()①函数关系是一种确定性关系;②相关关系是一种非确定性关系③回归关系是对具有函数关系的两个变量进行统计分析的一种方法④回归分析是对具有相关关系的两个变量进行统计分析的一种常用方法。A.①②B.①②③C.①②④D.①②③④5.已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是()A.y=1.23x+4B.y=1.23x+5C.y=1.23x+0.08D.y=0.08x+1.236回归分析中,相关指数R2的值越大,说明残差平方和()A.越小B.越大C.可能大也可能小D.以上都不对7若回归直线方程中的回归系数b=0时,则相关系数r=()A.1B.-1C.0D.无法确定8利用独立性检验来考虑两个分类变量X和Y是否有关系时,通过查阅下表来确定断言“X和Y有关系”的可信度。如果k5.024,那么就有把握认为“X和Y有关系”的百分比为()P(k2k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.845.0246.6357.87910.83A.25%B.75%C.2.5%D.97.5%