[第56讲变量的相关性、统计案例](时间:45分钟分值:100分)基础热身1.[教材改编试题]考察下列各组变量,哪些变量是相关关系()①房屋面积与房屋价格;②粮食产量与施肥量;③铁块的大小与质量;④人体内脂肪含量与年龄.A.①③B.①④C.②④D.②③2.[2013·湛江调研]已知回归直线的斜率的估计值为1.23,样本点的中心为(4,5),则回归直线方程为()A.y^=1.23x+4B.y^=1.23x+5C.y^=1.23x+0.08D.y^=0.08x+1.233.[2013·商丘二模]对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系若是非确定关系,那么因变量不能由自变量唯一确定B.线性相关系数可以是正的,也可以是负的C.在回归分析中,如果r2=1,说明x与y之间完全相关D.样本相关系数r∈(-1,1)4.[2013·昆明质检]利用独立性检验来判断两个分类变量X和Y是否有关系,通过查阅下表来确定“X和Y有关系”的可信度.为了调查用电脑时间与视力下降是否有关系,现从某地网民中抽取100位居民进行调查,经过计算得K2≈3.855,那么就有________%的根据认为用电脑时间与视力下降有关系.P(K2k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828能力提升5.[2013·湖南卷]设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系,根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确...的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg6.对四组数据进行统计,获得以下散点图,关于其相关系数比较,正确的是()图K56-1A.r2r40r3r1B.r4r20r1r3C.r4r20r3r1D.r2r40r1r37.[2013·南阳一中月考]在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()A.若K2的观测值为k=6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病B.从独立性检验可知,有99%的把握认为吸烟与患肺病有关时,我们说某人吸烟,那么他有99%的可能患有肺病C.若从统计量中求出有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误D.以上三种说法都不正确8.[2013·大连检测]工人月工资y(元)与劳动生产率x(千元)变化的回归直线方程为y^=80x+50,则下列判断正确的是()①劳动生产率为1千元时,工资约为130元;②劳动生产率每提高1千元时,工资平均提高80元;③劳动生产率每提高1千元时,工资平均提高130元;④当月工资为210元时,劳动生产率约为2千元.A.①③B.②④C.①②④D.①②③④9.[2013·哈尔滨三中联考]下列说法中,不正确...的是()A.商品销售收入与商品的广告支出经费之间具有相关关系B.线性回归方程对应的直线y^=b^x+a^至少经过其样本数据点(x1,y1),(x2,y2),…,(xn,yn)中的一个点C.在残差图中,残差点分布的带状区域的宽度越狭窄,其模型拟合的精度越高D.在回归分析中,R2为0.98的模型比R2为0.80的模型拟合的效果好10.某市居民2013~2013年家庭年平均收入X(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20132013201320132013收入X11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭平均收入的中位数是________万元,家庭年平均收入与年平均支出有________(填“正”或“负”)线性相关关系.11.[2013·石家庄质检]经调查某地若干户家庭的年收入x(万元)和年饮食支出y(万元)具有线性相关关系,并得到y关于x的线性回归直线方程:y^=0.245x+0.321,由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.12.[2013·南昌一模]对一些城市进行职工人均工资水平x(千元)与居民人均消费水平y(千元)统计调查后知,y与x具有相关关系,满足回归方程y^=0.66x+1.562.若某被调查城市的居民人均消费水平为7.675(千元),则可以估计该城市人均消费额占人均工资收入的百分比约为________%(保留两个有效数字).13.某高校教“统计初步”课程的教师随机调查了选该课程的一些学生的情况,具体数据如下表:专业性别非统计专业统计专业男1310女720为了判断主修统计专业是否与性别有关系,根据表中的数据,得到K2=50×(13×20-10×7)223×27×20×30≈4.844,因为k3.841,所以判定主修统计专业与性别有关系,那么这种判断出错的可能性为________.14.(10分)[2013·保定二模]某空调生产部门为了提高工效,需分析该部门的产量x(台)与所用时间y(小时)之间的关系,为此做了4次统计,所得数据如下:生产空调的台数x(台)2345所用的时间y(小时)2.5344.5图K56-2(1)在所给的坐标系中画出表中数据的散点图与回归直线;(2)求出y关于x的线性回归方程y^=b^x+a^,并据此预测生产10台空调需要多少时间?参考公式:b^=错误!,错误!=y-错误!x15.(13分)[2013·吉林质检]户外运动已经成为一种时尚运动,某单位为了了解员工喜欢户外运动是否与性别有关,决定从本单位全体650人中采用分层抽样的办法抽取50人进行问卷调查,得到了如下列联表:喜欢户外运动不喜欢户外运动合计男性5女性10合计50已知在这50人中随机抽取1人抽到喜欢户外运动的员工的概率是35.(1)请将上面的列联表补充完整;(2)求该公司男、女员工各多少名;(3)是否有99.5%的把握认为喜欢户外运动与性别有关?并说明你的理由.下面的临界值表仅供参考:P(K2≥k)0.150.100.050.0250.0100.0050.001k2.0722.7063.8415.0246.6357.87910.828参考公式:K2=n(ad-bc)2(a+b)(c+d)(a+c)(b+d),其中n=a+b+c+d难点突破16.(12分)[2013·福建卷]某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y^=bx+a,其中b=-20,a=y-bx;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)课时作业(五十六)【基础热身】1.C[解析]①③都是函数关系,②④是相关关系,故选C.2.C[解析]因回归直线方程必过样本点的中心(x,y),将点(4,5)代入A,B,C检验可知,故选C.3.D[解析]样本相关系数r∈[-1,1],所以D错.4.95[解析]由附表可得知当K2≥3.841时,有概率P=1-P=0.95,而此时的K2≈3.855>3.841,则可以得到有95%以上的根据认为用电脑时间与视力下降有关系.【能力提升】5.D[解析]由线性回归方程的特征与性质,得A,B,C均正确,D选项是错误的,线性回归方程只能预测学生的体重.选项D应改为“若该大学某女生身高为170cm,则估计其体重大约为58.79kg”.6.A[解析]由散点图得,图1与图3是正相关,图2与图4是负相关,且图1与图2中的样本点较集中分布在一条直线附近,由相关系数的定义可知,故选A.7.C[解析]根据独立性检验的思想知,某人吸烟,只能说其患肺病的可能性较大,有99%的把握认为吸烟与患肺病有关系,但并没有理由认为吸烟者有99%的可能患肺病,故选C.8.C[解析]由回归直线方程为y^=80x+50,得劳动生产率为1千元时,工资约为130元,故①正确;当x增加1时,y要增加80元,则劳动生产率每提高1千元时,工资平均提高80元,故②正确,③错误;当月工资为210元时,即80x+50=210,解得x=2,即劳动生产率约为2千元,故④正确.综上知,正确的有①②④,故选C.9.B[解析]根据变量的相关关系的概念知选项A正确;根据残差的概念和相关系数的概念知选项C,D正确;线性回归方程经过样本点中心(x,y),B错.10.13正[解析]将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统计资料可以看出,中位数为13万元,且年平均收入增多时,年平均支出也增多,因此两者正相关.11.0.245[解析]家庭年收入每增加1万元,即x变为x+1,则y^=0.245(x+1)+0.321=0.245x+0.321+0.245,因此家庭年收入每增加1万元,年饮食支出平均增加0.245万元.12.83[解析]依题意得,当y=7.675时,有0.66x+1.562=7.675,x≈9.262.因此,可以估计该城市人均消费额占人均工资收入的百分比为7.6759.262≈83%.13.5%[解析]∵k3.841,查临界值表,得P(K2≥3.841)=0.05,故这种判断出错的可能性为5%.14.解:(1)由表中的数据,画出散点图与回归直线如图所示.(2)由表中数据,得错误!错误!=22+32+42+52=54,x=2+3+4+54=3.5,y=2.5+3+4+4.54=3.5,所以b^=错误!=错误!=0.7,a^=y-b^x=3.5-0.7×3.5=1.05,所以y关于x的回归直线方程为y^=0.7x+1.05.将x=10代入方程,得y^=0.7×10+1.05=8.05,故预测生产10台空调需要8.05小时.15.解:(1)∵在全部50人中随机抽取1人抽到喜欢户外运动的概率是35,∴喜欢户外运动的男女员工共30,其中,男员工20人,列联表补充如下:喜欢户外运动不喜欢户外运动合计男性20525女性101525合计302050(2)该公司男员工人数为2550×650=325,则女员工325人.(3)将2×2列联表中的数据代入公式计算,得K2=50×(20×15-10×5)230×20×25×25≈8.3337.879,∴有99.5%的把握认为喜欢户外运动与性别有关.【难点突破】16.解:(1)由于x=16(x1+x2+x3+x4+x5+x6)=8.5,y=16(y1+y2+y3+y4+y5+y6)=80.所以a=y-bx=80+20×8.5=250,从而回归直线方程为y^=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20x-3342+361.25.当且仅当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.