课时作业(八十八)1.实验测得四组(x,y)的值为(1,2),(2,3),(3,4),(4,5),则y与x之间的回归直线方程为()A.y^=x+1B.y^=x+2C.y^=2x+1D.y^=x-1答案A解析画出散点图,四点都在直线y^=x+1.2.下列有关样本相关系数的说法不正确的是()A.相关系数用来衡量变量x与y之间的线性相关程度B.|r|≤1,且|r|越接近于1,相关程度越大C.|r|≤1,且|r|越接近0,相关程度越小D.|r|≥1,且|r|越接近1,相关程度越小答案D3.由一组样本(x1,y1),(x2,y2),…,(xn,yn)得到的回归直线方程y^=a+bx,下面有四种关于回归直线方程的论述:(1)直线y^=a+bx至少经过点(x1,y1),(x2,y2),…,(xn,yn)中的一个点;(2)直线y^=a+bx的斜率是;(3)直线y^=a+bx必过(x,y)点;(4)直线y^=a+bx和各点(x1,y1),(x2,y2),…,(xn,yn)的偏差是该坐标平面上所有的直线与这些点的偏差中最小的直线.其中正确的论述有()A.0个B.1个C.2个D.3个答案D解析线性回归直线不一定过点(x1,y1),(x2,y2),…,(xn,yn)中的任何一点;就是线性回归直线的斜率,也就是回归系数;线性回归直线过点(x,y);线性回归直线是平面上所有直线中偏差取得最小的那一条.故有三种论述是正确的,选D.4.设两个变量x和y之间具有线性相关关系,它们的相关系数是r,y关于x的回归直线的斜率是b,纵截距是a,那么必有()A.b与r的符号相同B.a与r的符号相同C.b与r的符号相反D.a与r的符号相反答案A5.两个相关变量满足如下关系:x1015202530y10031005101010111014则两变量的回归方程为()A.y^=0.56x+997.4B.y^=0.63x-231.2C.y^=0.56x+501.4D.y^=60.4x+400.7答案A解析回归直线经过样本中心点(20,1008.6),经检验只有选项A符合题意.6.(2012·湖南)设某大学的女生体重y(单位:kg)与身高x(单位:cm)具有线性相关关系.根据一组样本数据(xi,yi)(i=1,2,…,n),用最小二乘法建立的回归方程为y^=0.85x-85.71,则下列结论中不正确的是()A.y与x具有正的线性相关关系B.回归直线过样本点的中心(x,y)C.若该大学某女生身高增加1cm,则其体重约增加0.85kgD.若该大学某女生身高为170cm,则可断定其体重必为58.79kg答案D解析当x=170时,y^=0.85×170-85.71=58.79,体重的估计值为58.79kg,故D不正确.7.(2012·新课标全国文)在一组样本数据(x1,y1),(x2,y2),…,(xn,yn)(n≥2,x1,x2,…,xn不全相等)的散点图中,若所有样本点(xi,yi)(i=1,2,…,n)都在直线y=12x+1上,则这组样本数据的样本相关系数为()A.-1B.0C.12D.1答案D解析因为所有的点都在直线上,所以它就是确定的函数关系,所以相关系数为1.8.下表是某厂1~4月份用水量(单位:百吨)的一组数据:月份x1234用水量y4.5432.5由散点图可知,用水量y与月份x之间有较好的线性相关关系,其线性回归直线方程是y^=-0.7x+a,则a等于________.答案5.25解析x=2.5,y=3.5,∵回归直线方程过定点(x,y),∴3.5=-0.7×2.5+a.∴a=5.25.9.某服装商场为了了解毛衣的月销售量y(件)与月平均气温x(℃)之间的关系,随机统计了某4个月的月销售量与当月平均气温,其数据如下表:月平均气温x(℃)171382月销售量y(件)24334055由表中数据算出线性回归方程y^=bx+a中的b≈-2,气象部门预测下个月的平均气温约为6℃,据此估计,该商场下个月毛衣的销售量约为________件.(参考公式:b=i=1nxiyi-nxyi=1nx2i-nx2,a=y-bx)答案46解析由所提供数据可计算得出x=10,y=38,又b≈-2代入公式a=y-bx可得a=58,即线性回归方程y^=-2x+58,将x=6代入可得.10.某种产品的广告费支出x与销售额y(单位:百万元)之间有如下对应数据:x24568y3040605070(1)画出散点图;(2)求回归直线方程;(3)试预测广告费支出为10百万元时,销售额多大?解析(1)根据表中所列数据可得散点图如下:(2)列出下表,并用科学计算器进行有关计算.i12345xi24568yi3040605070xiyi60160300300560a=y-bx=50-1.08×5=44.6,因此,所求回归直线方程是y^=1.08x+44.6.(3)据上面求得的回归直线方程,当广告费支出为10百万元时,y^=1.08×10+44.6=55.4(百万元),即这种产品的销售收入大约为55.4百万元.11.某农科所对冬季昼夜温差大小与某反季大豆新品种发芽多少之间的关系进行分析研究,他们分别记录了2012年12月1日至12月5日的每天昼夜温差与实验室每天每100颗种子中的发芽数,得到如下表:日期12月1日12月2日12月3日12月4日12月5日温差x(℃)101113128发芽数y(颗)2325302616该农科所确定的研究方案是:先从这五组数据中选取2组,用剩下的3组数据求线性回归方程,再对被选取的2组数据进行检验.(1)求选取的2组数据恰好是不相邻的2天数据的概率;(2)若选取的是12月1日与12月5日的两组数据,请根据12月2日至12月4日的数据,求出y关于x的线性回归方程y^=bx+a;(3)若由线性回归方程得到的估计数据与所选出的检验数据的误差均不超过2颗,则认为得到的线性回归方程是可靠的,试问(2)中所得到的线性回归方程是否可靠?解析(1)设抽到不相邻的两组数据为事件A,因为从5组数据中选取2组数据共有10种情况:(1,2),(1,3),(1,4),(1,5),(2,3),(2,4),(2,5),(3,4),(3,5),(4,5)其中数据为12月份的日期数.每种情况都是可能出现的,事件A包括的基本事件有6种:所以P(A)=610=35.所以选取的2组数据恰好是不相邻2天数据的概率是35.(2)由数据,求得x=12,y=27.由公式,求得b=52,a=y-bx=-3.所以y关于x的线性回归方程为y^=52x-3.(3)当x=10,y^=52×10-3=22,|22-23|<2;同样,当x=8时,y^=52×8-3=17,|17-16|<2;所以,该研究所得到的回归方程是可靠的.12.(2012·辽宁)电视传媒公司为了解某地区电视观众对某类体育节目的收视情况,随机抽取了100名观众进行调查.下面是根据调查结果绘制的观众日均收看该体育节目时间的频率分布直方图.将日均收看该体育节目时间不低于40分钟的观众称为“体育迷”.根据已知条件完成下面的2×2列联表,并据此资料你是否认为“体育迷”与性别有关?非体育迷体育迷合计男女1055合计附:P(χ2≥k)0.050.01k3.8416.635解析由频率分布直方图可知,在抽取的100人中,“体育迷”有25人,从而2×2列联表如下:非体育迷体育迷合计男301545女451055合计7525100将2×2列联表中的数据代入公式计算,得χ2=100×30×10-45×15275×25×45×55=10033≈3.030.因为3.0303.841,所以没有理由认为“体育迷”与性别有关.13.甲、乙两所学校高三年级分别有1200人,1000人,为了了解两所学校全体高三年级学生在该地区六校联考的数学成绩情况,采用分层抽样方法从两所学校一共抽取了110名学生的数学成绩,并作出了频数分布统计表如下:甲校:分组[70,80)[80,90)[90,100)[100,110)频数34815分组[110,120)[120,130)[130,140)[140,150]频数15x32乙校:分组[70,80)[80,90)[90,100)[100,110)频数1289分组[110,120)[120,130)[130,140)[140,150]频数1010y3(1)计算x,y的值;(2)若规定考试成绩在[120,150]内为优秀,请分别估计两所学校数学成绩的优秀率;(3)由以上统计数据填写下面的2×2列联表,并判断能否在犯错误的概率不超过0.10的前提下认为两所学校的数学成绩有差异.甲校乙校总计优秀非优秀总计参考数据与公式:由列联表中数据计算K2=nad-bc2a+bc+da+cb+d.临界值表P(K2≥k0)0.100.050.010k02.7063.8416.635解析(1)从甲校抽取110×12001200+1000=60(人),从乙校抽取110×10001200+1000=50(人),故x=10,y=7.(2)估计甲校数学成绩的优秀率为1560×100%=25%,乙校数学成绩的优秀率为2050×100%=40%.(3)表格填写如图,甲校乙校总计优秀152035非优秀453075总计6050110K2的观测值k=110×15×30-20×45260×50×35×75≈2.8292.706,故在犯错误的概率不超过0.10的前提下认为两个学校的数学成绩有差异.1.(2011·江西理)变量X与Y相对应的一组数据为(10,1),(11.3,2),(11.8,3),(12.5,4),(13,5);变量U与V相对应的一组数据为(10,5),(11.3,4),(11.8,3),(12.5,2),(13,1).r1表示变量Y与X之间的线性相关系数,r2表示变量V与U之间的线性相关系数,则()A.r2r10B.0r2r1C.r20r1D.r2=r1答案C解析对于变量Y与X而言,Y随X的增大而增大,故Y与X正相关,即r10;对于变量V与U而言,V随U的增大而减小,故V与U负相关,即r20,所以有r20r1.故选C.2.(2013·安徽淮北一模)时维壬辰,序属仲春,值春耕播种时机,某中学生物研究性学习小组对春季昼夜温差大小与水稻发芽率之间的关系进行研究,记录了实验室4月10日至4月14日的每天昼夜温差与每天每50颗稻籽浸泡后的发芽数,得到如下资料:日期4月10日4月11日4月12日4月13日4月14日温差x/℃1012131411发芽数y/颗1113141612(1)从4月10日至4月14日中任选2天,记发芽的种子数分别为m,n,求事件“m,n均小于14”的概率;(2)根据表中的数据可知发芽数y(颗)与温差x(℃)呈线性相关,请求出发芽数y关于温差x的线性回归方程y^=bx+a.(参考公式:回归直线方程式y^=bx+a,其中b=i=1nxiyi-nx-y-i=1nx2i-nx-2,a=y--bx-)解析(1)m,n构成的基本事件(m,n)有:(11,13),(11,14),(11,16),(11,12),(13,14),(13,16),(13,12),(14,16),(14,12),(16,12),共有10个.其中“m,n均小于14”的有3个,故所求概率为310.(2)∵x-=12,y-=13.2,∴b=10×11+12×13+13×14+14×16+11×12-5×12×13.2102+122+132+142+112-5×122=1.2.于是,a=13.2-1.2×12=-1.2.故所求线性回归方程为y=1.2x-1.2.3.东亚运动会将于2013年10月6日在天津举行.为了搞好接待工作,组委会打算学习北京奥运会招募大量志愿者的经验,在某学院招募了16名男志愿者和14名女志愿者,调查发现,男女志愿者中分别有10人和6人喜爱运动,其余人不喜欢运动.(1)根据以上数据完成以下2×2列联表:喜爱运动不喜爱运动总计男1016女614总计30(2)根据列