第十章第四节1.(2014·石家庄质检)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归方程(如图),以下结论中正确的是()A.x和y正相关B.x和y的相关系数为直线l的斜率C.x和y的相关系数在-1到0之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同解析:选C由图知,回归直线的斜率为负值,所以x与y是负相关,且相关系数在-1到0之间,所以C正确.2.(2014·杭州月考)工人月工资y(元)依劳动生产率x(千元)变化的回归方程为y^=50+80x,下列判断正确的是()A.劳动生产率为1000元时,工资为130元B.劳动生产率提高1000元时,工资平均提高80元C.劳动生产率提高1000元时,工资平均提高130元D.当月工资为210元时,劳动生产率为2000元解析:选B由y^=50+80x可知,随x增大,y增大,故劳动生产率提高1000元时,工资平均提高80元.3.为了评价某个电视栏目的改革效果,在改革前后分别从居民点抽取了100位居民进行调查,经过计算K2≈0.99,根据这一数据分析,下列说法正确的是()A.有99%的人认为该电视栏目优秀B.有99%的人认为该电视栏目是否优秀与改革有关系C.有99%的把握认为该电视栏目是否优秀与改革有关系D.没有理由认为该电视栏目是否优秀与改革有关系解析:选D只有K2≥6.635才能有99%的把握认为该电视栏目是否优秀与改革有关系,而即使K2≥6.635也只是对“该电视栏目是否优秀与改革有关系”这个论断成立的可能性大小的结论,与是否有99%的人等无关.故选D.4.(2014·烟台诊断性测试)若回归直线方程的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线方程是()A.y^=1.23x+4B.y^=1.23x+5C.y^=1.23x+0.08D.y^=0.08x+1.23解析:选C由题意设回归直线方程为y^=1.23x+a,把(4,5)代入回归直线方程得5=1.23×4+a,解得a=0.08,所以回归直线方程是y^=1.23x+0.08.故选C.5.(2014·辽宁六校联考)某产品在某零售摊位上的零售价x(单位:元)与每天的销售量y(单位:个)的统计资料如下表所示:x16171819y50344131由上表可得回归直线方程y^=b^x+a^中的b^=-4,据此模型预计零售价定为15元时,每天的销售量为()A.48个B.49个C.50个D.51个解析:选B由题意知x-=17.5,y-=39,代入回归直线方程得a^=109,所以y^=-4x+109,当x=15时,y^=109-15×4=49,故选B.6.(2014·临沂模拟)春节期间,“厉行节约,反对浪费”之风悄然吹开,某市通过随机询问100名性别不同的居民是否能做到“光盘”行动,得到如下的列联表:做不到“光盘”能做到“光盘”男4510女3015附:P(K2≥k)0.100.050.025k2.7063.8415.024K2=nad-bc2a+bc+da+cb+d参照附表,得到的正确结论是()A.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别有关”B.在犯错误的概率不超过1%的前提下,认为“该市居民能否做到‘光盘’与性别无关”C.有90%以上的把握认为“该市居民能否做到‘光盘’与性别有关”D.有90%以上的把握认为“该市居民能否做到‘光盘’与性别无关”解析:选C由公式可计算K2的观测值k=nad-bc2a+bc+da+cb+d=10045×15-30×10255×45×75×25≈3.032.706,所以有90%以上的把握认为“该市民能否做到‘光盘’与性别有关”,故选C.7.在一项打鼾与患心脏病的调查中,共调查了1671人,经过计算K2的观测值k=27.63,根据这一数据分析,我们有理由认为打鼾与患心脏病是________的(有关,无关).解析:有关由观测值k=27.63与临界值比较,k6.635,在犯错误的概率不超过0.01的前提下认为打鼾与患心脏病有关系.8.某化工厂为预测某产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算得i=18xi=52,i=18yi=228,i=18x2i=478,i=18xiyi=1849,则y对x的回归直线方程是________.(精确到0.01)解析:y^=2.62x+11.47由回归系数的计算公式,得b^=i=18xiyi-8x-y-i=18x2i-8x-2≈2.62,a^=y--b^x-=11.47,故所求的回归直线方程为y^=2.62x+11.47.9.(2014·成都外国语学校月考)为了判断高中三年级学生选修文科是否与性别有关,现随机抽取50名学生,得到如下2×2列联表:理科文科合计男131023女72027合计203050已知P(K2≥3.841)≈0.05,P(K2≥5.024)≈0.025.根据表中数据,得到K2的观测值k=50×13×20-10×7223×27×20×30≈4.844,则认为选修文科与性别有关系出错的可能性约为________.解析:5%由K2的观测值k≈4.8443.841,故认为选修文科与性别有关系出错的可能性约为5%.10.假设关于某设备的使用年限x和所支出的维修费用y(万元),有如下的统计资料:使用年限x23456维修费用y2.23.85.56.57.0若由资料可知y和x呈相关关系,由表中数据算出线性回归方程y^=b^x+a^中的b^=1.23,据此估计,使用年限为10年时的维修费用大约是________万元.(参考公式:b^=i=1nxiyi-nx-y-i=1nx2i-nx-2,a^=y--b^x-)解析:12.38x-=4,y-=5,故样本中心点是(4,5),故a^=y--b^x-=5-1.23×4=0.08,所以y^=1.23x+0.08,所以使用年限为10年时的维修费用大约是1.23×10+0.08=12.38.11.(2014·石家庄模拟)为了调查某大学学生在周日上网的时间,随机对100名男生和100名女生进行了不记名的问卷调查.得到了如下的统计结果:表1:男生上网时间与频数分布表上网时间(分钟)[30,40)[40,50)[50,60)[60,70)[70,80]人数525302515表2:女生上网时间与频数分布表上网时间(分钟)[30,40)[40,50)[50,60)[60,70)[70,80]人数1020402010(1)若该大学共有女生750人,试估计其中上网时间不少于60分钟的人数;(2)完成下面的2×2列联表,并回答能否有90%的把握认为“大学生周日上网时间与性别有关”?表3上网时间少于60分钟上网时间不少于60分钟合计男生女生合计附:K2=nad-bc2a+bc+da+cb+dP(K2≥k0)0.500.400.250.150.100.050.0250.0100.0050.001k00.4550.7081.3232.0722.7063.845.0246.6357.87910.83解:(1)设估计上网时间不少于60分钟的人数为x,依题意有x750=30100,解得x=225,所以估计其中上网时间不少于60分钟的人数是225.(2)根据题目所给数据得到如下列联表:上网时间少于60分钟上网时间不少于60分钟合计男生6040100女生7030100合计13070200其中K2=20060×30-40×702100×100×130×70=20091≈2.1982.706,因此,没有90%的把握认为“大学生周日上网时间与性别有关”.12.(2012·福建高考)某工厂为了对新研发的一种产品进行合理定价,将该产品按事先拟定的价格进行试销,得到如下数据:单价x(元)88.28.48.68.89销量y(件)908483807568(1)求回归直线方程y^=bx+a,其中b=-20,a=y--bx-;(2)预计在今后的销售中,销量与单价仍然服从(1)中的关系,且该产品的成本是4元/件,为使工厂获得最大利润,该产品的单价应定为多少元?(利润=销售收入-成本)解:(1)由于x-=16(x1+x2+x3+x4+x5+x6)=8.5,y-=16(y1+y2+y3+y4+y5+y6)=80,所以a=y--bx-=80+20×8.5=250,从而回归直线方程为y^=-20x+250.(2)设工厂获得的利润为L元,依题意得L=x(-20x+250)-4(-20x+250)=-20x2+330x-1000=-20x-3342+361.25,所以当x=8.25时,L取得最大值.故当单价定为8.25元时,工厂可获得最大利润.1.(2013·福建高考)已知x与y之间的几组数据如下表:x123456y021334假设根据上表数据所得线性回归直线方程为y^=b^x+a^.若某同学根据上表中的前两组数据(1,0)和(2,2)求得的直线方程为y=b′x+a′,则以下结论正确的是()A.b^b′,a^a′B.b^b′,a^a′C.b^b′,a^a′D.b^b′,a^a′解析:选Cx-=1+2+3+4+5+66=72,y-=0+2+1+3+3+46=136,b^=i=1nxiyi-nx-y-i=1nx2i-nx-2=57,a^=y--b^x-=-13,所以b′=2-02-1=2b^,a′=-2a^.故选C.2.(2014·揭阳模拟)一般来说,一个人脚掌越长,他的身高就越高,现对10名成年人的脚掌长x与身高y进行测量,得到数据(单位均为cm)如下表,作出散点图,发现散点在一条直线附近,经计算得到一些数据:i=110(xi-x-)(yi-y-)=577.5,i=110(xi-x-)2=82.5.某刑侦人员在某案发现场发现一对裸脚印,量得每个脚印长为26.5cm,则估计案发嫌疑人的身高为________cm.身高141146154160169176181188197203解析:185.5回归方程的斜率b=i=110xi-x-yi-y-i=110xi-x-2=577.582.5=7,x-=24.5,y-=171.5,截距a=y--bx-=0,即回归方程为y^=7x,当x=26.5时,y^=185.5.3.(2014·梅州模拟)在2013年8月15日那天,某市物价部门对本市的5家商场的某商品的一天销售量及其价格进行调查,5家商场的售价x元和销售量y件之间的一组数据如下表所示:价格x99.5m10.511销售量y11n865由散点图可知,销售量y与价格x之间有较强的线性相关关系,其线性回归直线方程是:y^=-3.2x+40,且m+n=20,则其中的n=________.解析:10x-=9+9.5+m+10.5+115=8+m5,y-=11+n+8+6+55=6+n5,线性回归直线一定经过样本中心(x-,y-),所以6+n5=-3.28+m5+40,即3.2m+n=42,又m+n=20,由3.2m+n=42,m+n=20,解得m=10,n=10,故n=10.