1.(2010·湖南文)某商品销售量y(件)与销售价格x(元/件)负相关,则其回归方程可能是()A.y^=-10x+200B.y^=10x+200C.y^=-10x-200D.y^=10x-200[答案]A[解析]由于销售量y与销售价格x成负相关,故x的系数应为负,排除B、D;又当x=10时,A中y=100,C中y=-300显然C不合实际,故排除C,选A.2.(2011·济南模拟)对于回归分析,下列说法错误的是()A.在回归分析中,变量间的关系是非确定性关系,因此因变量不能由自变量唯一确定B.线性相关系数可以是正的或负的C.回归分析中,如果r=±1,说明x与y之间完全线性相关D.样本相关系数r∈(-1,1)[答案]D[解析]∵相关系数|r|≤1,∴D错.3.(2011·西安模拟)在吸烟与患肺病这两个分类变量的计算中,下列说法正确的是()①若K2的观测值满足K2≥6.635,我们有99%的把握认为吸烟与患肺病有关系,那么在100个吸烟的人中必有99人患有肺病;②从独立性检验可知有99%的把握认为吸烟与患病有关系时,我们说某人吸烟,那么他有99%的可能患有肺病;③从统计量中得知有95%的把握认为吸烟与患肺病有关系,是指有5%的可能性使得推断出现错误A.①B.①③C.③D.②[答案]C[解析]①推断在100个吸烟的人中必有99人患有肺病,说法错误,排除A,B,③正确.排除D,选C.4.(文)(2011·陕西文,9)设(x1,y1),(x2,y2),…,(xn,yn)是变量x和y的n个样本点,直线l是由这些样本点通过最小二乘法得到的线性回归直线(如图),以下结论正确的是()A.直线l过点(x,y)B.x和y的相关系数为直线l的斜率C.x和y的相关系数在0到1之间D.当n为偶数时,分布在l两侧的样本点的个数一定相同[答案]A[解析]∵回归直线方程y^=a^+b^x中a^=y--b^x-,∴y^=y--b^x-+b^x,当x=x-时,y^=y-,∴直线l过定点(x-,y-).(理)(2011·山东文,8)某产品的广告费用x与销售额y的统计数据如下表广告费用x(万元)4235销售额y(万元)49263954根据上表可得回归方程y^=b^x+a^中的b^为9.4,据此模型预报广告费用为6万元时销售额为()A.63.6万元B.65.5万元C.67.7万元D.72.0万元[答案]B[解析]此题必须明确回归直线方程过定点(x,y).易求得x=3.5,y=42,则将(3.5,42)代入y^=b^x+a^中得:42=9.4×3.5+a^,即a^=9.1,则y=9.4x+9.1,所以当广告费用为6万元时销售额为9.4×6+9.1=65.5万元.5.(2011·湖南文,5)通过随机询问110名性别不同的大学生是否爱好某项运动,得到如下的列联表:男女总计爱好402060不爱好203050总计6050110由K2=nad-bc2a+bc+da+cb+d算得,K2=110×40×30-20×20260×50×60×50≈7.8.附表:P(K2≥k)0.0500.0100.001k3.8416.63510.828参照附表,得到的正确结论是()A.有99%以上的把握认为“爱好该项运动与性别有关”B.有99%以上的把握认为“爱好该项运动与性别无关”C.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别有关”D.在犯错误的概率不超过0.1%的前提下,认为“爱好该项运动与性别无关”[答案]A[解析]根据独立性检验的定义,由K2≈7.86.635可知,有99%以上把握认为“爱好该项运动与性别有关”.6.(2011·山东烟台一模、江西吉安质检)下表提供了某厂节能降耗技术改造后在生产A产品过程中记录的产量x(吨)与相应的生产能耗y(吨)的几组对应数据:x3456y2.5t44.5根据上表提供的数据,求出y关于x的线性回归方程为y^=0.7x+0.35,那么表中t的值为()A.3B.3.15C.3.5D.4.5[答案]A[解析]样本中心点是(x-,y-),即(4.5,11+t4).因为回归直线过该点,所以11+t4=0.7×4.5+0.35,解得t=3.7.(2011·合肥模拟)已知x、y之间的一组数据如下表:x13678y12345对于表中数据,甲、乙两同学给出的拟合直线分别为l1:y=13x+1与l2:y=12x+12,利用最小二乘法判断拟合程度更好的直线是________(填l1或l2).[答案]l2[解析]用y=13x+1作为拟合直线时,所得y值与y的实际值的差的平方和为s1=73;用y=12x+12作为拟合直线时,所得y值与y的实际值的差的平方和为s2=12.∵s2s1,故用直线y=12x+12拟合程度更好.8.(2011·郑州市质检)某中学对高二甲、乙两个同类班级进行“加强‘语文阅读理解’训练对提高‘数学应用题’得分率作用”的试验,其中甲班为试验班(加强语文阅读理解训练),乙班为对比班(常规教学,无额外训练),在试验前的测试中,甲、乙两班学生在数学应用题上的得分率基本一致,试验结束后,统计几次数学应用题测试的平均成绩(均取整数)如下表所示:60分以下61~70分71~80分81~90分91~100分甲班(人数)36111812乙班(人数)48131510现规定平均成绩在80分以上(不含80分)的为优秀.(1)试分析估计两个班级的优秀率;(2)由以上统计数据填写下面2×2列联表,并问是否有95%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.优秀人数非优秀人数合计甲班乙班合计参考公式及数据:K2=nad-bc2a+bc+da+cb+d,P(K2≥k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828[解析](1)由题意知,甲、乙两班均有学生50人,甲班优秀人数为30人,优秀率为3050=60%,乙班优秀人数为25人,优秀率为2550=50%,所以甲、乙两班的优秀率分别为60%和50%.(2)优秀人数非优秀人数合计甲班302050乙班252550合计5545100因为K2=100×30×25-20×25250×50×55×45=10099≈1.010,所以由参考数据知,没有95%的把握认为“加强‘语文阅读理解’训练对提高‘数学应用题’得分率”有帮助.1.下列说法:①将一组数据中的每个数据都加上或减去同一个常数后,方差恒不变;②设有一个回归方程为y^=3-5x,变量x增加一个单位时,y平均增加5个单位;③线性相关系数r和相关指数R2都是描述线性相关强度的量,r和R2越大,相关强度越强.④在一个2×2列联表中,计算得K2=13.079,则有99%的把握确认这两个变量间有关系.其中错误..的个数是()A.0B.1C.2D.3本题可以参考独立性检验临界值表:P(K2≥k0)0.500.400.250.150.10k00.4550.7081.3232.0722.706P(K2≥k0)0.050.0250.0100.0050.001k03.8415.0246.6357.87910.828[答案]C[解析]方差反映的是波动大小的量,故①正确;②中由于-50,故应是负相关,当x每增加1个单位时,y平均减少5个单位,∴②错误;相关系数r是描述线性相关强度的量,|r|越接近于1,相关性越强,在线性相关的两个变量的回归直线方程中,R2是描述回归效果的量,R2越大,模型的拟合效果越好,故③错误;④显然正确.2.(2011·辽宁文,14)调查了某地若干户家庭的年收入x(单位:万元)和年饮食支出y(单位:万元),调查显示年收入x与年饮食支出y具有线性相关关系,并由调查数据得到y对x的回归直线方程:y^=0.254x+0.321.由回归直线方程可知,家庭年收入每增加1万元,年饮食支出平均增加________万元.[答案]0.254[解析]由回归直线方程为y^=0.254x+0.321知收入每增加1万元,饮食支出平均增加0.254万元.3.(2011·辽宁文,19)某农场计划种植某种新作物,为此对这种作物的两个品种(分别称为品种甲和品种乙)进行田间试验.选取两大块地,每大块地分成n小块地,在总共2n小块地中,随机选n小块地种植品种甲,另外n小块地种植品种乙.(1)假设n=2,求第一大块地都种植品种甲的概率;(2)试验时每大块地分成8小块,即n=8,试验结束后得到品种甲和品种乙在各小块地的每公顷产量(单位:kg/hm2)如下表:品种甲403397390404388400412406品种乙419403412418408423400413分别求出品种甲和品种乙的每公顷产量的样本平均数和样本方差;根据试验结果,你认为应该种植哪一品种?附:样本数据x1,x2,…,xn的样本方差s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2],其中x为样本平均数.[解析](1)设第一大块地中的两小块地编号为1,2,第二大块地中的两小块地编号为3,4.令事件A=“第一大块地都种品种甲”.从4块小地中任选2小块地种植品种甲的基本事件共6个:(1,2),(1,3),(1,4),(2,3),(2,4),(3,4).而事件A包含1个基本事件:(1,2).所以P(A)=16.(2)品种甲的每公顷产量的样本平均数和样本方差分别为:x甲=18(403+397+390+404+388+400+412+406)=400s2甲=18(32+(-3)2+(-10)2+42+(-12)2+02+122+62)=57.25.品种乙的每公顷产量的样本平均数和样本方差分别为:x乙=18(419+403+412+418+408+423+400+413)=412.s2乙=18(72+(-9)2+02+62+(-4)2+112+(-12)2+12)=56.由以上结果可以看出,品种乙的样本平均数大于品种甲的样本平均数,且两品种的样本方差差异不大,故应该选择种植品种乙.4.(2011·福建普通高中质检)某中学将100名高一新生分成水平相同的甲、乙两个“平行班”,每班50人.陈老师采用A、B两种不同的教学方式分别在甲、乙两个班级进行教改实验.为了了解教学效果,期末考试后,陈老师分别从两个班级中各随机抽取20名学生的成绩进行统计,作出茎叶图如下.记成绩不低于90分者为“成绩优秀”.(1)在乙班样本中的20个个体中,从不低于86分的成绩中随机抽取2个,求抽出的两个均“成绩优秀”的概率;(2)由以上统计数据填写下面列联表,并判断是否有90%的把握认为:“成绩优秀”与教学方式有关.甲班(A方式)乙班(B方式)总计成绩优秀成绩不优秀总计附:K2=nad-bc2a+bc+da+cb+d(此公式也可写成χ2=nn11n22-n12n212n1+n2+n+1n+2P(K2≥k)0.250.150.100.050.025k1.3232.0722.7063.8415.024[解析](1)设“抽出的两个均‘成绩优秀’”为事件A.从不低于86分的成绩中随机抽取2个的基本事件为(86,93),(86,96),(86,97),(86,99),(86,99),(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共15个.而事件A包含基本事件:(93,96),(93,97),(93,99),(93,99),(96,97),(96,99),(96,99),(97,99),(97,99),(99,99),共10个.所以所求概率为P(A)=1015=23.(2)由已知数据得甲班(A方式)乙班(B方式)总计成绩优秀156成绩不优秀191534总计202040根据列联表中数据,K2=40×1×15