第10章第3节一、选择题1.(文)(2010·重庆文,5)某单位有职工750人,其中青年职工350人,中年职工250人,老年职工150人,为了了解该单位职工的健康情况,用分层抽样的方法从中抽取样本,若样本中的青年职工为7人,则样本容量为()A.7B.15C.25D.35[答案]B[解析]抽取比例为=,因为青年职工抽取7人,所以中年职工抽取5人,老年职工抽取3人,所以样本容量为7+5+3=15人,故选B.(理)设某项试验的成功率是失败率的2倍,用随机变量ξ去描述1次试验的成功次数,则P(ξ=0)和D(ξ)的值依次为()A.1,6B.12,12C.13,29D.14,516[答案]C[解析]由题意,设ξ的分布列为ξ01Pp2p即“ξ=0”表示试验失败,“ξ=1”表示试验成功,由p+2p=1,得p=13,∴P(ξ=0)=13,又E(ξ)=0×13+1×23=23,∴D(ξ)=0-232×13+1-232×23=29,故选C.2.(2010·安徽江南十校联考)最小二乘法的原理是()A.使得i=1n[yi-(a+bxi)]最小B.使得i=1n[yi-(a+bxi)2]最小C.使得i=1n[yi2-(a+bxi)2]最小D.使得i=1n[yi-(a+bxi)]2最小[答案]D[解析]根据回归方程表示到各点距离最小的直线方程,即总体偏差最小,亦即i=1n[yi-(a+bxi)]2最小.3.(2010·银川模拟)下列四个命题正确的是()①线性相关系数r越大,两个变量的线性相关性越强,反之,线性相关性越弱;②残差平方和越小的模型,拟合的效果越好;③用相关指数R2来刻画回归效果,R2越小,说明模型的拟合效果越好;④随机误差e是衡量预报精确度的一个量,它满足E(e)=0.A.①③B.②④C.①④D.②③[答案]B[解析]线性相关系数r满足|r|≤1,并且|r|越接近1,线性相关程度越强;|r|越接近0,线性相关程度越弱,故①错误;相关指数是度量模型拟合效果的一种指标.相关指数R2越接近于1,模型的拟合效果越好,R2越大,残差平方和就越小,故残差平方和越小的模型,拟合效果越好,故②对③错.故选B.4.若两个分类变量x、y的列联表为y1y2x11530x24540则变量y与x有关系的可能性为()A.99%以上B.95%以上C.99.5%以上D.95%以下[答案]B[解析]n=15+45+30+40=130,∴χ2=130×15×40-45×30260×70×45×85≈4.553.841,∴有95%以上的把握认为y与x有关系,故选B.5.(2010·北京延庆县模考)在学校开展的综合实践活动中,某班进行了小制作评比,作品上交时间为5月1日至30日,评委会把同学们上交作品的件数按5天一组分组统计,绘制了频率分布直方图(如图所示),已知从左到右各长方形高的比为,第三组的频数为12,则本次活动参加评比作品总数、上交作品数量最多的组的作品件数依次为()A.60、18B.60、20C.80、18D.80、30[答案]A6.(文)已知回归直线的斜率的估计值是1.23,样本点的中心为(4,5),则回归直线的方程是()A.y^=1.23x+4B.y^=1.23x+0.08C.y^=1.23x+0.8D.y^=1.23x-0.08[答案]B[解析]由条件知,x-=4,y-=5,设回归直线方程为y^=1.23x+a,则a=y--1.23x-=0.08.(理)(2010·延边州质检)两个相关变量满足如下关系:x1015202530y10031005101010111014则两变量的回归方程为()A.y^=0.56x+997.4B.y^=0.63x-231.2C.y^=0.56x+501.4D.y^=60.4x+400.7[答案]A[解析]x-=20,y-=1008.6,代入公式b^=i=15xi-x-yi-y-i=15xi-x-2,及a^=y--b^x-中可得:b^=0.56,a^=997.4,故选A.7.(2010·山东省实验中学)设有n个样本x1,x2,…,xn,其标准差是Sx,另有n个样本y1,y2,…,yn,且yk=3xk+5,(k=1,2,…,n),其标准差为Sy,则下列关系正确的是()A.Sy=3Sx+5B.Sy=3SxC.Sy=3SxD.Sy=3Sx+5[答案]B[解析]Sy2=32Sx2,∴Sy=3Sx.[点评]一般的数据x1,x2,…,xn的平均数为x-,方差为S2,则kx1+b,kx2+b,…,kxn+b的平均数为kx-+b,方差为k2S2.8.(2010·福州市质检)在某种新型材料的研制中,实验人员获得了下列一组实验数据:x1.99345.16.12y1.54.047.51218.01现准备用下列四个函数中的一个近似地表示这些数据的规律,其中最接近的一个是()A.y=2x-2B.y=12(x2-1)C.y=log3xD.y=2x-2[答案]B[解析]把表格中的数据代入选择项的解析式中,易得所求的最接近的一个函数是y=12(x2-1).9.(文)(2010·厦门三中阶段训练)某校举行演讲比赛,9位评委给选手A打出的分数如茎叶图所示,统计员在去掉一个最高分和一个最低分后,算得平均分为91,复核员在复核时,发现有一个数字(茎叶图中的x)无法看清,若统计员计算无误,则数字x应该是()A.5B.4C.3D.2[答案]D[解析]去掉最低分87,去掉最高分94(假设x≤4),则7×91=80×2+9+8+90×5+2+3+2+1+x,∴x=2,符合题意,故选D.(理)(2010·福建省龙岩市质检)一位同学种了甲、乙两种树苗各1株,分别观察了9次、10次后,得到树苗高度的数据的茎叶图如图(单位:厘米),则甲、乙两种树苗高度数据的中位数之和是()A.44B.54C.50D.52[答案]D[解析]根据茎叶图可得,观察甲树苗9次得到的树苗高度分别为:19,20,21,23,24,37,33,32,31;观察乙树苗10次得到的树苗高度分别为:10,14,10,26,24,30,44,46,46,47,易得甲树苗高度的中位数为24,乙树苗高度的中位数为26+302=28,因此24+28=52.[点评]在茎叶图中找中位数时,n为奇数,前后各去掉n-12个,剩下一个即是;n为偶数,前后各去掉n-22个,剩下两个的平均数即是,用这种方法找中位数,必须注意,茎叶图中数据是按规则从小到大排列的,否则去掉两端数字时,大的从大到小找,小的从小到大找.10.(09·上海)在发生某公共卫生事件期间,有专业机构认为该事件在一段时间没有发生大规模群体感染的标志为“连续10天,每天新增疑似病例不超过7人”.根据过去10天甲、乙、丙、丁四地新增疑似病例数据,一定符合该标志的是()A.甲地:总体均值为3,中位数为4B.乙地:总体均值为1,总体方差大于0C.丙地:中位数为2,众数为3D.丁地:总体均值为2,总体方差为3[答案]D[解析]逐项验证,由0,0,0,2,4,4,4,4,4,8可知,A错;由0,0,0,0,0,0,0,0,2,8可知,B错;由0,0,1,1,2,2,3,3,3,8可知,C错.故选D.[点评]x-=2时,x1-22+x2-22+…+x10-2210=3.即(x1-2)2+(x2-2)2+…+(x10-2)2=30.显然(xi-2)2≤30(i=1,2,…,10),∵xi∈N*,即xi≤7.二、填空题11.(2010·广东文)某市居民2005~2009年家庭年平均收入x(单位:万元)与年平均支出Y(单位:万元)的统计资料如下表所示:年份20052006200720082009收入x11.512.11313.315支出Y6.88.89.81012根据统计资料,居民家庭平均收入的中位数是________,家庭年平均收入与年平均支出有________线性相关关系.[答案]13正[解析]找中位数时,将样本数据按大小顺序排列后奇数个时中间一个是中位数,而偶数个时须取中间两数的平均数,由统计资料可以看出,中位数为13万元,且年平均收入增多时,年平均支出也增多,因此两者正相关.12.观察两相关变量得到如下数据:则两变量的回归直线方程为________.[答案]y^=0.179+0.905x[解析]x-=4.5,y-=4.25,i=18xi2=204,i=18xiyi=191,b^=i=18xiyi-8x-y-i=18xi2-8x-2=191-8×4.5×4.25204-8×4.52≈0.905,a^=y--b^x-=4.25-0.905×4.5≈0.179,∴所求回归直线方程为y^=0.179+0.905x.13.(2010·湖南考试院调研)在某赛季篮球比赛中,甲、乙两名运动员每场比赛的得分统计茎叶图如图所示,则发挥较稳定的运动员是________.[答案]甲14.(2010·辽宁省实验中学模拟)某研究小组为了研究中学生的身体发育情况,在某学校随机抽出20名15至16周岁的男生,将他们的身高和体重制成2×2列联表,根据列联表的数据,可以有________%的把握认为该学校15至16周岁的男生的身高和体重之间有关系.超重不超重合计偏高415不偏高31215合计71320独立性检验临界值表P(χ2≥k0)0.0250.0100.0050.001k05.0246.6357.87910.828独立性检验随机变量χ2值的计算公式:χ2=nad-bc2a+bc+da+cb+d.[答案]97.5三、解答题15.(2010·广东文,17)某电视台在一次对收看文艺节目和新闻节目观众的抽样调查中,随机抽取了100名电视观众,相关的数据如下表所示:文艺节目新闻节目总计20至40岁401858大于40岁152742总计5545100(1)由表中数据直观分析,收看新闻节目的观众是否与年龄有关?(2)用分层抽样方法在收看新闻节目的观众中随机抽取5名,大于40岁的观众应该抽取几名?(3)在上述抽取的5名观众中任取2名,求恰有1名观众的年龄为20至40岁的概率.[解析](1)由于大于40岁的42人中有27人收看新闻节目,而20至40岁的58人中,只有18人收看新闻节目,故收看新闻节目的观众与年龄有关.(2)27×545=3,∴大于40岁的观众应抽取3名.(3)由题意知,设抽取的5名观众中,年龄在20岁至40岁的为a1,a2,大于40岁的为b1,b2,b3,从中随机取2名,基本事件有:(a1,a2),(a1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3),(b1,b2),(b1,b3),(b2,b3)共十个,设恰有一名观众年龄在20至40岁为事件A,则A中含有基本事件6个:(a1,b1),(a1,b2),(a1,b3),(a2,b1),(a2,b2),(a2,b3),∴P(A)=610=35.16.(文)(2010·新课标全国理,19)为调查某地区老年人是否需要志愿者提供帮助,用简单随机抽样方法从该地区调查了500位老年人,结果如下:性别是否需要志愿者男女需要4030不需要160270(1)估计该地区老年人中,需要志愿者提供帮助的老年人的比例;(2)能否有99%的把握认为该地区的老年人是否需要志愿者提供帮助与性别有关?(3)根据(2)的结论,能否提出更好的调查方法来估计该地区的老年人中,需要志愿者提供帮助的老年人的比例?说明理由.附:χ2=nad-bc2a+bc+da+cb+d[解析](1)调查的500位老年人中有70位需要志愿者提供帮助,因此该地区老年人中,需要帮助的老年人的比例的估计值为70500=14%.(2)χ2=500×40×270-30×1602200×300×70×430≈9.967.由于9.9676.635,所以有99%的把握认为该地区的老年人是否需要帮助与性别有关.(3)由(2)的结论知,该地区老年人是否需要帮助与性别有关,并且从样本数据能看出该地区