第2节 用样本估计总体

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第2节用样本估计总体考试要求1.会用统计图表对总体进行估计,会求n个数据的第p百分位数.2.会用数字特征估计总体集中趋势和总体离散程度.1.总体百分位数的估计(1)第p百分位数的定义一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有p%的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.(2)计算一组n个数据的第p百分位数的步骤第1步,按从小到大排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.2.样本的数字特征(1)众数:一组数据中出现次数最多的那个数据,叫做这组数据的众数.(2)中位数:把n个数据按大小顺序排列,处于最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数.(3)平均数:把a1+a2+…+ann称为a1,a2,…,an这n个数的平均数.(4)标准差与方差:设一组数据x1,x2,x3,…,xn的平均数为x-,则这组数据的标准差和方差分别是s=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2],s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2].1.频率分布直方图与众数、中位数、平均数的关系(1)最高的小长方形底边中点的横坐标即是众数.(2)中位数左边和右边的小长方形的面积和是相等的.(3)平均数是频率分布直方图的“重心”,等于频率分布直方图中每个小长方形的面积乘以小长方形底边中点的横坐标之和.2.平均数、方差的公式推广(1)若数据x1,x2,…,xn的平均数为x-,那么mx1+a,mx2+a,mx3+a,…,mxn+a的平均数是mx-+a.(2)若数据x1,x2,…,xn的方差为s2,那么①数据x1+a,x2+a,…,xn+a的方差也为s2;②数据ax1,ax2,…,axn的方差为a2s2.1.思考辨析(在括号内打“√”或“×”)(1)对一组数据来说,平均数和中位数总是非常接近.()(2)在频率分布直方图中,最高的小长方形底边中点的横坐标是众数.()(3)方差与标准差具有相同的单位.()(4)如果一组数中每个数减去同一个非零常数,则这组数的平均数改变,方差不变.()答案(1)×(2)√(3)×(4)√解析(1)平均数指的是这组数据的平均水平;中位数指的是这组数据的中间水平,它们之间没有必然联系,故该说法错误.(3)方差是标准差的平方,故它们单位不一样.2.下列一组数据的第25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A.3.2B.3.0C.4.4D.2.5答案A解析把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=10×25%=2.5,不是整数,则第3个数据3.2是第25百分位数.3.(2020·全国Ⅲ卷)设一组样本数据x1,x2,…,xn的方差为0.01,则数据10x1,10x2,…,10xn的方差为()A.0.01B.0.1C.1D.10答案C解析10x1,10x2,…,10xn的方差为102×0.01=1.4.(多选)(2021·新高考Ⅰ卷)有一组样本数据x1,x2,…,xn,由这组数据得到新样本数据y1,y2,…,yn,其中yi=xi+c(i=1,2,…,n),c为非零常数,则()A.两组样本数据的样本平均数相同B.两组样本数据的样本中位数相同C.两组样本数据的样本标准差相同D.两组样本数据的样本极差相同答案CD解析设样本数据x1,x2,…,xn的平均数、中位数、标准差、极差分别为x-,m,σ,t,依题意得,新样本数据y1,y2,…,yn的平均数、中位数、标准差、极差分别为x-+c,m+c,σ,t,因为c≠0,所以A,B不正确,C,D正确.5.(易错题)一组数据的平均数是28,方差是4,若将这组数据的每一个数据都加上20,得到一组新数据,则所得新数据的平均数是________,方差是________.答案484解析设该组数据为x1,x2,…,xn,则新数据为x1+20,x2+20,…,xn+20,记新数据的平均数为x-′,因为x-=x1+x2+…+xnn=28,所以x-′=x1+20+x2+20+…+xn+20n=20+28=48.因为s2=1n[(x1-x-)2+(x2-x-)2+…+(xn-x-)2]=4,所以s′2=1n{[x1+20-(x-+20)]2+[x2+20-(x-+20)]2+…+[xn+20-(x-+20)]2}=s2=4.6.(2022·苏州模拟)由于受到网络电商的冲击,某品牌的洗衣机在线下的销售受到影响,承受了一定的经济损失,现将A地区200家实体店该品牌洗衣机的月经济损失统计如图所示,估算月经济损失的平均数为m,中位数为n,则m-n=________.答案360解析第一块小矩形的面积S1=0.3,第二块小矩形的面积S2=0.4,故n=2000+0.5-0.30.0002=3000;又第四、五块小矩形的面积均为S=0.06,故a=12000[1-(0.3+0.4+0.06×2)]=0.00009,所以m=1000×0.3+3000×0.4+5000×0.18+(7000+9000)×0.06=3360,故m-n=360.考点一百分位数的估计1.如图所示是某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是()A.-2B.0C.1D.2答案D解析由折线图可知,这10天的最低气温按照从小到大的排列为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是2+22=2.2.一个容量为20的样本,其数据按从小到大的顺序排列为:1,2,2,3,5,6,6,7,8,8,9,10,13,13,14,15,17,17,18,18,则该组数据的第75百分位数为________,第86百分位数为________.答案14.517解析∵75%×20=15,∴第75百分位数为14+152=14.5.∵86%×20=17.2,∴第86百分位数为第18个数据17.3.将高三某班60名学生参加某次数学模拟考试所得的成绩(成绩均为整数)整理后画出频率分布直方图如图,则此班的模拟考试成绩的80%分位数是________.(结果保留两位小数)答案124.44解析由频率分布直方图可知,分数在120分以下的学生所占的比例为(0.01+0.015+0.015+0.03)×10×100%=70%,分数在130分以下的学生所占的比例为(0.01+0.015+0.015+0.03+0.0225)×10×100%=92.5%,因此,80%分位数一定位于[120,130)内.因为120+0.80-0.700.925-0.70×10≈124.44,所以此班的模拟考试成绩的80%分位数约为124.44.感悟提升计算一组数据的第p百分位数的步骤考点二总体集中趋势的估计角度1样本的数字特征例1某工厂甲、乙两名工人参加操作技能培训.现分别从他们在培训期间参加的若干次测试成绩中随机抽取8次,数据如下(单位:分):甲9582888193798478乙8375808090859295(1)请你计算这两组数据的平均数、中位数;(2)现要从中选派一人参加操作技能比赛,从统计学的角度考虑,你认为选派哪名工人参加合适?请说明理由.解(1)x-甲=18×(95+82+88+81+93+79+84+78)=85(分),x-乙=18×(83+75+80+80+90+85+92+95)=85(分).甲、乙两组数据的中位数分别为83分,84分.(2)由(1)知x-甲=x-乙=85分,所以s2甲=18[(95-85)2+(82-85)2+…+(78-85)2]=35.5,s2乙=18[(83-85)2+(75-85)2+…+(95-85)2]=41.①从平均数看,甲、乙均为85分,平均水平相同;②从中位数看,乙的中位数大于甲的中位数,乙的成绩好于甲;③从方差来看,因为x-甲=x-乙,s2甲<s2乙,所以甲的成绩较稳定;④从数据来看,获得85分以上(含85分)的次数,甲有3次,而乙有4次,故乙的成绩好些;⑤从数据的变化趋势看,乙后几次的成绩均高于甲,且呈上升趋势,因此乙更具潜力.综上分析可知,甲的成绩虽然比乙稳定,但从中位数、获得好成绩的次数及发展势头等方面分析,乙具有明显优势,所以应派乙参赛更有望取得好成绩.角度2频率分布直方图中的数字特征例2某市市民用水拟实行阶梯水价,每人月用水量中不超过w立方米的部分按4元/立方米收费,超出w立方米的部分按10元/立方米收费,从该市随机调查了10000位居民,获得了他们某月的用水量数据,整理得到如下频率分布直方图:(1)如果w为整数,那么根据此次调查,为使80%以上居民在该月的用水价格为4元/立方米,w至少定为多少?(2)假设同组中的每个数据用该组区间的右端点值代替,当w=3时,估计该市居民该月的人均水费.解(1)如题图所示,用水量在[0.5,2)的频率的和为(0.2+0.3+0.4)×0.5=0.45,用水量在[0.5,3)的频率的和为(0.2+0.3+0.4+0.5+0.3)×0.5=0.85.∴用水量小于等于2立方米的频率为0.45,用水量小于等于3立方米的频率为0.85,又w为整数,∴为使80%以上的居民在该月的用水价格为4元/立方米,w至少定为3.(2)当w=3时,该市居民该月的人均水费估计为(0.1×1+0.15×1.5+0.2×2+0.25×2.5+0.15×3)×4+0.15×3×4+[0.05×(3.5-3)+0.05×(4-3)+0.05×(4.5-3)]×10=7.2+1.8+1.5=10.5(元).即当w=3时,该市居民该月的人均水费估计为10.5元.感悟提升(1)众数、中位数、平均数的应用要点中位数、众数分别反映了一组数据的“中等水平”“多数水平”,平均数反映了数据的平均水平,我们需根据实际需要选择使用.(2)频率分布直方图的数字特征①众数:众数一般用频率分布表中频率最高的一组的组中值来表示,即在样本数据的频率分布直方图中,最高小长方形的底边中点的横坐标;②中位数:在频率分布直方图中,中位数左边和右边的直方图的面积应该相等;③平均数:平均数在频率分布表中等于组中值与对应频率之积的和.训练1(1)(2022·成都质检)有两位射击运动员在一次射击测试中各射靶7次,每次命中的环数如下:甲:78109886乙:91078778则下列判断正确的是()A.甲射击的平均成绩比乙好B.乙射击的平均成绩比甲好C.甲射击的成绩的众数小于乙射击的成绩的众数D.甲射击的成绩的中位数等于乙射击的成绩的中位数答案D解析由题意得,甲射击的平均成绩为x-甲=7+8+10+9+8+8+67=8,众数为8,中位数为8;乙射击的平均成绩为x-乙=9+10+7+8+7+7+87=8,众数为7,中位数为8;故甲射击的平均成绩等于乙射击的平均成绩,甲射击的成绩的众数大于乙射击的成绩的众数,甲射击的成绩的中位数等于乙射击的成绩的中位数.(2)(多选)(2022·长沙模拟)某校高二年级共有800名学生参加了数学测验(满分150分),已知这800名学生的数学成绩均不低于90分,将这800名学生的数学成绩分组为:[90,100),[100,110),[110,120),[120,130),[130,140),[140,150),得到的频率分布直方图如图所示,则下列说法中正确的是()A.a=0.045B.这800名学生中数学成绩在110分以下的人数为160C.这800名学生数学成绩的中位数约为121.4D.这800名学生数学成绩的平均数为125答案BC解析由题意,(0.005+0.01+0.01+0.015+0.025+a)×10=1,解得a=0.035,A错误;110分以下

1 / 18
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功