9.2.2总体百分位数的估计课标要求素养要求结合实例,能用样本估计百分位数,理解百分位数的统计含义.在学习和应用百分位数的过程中,要把实际问题转化为数学问题,并进行计算,对数据进行分析,发展学生的数学建模、数学运算素养和数据分析素养.教材知识探究某省数学考试结果揭晓,根据规定,0.8%的同学需要补考.问题那么如何确定需要补考的分数线呢?提示利用百分位数计算.1.第p百分位数的定义第50百分位数就是中位数,中位数是百分位数的特例,百分位数是中位数的推广p%一般地,一组数据的第p百分位数是这样一个值,它使得这组数据中至少有_______的数据小于或等于这个值,且至少有(100-p)%的数据大于或等于这个值.2.计算一组n个数据的第p百分位数的步骤第1步,按___________排列原始数据.第2步,计算i=n×p%.第3步,若i不是整数,而大于i的比邻整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的__________.从小到大平均数3.四分位数25%,50%,75%这三个分位数把一组由小到大排列后的数据分成四等份,因此称为四分位数,其中第25百分位数也称为第一四分位数或下四分位数,第75百分位数也称为第三四分位数或上四分位数.教材拓展补遗[微判断]1.若一组样本数据各不相等,则其75%分位数大于25%分位数.()2.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据大于23.()3.若一组样本数据的24%分位数是24,则在这组数据中至少有76%的数据大于或等于24.()提示2.若一组样本数据的10%分位数是23,则在这组数据中有10%的数据小于或等于23.√×√[微训练]1.下列一组数据的第25百分位数是()2.1,3.0,3.2,3.8,3.4,4.0,4.2,4.4,5.3,5.6A.3.2B.3.0C.4.4D.2.5解析把该组数据按照由小到大排列,可得:2.1,3.0,3.2,3.4,3.8,4.0,4.2,4.4,5.3,5.6,由i=10×25%=2.5,不是整数,则第3个数据3.2,是第25百分位数.答案A2.下列关于一组数据的第50百分位数的说法正确的是()A.第50百分位数就是中位数B.总体数据中的任意一个数小于它的可能性一定是50%C.它一定是这组数据中的一个数据D.它适用于总体是离散型的数据解析由百分位数的意义可知选项B,C,D错误.答案A[微思考]1.班级人数为50的班主任老师说“90%的同学能够考取本科院校”,这里的“90%”是百分位数吗?提示不是.是指能够考取本科院校的同学占同学总数的百分比.2.“这次数学测试成绩的第70百分位数是85分”这句话是什么意思?提示有70%的同学数学测试成绩小于或等于85分.题型一百分位数的计算【例1】从某珍珠公司生产的产品中,任意抽取12颗珍珠,得到它们的质量(单位:g)如下:7.9,9.0,8.9,8.6,8.4,8.5,8.5,8.5,9.9,7.8,8.3,8.0.(1)分别求出这组数据的第25,50,95百分位数;(2)请你找出珍珠质量较小的前15%的珍珠质量;(3)若用第25,50,95百分位数把公司生产的珍珠划分为次品、合格品、优等品和特优品,依照这个样本的数据,给出该公司珍珠等级的划分标准.解(1)将所有数据从小到大排列,得7.8,7.9,8.0,8.3,8.4,8.5,8.5,8.5,8.6,8.9,9.0,9.9,因为共有12个数据,所以12×25%=3,12×50%=6,12×95%=11.4,则第25百分位数是8.0+8.32=8.15,第50百分位数是8.5+8.52=8.5,第95百分位数是第12个数据为9.9.(2)因为共有12个数据,所以12×15%=1.8,则第15百分位数是第2个数据为7.9.即产品质量较小的前15%的产品有2个,它们的质量分别为7.8,7.9.(3)由(1)可知样本数据的第25百分位数是8.15g,第50百分位数为8.5g,第95百分位数是9.9g,所以质量小于或等于8.15g的珍珠为次品,质量大于8.15g且小于或等于8.5g的珍珠为合格品,质量大于8.5g且小于或等于9.9g的珍珠为优等品,质量大于9.9g的珍珠为特优品.规律方法计算一组n个数据的第p百分位数的一般步骤:(1)排列:按照从小到大排列原始数据;(2)算i:计算i=n×p%;(3)定数:若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.【训练1】如图所示是某市3月1日至3月10日的最低气温(单位:℃)的情况绘制的折线统计图,由图可知这10天最低气温的第80百分位数是()A.-2B.0C.1D.2答案D解析由折线图可知,这10天的最低气温按照从小到大的排列为:-3,-2,-1,-1,0,0,1,2,2,2,因为共有10个数据,所以10×80%=8,是整数,则这10天最低气温的第80百分位数是2+22=2.题型二百分位数的综合应用【探究1】第p百分位数有什么特点?提示总体数据中的任意一个数小于或等于它的可能性是p%.【探究2】某组数据的第p百分位数在此组数据中一定存在吗?为什么?提示不一定.因为按照计算第p百分位数的步骤,第2步计算所得的i=n×p%如果是整数,则第p百分位数为第i项与第(i+1)项数据的平均数,若第i项与第(i+1)项数据不相等,则第p百分位数在此组数据中就不存在.【探究3】某市为了鼓励居民节约用电,实行“阶梯式”电价,将该市每户居民的月用电量划分为三档,月用电量不超过200千瓦时的部分按0.5元/千瓦时收费,超过200千瓦时但不超过400千瓦时的部分按0.8元/千瓦时收费,超过400千瓦时的部分按1.0元/千瓦时收费.(1)求某户居民用电费用y(单位:元)关于月用电量x(单位:千瓦时)的函数解析式;(2)为了了解居民的用电情况,通过抽样获得了今年1月份100户居民每户的用电量,统计分析后得到如图所示的频率分布直方图.若这100户居民中,今年1月份用电费用低于260元的占80%,求a,b的值;(3)根据(2)中求得的数据计算用电量的75%分位数.解(1)当0≤x≤200时,y=0.5x;当200x≤400时,y=0.5×200+0.8×(x-200)=0.8x-60;当x400时,y=0.5×200+0.8×200+1.0×(x-400)=x-140.所以y与x之间的函数解析式为y=0.5x,0≤x≤200,0.8x-60,200x≤400,x-140,x400.(2)由(1)可知,当y=260时,x=400,即用电量低于400千瓦时的占80%,结合频率分布直方图可知0.001×100+2×100b+0.003×100=0.8,100a+0.0005×100=0.2,解得a=0.0015,b=0.0020.(3)设75%分位数为m,因为用电量低于300千瓦时的所占比例为(0.001+0.002+0.003)×100=60%,用电量低于400千瓦时的占80%,所以75%分位数m在[300,400)内,所以0.6+(m-300)×0.002=0.75,解得m=375(千瓦时),即用电量的75%分位数为375千瓦时.规律方法由频率分布直方图求百分位数的方法(1)要注意频率分布直方图中小矩形的面积,就是数据落在该组的频率.(2)一般采用方程的思想,设出第p百分位数,根据其意义列出方程并求解即可.【训练2】某市为了了解人们对“中国梦”的伟大构想的认知程度,对不同年龄和不同职业的人举办了一次“一带一路”知识竞赛,满分100分(90分及以上为认知程度高),现从参赛者中抽取了x人,按年龄分成5组(第一组:[20,25),第二组:[25,30),第三组:[30,35),第四组:[35,40),第五组:[40,45]),得到如图所示的频率分布直方图,已知第一组有5人.(1)求x;(2)求抽取的x人的年龄的50%分位数(结果保留整数);(3)以下是参赛的10人的成绩:90,96,97,95,92,92,98,88,96,99,求这10人成绩的20%分位数和平均数,以这两个数据为依据,评价参赛人员对“一带一路”的认知程度,并谈谈你的感想.解(1)第一组频率为0.01×5=0.05,所以x=50.05=100.(2)由图可知年龄低于30岁的所占比例为40%,年龄低于35岁的所占比例为70%,所以抽取的x人的年龄的50%分位数在[30,35)内,由30+5×0.50-0.400.70-0.40=953≈32,所以抽取的x人的年龄的50%分位数为32.(3)把参赛的10人的成绩按从小到大的顺序排列:88,90,92,92,95,96,96,97,98,99,计算10×20%=2,所以这10人成绩的20%分位数为90+922=91,这10人成绩的平均数为110(88+90+92+92+95+96+96+97+98+99)=94.3.评价:从第20百分位数和平均数来看,参赛人员的认知程度很高.感想:结合本题和实际,符合社会主义核心价值观即可.一、素养落地1.通过学习和应用百分位数,重点培养数据分析素养、数学运算和数学建模素养.2.求一组数据的百分位数时,掌握其步骤:①按照从小到大排列原始数据;②计算i=n×p%;③若i不是整数,大于i的最小整数为j,则第p百分位数为第j项数据;若i是整数,则第p百分位数为第i项与第(i+1)项数据的平均数.二、素养训练1.已知100个数据的第75百分位数是9.3,则下列说法正确的是()A.这100个数据中一定有75个数小于或等于9.3B.把这100个数据从小到大排列后,9.3是第75个数据C.把这100个数据从小到大排列后,9.3是第75个数据和第76个数据的平均数D.把这100个数据从小到大排列后,9.3是第75个数据和第74个数据的平均数解析因为100×75%=75为整数,所以第75个数据和第76个数据的平均数为第75百分位数,是9.3,选C.答案C2.数据7.0,8.4,8.4,8.4,8.6,8.7,9.0,9.1的第30百分位数是________.解析因为8×30%=2.4,故30%分位数是第三项数据8.4.答案8.43.一组样本数据的频率分布直方图如图所示,试估计此样本数据的第50百分位数为________.解析样本数据低于10的比例为(0.08+0.02)×4=0.40,样本数据低于14的比例为0.40+0.09×4=0.76,所以此样本数据的第50百分位数在[10,14)内,估计此样本数据的第50百分位数为10+0.10.36×4=1009.答案10094.求下列数据的四分位数.13,15,12,27,22,24,28,30,31,18,19,20,解把12个数据按从小到大的顺序排列可得:12,13,15,18,19,20,22,24,27,28,30,31,计算12×25%=3,12×50%=6,12×75%=9,所以数据的第25百分位数为15+182=16.5,第50百分位数为20+222=21,第75百分位数为27+282=27.5.