第一节统计知识点一:数据收集、整理1.数据收集数据收集常用方法全面调查:所要考察对象的全体叫做总体.抽样调查:采用调查部分对象的方式来收集数据根据部分来估计整体的情况,叫做抽样调查.优点是调查范围小,节省时间,人力,物力和财力,但其调查结果往往不如普查得到的结果准确。为了获得较为准确的调查结果,抽样时要主要样本的代表性和广泛性。收集数据时常见的统计量(1)总体:要考察的全体对象;(2)个体:组成总体的每一个考察对象;(3)样本:被抽查的那些个体组成一个样本;(4)样本容量:样本中个体的数目.变式练习:为了了解某校3800名学生视力情况,从中测试了400名学生视力进行分析,在这个问题中,总体是某校3800名学生视力情况,样本容量是400.知识点二:反映数据集中程度的量1.平均数一般地,如果有n个数,,,,21nxxx那么,)(121nxxxnx叫做这n个数的平均数,x读作“x拔”。2.加权平均数如果n个数中,1x出现1f次,2x出现2f次,…,kx出现kf次(这里nfffk21),那么,根据平均数的定义,这n个数的平均数可以表示为nfxfxfxxkk2211,这样求得的平均数x叫做加权平均数,其中kfff,,,21叫做权。变式练习1:某商品共10件,第一天以25元/件卖出2件,第二天以20元/件卖出3件,第三天以18元/件卖出5件,则这种商品的平均售价为20元/件.变式练习2:某公司内设四个部门,2015年各部门人数及相应的每人所创年利润如表所示,求该公司2015年平均每人所创年利润.注意:计算平均数时注意分辨是算术平均数还是加权平均数,两者计算方法有差异,不能混淆.部门人数每人所创年利润/万元A136B627C816D1120解:该公司2015年平均每人所创年利润为36×1+27×6+16×8+20×111+6+8+11=21,答:该公司2015年平均每人所创年利润为21万元3.中位数一组数据按从小到大(或从大到小)的顺序排列,(1)如果数据的个数是奇数,则称处于中间位置的数为这组数据的中位数;(2)如果数据的个数是偶数,则称中间两个数据的平均数为这组数据的中位数.(3)如果在一组互不相等的数据中,小于和大于这个中位数的数据各占一半。变式练习:某公司的拓展部有五个员工,他们每月的工资分别是3000元,4000元,5000元,7000元和10000元,那么他们工资的中位数是()A.4000元B.5000元C.7000元D.10000元【解析】B将5个工资数由小到大排列,位于最中间,即第3个数是5000元,故中位数为5000元.4.众数一组数据中出现次数最多的数据.一组数据的众数可能有多个,也可能没有.(1)众数是一组数据的峰值,它是一种位置代表值,不易受极端值的影响,其缺点是具有不唯一性。(2)众数是一组数据中出现次数最多的数据,是一组数据中的原数据,而不是相应的次数.(3)一组数据中的众数有时不只一个,如数据2、3、-1、2、1、3中,2和3都出现了2次,它们都是这组数据的众数。变式练习1:一组数据:1,2,1,0,2,a,若它们的众数为1,则这组数据的中位数为1.变式练习2:数据8、8、6、5、6、1、6的众数是()A.1B.5C.6D.8【解析】C6在这组数里出现了3次,次数最多,是众数.变式练习3:在以下数据75,80,80,85,90中,众数、中位数分别为()A.75,80B.80,80C.80,85D.80,90【解析】80出现两次,次数最多,于是众数为80,按由小到大排序后,最中间的数是80,于是这一组数的中位数为80,故选B.5.比较平均数、中位数、众数的优劣:平均数:所有数据参加运算,能充分利用数据所提供的信息,因此在现实生活中常用,但容易受极端值影响;中位数:计算简单,受极端值影响少,但不能充分利用所有数据的信息;众数:各个数据如果重复次数大致相等时,众数往往没有特别的意义。变式练习:甲、乙两名队员参加射击训练,成绩分别被制成下列两个统计图:根据以上信息,整理分析数据如下:平均成绩/环中位数/环众数/环方差甲a771.2乙7b8c(1)写出表格中a,b,c的值;(2)分别运用表中的四个统计量,简要分析这两名队员的射击训练成绩.若选派其中一名参赛,你认为应选哪名队员?解:(1)甲的平均成绩a=5×1+6×2+7×4+8×2+9×11+2+4+2+1=7(环),∵乙射击的成绩从小到大从新排列为:3,4,6,7,7,8,8,8,9,10,∴乙射击成绩的中位数b=7+82=7.5(环),其方差c=110×[(3-7)2+(4-7)2+(6-7)2+2×(7-7)2+3×(8-7)2+(9-7)2+(10-7)2]=110×(16+9+1+3+4+9)=4.2(2)从平均成绩看甲、乙二人的成绩相等均为7环,从中位数看甲射中7环以上的次数小于乙,从众数看甲射中7环的次数最多而乙射中8环的次数最多,从方差看甲的成绩比乙的成绩稳定;综合以上各因素,若选派一名学生参加比赛的话,可选择乙参赛,因为乙获得高分的可能更大知识点三:反映数据离散程度的量1、方差的概念方差公式在一组数据,,,,21nxxx中,各数据与它们的平均数x的差的平方的平均数,叫做这组数据的方差。通常用“2s”表示,即])()()[(1222212xxxxxxnsn公式:设x1,x2,…,xn的平均数为x,则这n个数据的方差为s2=1n[(x1-x)2+(x2-x)2+…+(xn-x)2].方差意义方差越大,数据的波动越大;方差越小,数据的波动越小,越稳定.变式练习:一组数据2,4,a,7,7的平均数x=5,则方差s2=__3.6__.2.极差:一组数据中的最大数据与最小数据的差。极差=最大值-最小值.极差能够反映数据的变化范围.极差是最简单的一种度量数据波动情况的量,但它受极端值的影响较大.知识点四:数据的整理和描述1、频率分布的意义在许多问题中,只知道平均数和方差还不够,还需要知道样本中数据在各个小范围所占的比例的大小,这就需要研究如何对一组数据进行整理,以便得到它的频率分布。2、研究频率分布的一般步骤及有关概念(1)研究样本的频率分布的一般步骤是:①计算极差(最大值与最小值的差)②决定组距与组数③决定分点④列频率分布表⑤画频率分布直方图(2)频率分布的有关概念①极差:最大值与最小值的差②频数:落在各个小组内的数据的个数注意:(1)方差反映一组数据的波动程度,若该组每个数据变化相同,则方差不变.若数据a1,a2,……an的方差是s,则数据a1+b,a2+b,……an+b的方差仍然是s,数据ka1+b,ka2+b,……kan+b的方差是k2s(2)用来衡量一批数据的波动大小(即这批数据偏离平均数的大小).在样本容量相同的情况下,方差越大,说明数据的波动越大,越不稳定.方差主要应用在平均数相等或接近时。③频率:每一小组的频数与数据总数(样本容量n)的比值叫做这一小组的频率。.变式练习:某校对1200名学生的身高进行了测量,身高在1.58~1.63(单位:m)这一个小组的频率为0.25,则该组的人数是300.3.统计图(1)条形统计图能够显示每组中的具体数据.(2)扇形统计图能够显示部分在总体中的百分比.(3)折线统计图能够显示数据的变化趋势.(4)频数分布直方图能够显示数据的分布情况.变式练习:空气中由多种气体混合而成,为了简明扼要地介绍空气的组成情况,较好地描述空气中各种成分所占的百分比,最适合采用的统计图是扇形统计图4.画频数分布直方图的步骤(1)计算最大值与最小值的差;(2)决定组距与组数;(3)决定分点;(3)列频数分布表;(4)画频数分布直方图.变式练习1:一组数据的最大值与最小值的差是23,若组距为3,则在画频数分布直方图时应分为8组.变式练习2:某学校准备开展“阳光体育活动”,决定开设以下体育活动项目:足球、乒乓球、篮球和羽毛球,要求每位学生必须且只能选择一项.为了解选择各种体育活动项目的学生人数,随机抽取了部分学生进行调查,并将通过调查获得的数据进行整理,绘制出以下两幅不完整的统计图.请根据统计图回答问题:第2题图(1)这次活动一共调查了________名学生;(2)补全条形统计图;(3)在扇形统计图中,选择篮球项目的人数所在扇形的圆心角等于______度;(4)若该学校有1500人,请你估计该学校选择足球项目的学生人数约是________人.解:(1)250;【解法提示】用选择“足球”项目的人数除以它占抽查总数的百分比,便可得这次活动一共调查的学生数,即80÷32%=250(名).(2)补全条形统计图如解图所示:第2题解图【解法提示】选择“篮球”项目的人数为:250-80-40-55=75(人).(3)108;【解法提示】用选择篮球项目的人数除以总人数再乘以360°就可以得到选择篮球项目的人数所占扇形圆心角的度数:75250×360°=108°.(4)480.【解法提示】用总人数乘以选择足球项目的人数所占的百分比就可得到该学校选择足球项目的学生人数:1500×32%=480(人).变式练习3:某校教导处为了解该校七年级同学对排球、乒乓球、羽毛球、篮球和足球五种球类运动项目的喜爱情况(每位同学必须且只能选择最喜爱的一项运动项目),进行了随机抽样调查,并将调查结果统计后绘制成了如表和图所示的不完整统计图表.样本人数分布表类别人数百分比排球36%乒乓球1428%羽毛球15篮球20%(1)请你补全样本人数分布表和条形统计图;(2)若七年级学生总人数为920人,请你估计七年级学生喜爱羽毛球运动项目的人数.解:(1)补全样本人数分布表如下所示,补全条形统计图如解图所示;样本人数分布表【解法提示】样本容量=喜欢排球人数喜欢排球的百分比=36%=50(人);喜欢羽毛球百分比=喜欢羽毛球人数样本容量=1550=30%;喜欢篮球人数=样本容量×喜欢篮球的百分比=50×20%=10(人).(2)所抽取50人中,喜爱羽毛球运动的同学占30%,用样本频率估算总体频率可知,920人中喜爱羽毛球运动的约占30%,∴920×30%=276(人).答:七年级学生喜爱羽毛球运动项目的人数大约有276人.变式练习4:李老师为了解班里学生的作息时间,调查了班上50名学生上学路上花费的时间,他发现学生所花时间都少于50分钟,然后将调查数据整理,作出如下频数分布直方图的一部分(每组数据含最小值不含最大值).请根据该频数足球816%合计100%类别人数百分比排球36%乒乓球1428%羽毛球1530%篮球1020%足球816%合计50100%分布直方图,回答下列问题:(1)此次调查的总体是什么?(2)补全频数分布直方图;(3)该班学生上学路上花费时间在30分钟以上(含30分钟)的人数占全班人数的百分比是多少?解:(1)此次调查的总体是班上50名学生上学路上花费的时间;(2)补全频数分布直方图如解图所示:第4题解图【解法提示】路上时间花费在30~40分钟(不含40分钟)的人数为:50-8-24-13-1=4(人).(3)路上花费时间在30分钟以上(含30分钟)的人数占全班人数的百分比是4+150×100%=10%.变式练习5:为了解中学生最喜欢做哪种类型的英语客观题,某市抽取部分中学生对英语客观题的“听力部分、单项选择、完型填空、阅读理解、口语应用”进行了问卷调查.要求每位学生都自主选择其中一个类型,并将调查结果绘制成如下的统计图表(问卷回收率为100%,并均为有效问卷).被调查学生选择意向统计表题型所占百分比听力部分a根据统计图表中的信息,解答下列问题:(1)求本次被调查的学生总人数及a、b、c的值;(2)将条形统计图补充完整;(3)全市参加这次调查的中学生共有42000人,试估计全市中学生中最喜欢做“单项选择”这类客观题的学生有多少人?解:(1)由题图和表可知,最喜欢做单项选择的人数有280人,占被调查人数的35%,∴被调查的总人数为:280÷35%=800(人),∴最喜欢阅读理解的人数为:800×10%=80(人),∴最喜欢