一、知识网络数据收集普查抽查数据处理数据的表示数据的计算一表五图两差三数两频表格条形图折线图扇形图频数分布直方图频率分布直方图平均数中位数众数方差标准差频数频率分析数据,得出结论,做出决策总体个体样本样本容量二、要点剖析1、统计的“两个思想”(1)用样本来估计总体,用局部来推断整体,是统计的基本思想。(2)统计思想(观念)通过对数据进行整理、计算、分析来研究数据的规律,为决策提供依据。通俗地说,就是用数据说话。2、普查与抽查定义优点缺点普查(全面调查)为了一定的目的而对考察对象进行的全面调查。其中所要考察对象的全体称为总体,而组成总体的每一个考察对象称为个体。数据准确度高,调查的结论较可靠。耗费人力、物力和时间,成本较高,确定总体数量困难。抽查(抽样调查)从总体中抽取部分个体进行调查,称为抽查。其中,从总体中抽取的一部分个体叫作总体的一个样本,个体的数目成为样本容量。较省时、省力、成本低。当受客观条件限制或调查具有破坏性时,往往采用抽查。与实际情况相比有一定误差,易犯抽取的样本为非随机样本和样本容量不够大的错误。3、对“一表”、“五图”的认识表格将具体问题中的数据用表格形式表示出来,可为计算统计量、画统计图作准备。条形图是用矩形的高表示各类别频数的多少,它有利于比较数据的差异。折线图是在平面直角坐标系上用折线表示数量变化规律的统计图.它可以直观的反映数据变化的趋势。扇形图是用圆的面积表示一组数据的整体,用圆中扇形面积与圆面积的比来表示各组成部分在总体中所占百分比的统计图.它凸现由数据所体现出来的部分与整体的关系。频数分布直方图是用矩形的高反映各组频数的多少的统计图。它可以直观的看出各组的频数差别。频率分布直方图是用矩形的面积反映各组频率的多少的统计图。它可以比较两组数据的总个数不同时的数据分布情况。条形图与频数分布直方图、频率分布直方图的异同点:(1)相同点:①频数分布直方图和条形图都是用矩形的高表示数据的个数;②频数分布直方图和条形图都易于比较各组频数之间的差别.(2)不同点:①条形图中,各个数据之间是相对独立的,各个矩形之间是有空隙的。而在直方图中,各矩形对应的是一个范围,由于每两个相邻范围之间不重叠、不遗漏,因此在直方图中,矩形之间无空隙。②频数分布直方图能够显示各组频数分布的情况,而条形图只能显示每组中的具体数据;③频数分布直方图一般只描述一种统计对象,而条形图有时可同时描述两个或多个统计对象.④频数分布直方图和条形图都是用矩形的高表示数据的个数,而频率分布直方图则是用矩形的面积表示数据的分布情况。4、对“三数”的理解平均数平均数的计算要用到所有数据,它能够充分利用数据提供的信息,故在生活中常用它来表示一组数据的平均水平。但它受极端值的影响较大。中位数(1)由于中位数是一个位置代表值,故可推知小于或大于它的数据各占一半。(2)中位数计算简单,不受极端值的影响,但它不能充分利用所有数据的信息。(3)中位数是唯一的,但它不一定是原数据中的数。众数(1)众数不唯一,但它一定是原数据中的数。(2)当一组数据中某些数据多次重复出现时,众数往往是人们关心的一个量,它不需要计算,并且不受极端值的影响。但当各个数据的重复次数大致相等时,众数往往没有特别意义。(平均数、中位数、众数都是反映一组数据平均水平的量。当一组数据中有极端值时,用平均数来描述集中趋势则不合适,此时应考虑用中位数或众数。)5、关于“两差”(1)方差的本质是:“偏差的平方的平均数”,即“各数据与其平均数的差的平方的平均数”。(2)标准差是方差的非负平方根。(3)方差与标准差都是用来衡量一组数据波动大小的量,它越大,说明数据的波动越大;反之,越小。(4)一组数据都加上或都减去“a”,所得到的一组新数据,它们的方差不变;一组数据都乘以“a”,所得到的一组新数据,它的方差变成原方差的“a2”倍。(可简化计算)6、相关几组数据的平均数、中位数、方差、标准差之间的关系一组数据平均数中位数方差标准差12nxxxL,,,x12nnnxnxxL,,,12nmmxxxmL,,,12nmmnmxnxnxL,,,xnmxmxnppnmpmpn2s2s22ms22msssmsms7、关于“两频”定义表示频数是指考察样本中,每个对象出现的次数频数分布表频数分布直方图频率是指每个对象出现的次数与总次数的比值,它反映了各组频数在总次数中所占的分量。频率分布表频率分布直方图(在频数分布直方图中,各小组的频数之和等于数据总数;在频率分布直方图中,各小组的频率之和等于1。)三、典型例题1.下列调查方式,合适的是()A.要了解一批灯泡的使用寿命,采用普查方式B.要了解甘肃电视台“陇原风貌”栏目的收视率,采用普查方式C.要保证“神舟六号”载人飞船成功发射,对重要零部件的检查采用抽查方式D.要了解人们对环境的保护意识,采用抽查方式D2.刘强同学为了调查全市初中生人数,他对自己所在城区人口和城区初中生人数作了调查:城区人口约3万,初中生人数约1200人.全市人口实际约300万,为此他推断全市初中生人数为12万.但市教育局提供的全市初中生人数约8万,与估计数据有很大偏差.请你用所学的统计知识,找出其中错误的原因______________.答:样本在总体中所占比例太小;或样本不具代表性、广泛性、随机性;(只要答对其中一项均可得分)3.某学校举行演讲比赛,选出了10名同学担任评委,并事先拟定从如下4个方案中选择合理的方案来确定每个演讲者的最后得分:方案1所有评委所给分的平均数.方案2在所有评委所给分中,去掉一个最高分和一个最低分,然后再计算其余给分的平均数.方案3所有评委所给分的中位数.方案4所有评委所给分的众数.为了探究上述方案的合理性,先对某个同学的演讲成绩进行了统计实验.右面是这个同学的得分统计图:(1)分别按上述4个方案计算这个同学演讲的最后得分;3.27.07.888.49.8123分数人数3.解:(1)方案1最后得分:7.7;方案2最后得分:8;方案3最后得分:8;方案4最后得分:8或8.4.(2)根据(1)中的结果,请用统计的知识说明哪些方案不适合作为这个同学演讲的最后得分.方案1所有评委所给分的平均数.方案2在所有评委所给分中,去掉一个最高分和一个最低分,然后再计算其余给分的平均数.方案3所有评委所给分的中位数.方案4所有评委所给分的众数.3.27.07.888.49.8123分数人数•因为方案1中的平均数受较小数据影响,不能反映这组数据的“平均水平”,所以方案1不适合作为最后得分的方案.•因为方案4中的众数有两个,众数失去了实际意义,所以方案4不适合作为最后得分的方案.•因此可以选择方案2和方案3.考虑到方案2中的平均数能反映所有数据的影响,因此选择方案2最合理。点评:本题以统计图为载体,集平均数、中位数、众数的选择决策于一身,重点考查“三数”的意义、计算及应用4、随着市场经济的发展,工商银行在上下班高峰的服务已经滞后,为改进服务,某市工商随机抽样调查了100名该行顾客从开始排队到办理业务所用的时间(单位:分).下面是这次调查统计分析得到的频数分布表和频数分布直方图.05t≤510t≤1015t≤1520t≤2025t≤分组频数频率一组100.1二组0.3三组250.25四组20五组150.15合计所用时间(分)频数10203040510152025(1)在上表中填写所缺数据(2)补全频数分布直方图.5、甲、乙两位同学本学年11次数学单元测验成绩(整数)的统计如图所示:(1)分别求他们的平均分;(2)请你从中挑选一人参加数学“学用杯”竞赛,并说明你挑选的理由.8990929496981001234567891011成绩(分)甲乙测试次数19696xx甲乙(分),(分)(2)理由不唯一.如:应选甲同学参加比赛。因为甲超过平均分的次数比乙多,必以更容易获得高分;或选乙去,分析图形,由折线图的走势或通过计算方差可知乙的稳定性比甲好。(从众数等方面去说明亦可)6.“农民也可以报销医疗费了!”村民只要每人每年交10元钱,就可以加入合作医疗,每年先由自己支付医疗费,年终时可得到按一定比例返回的返回款.这一举措极大地增强了农民抵御大病风险的能力.小华与同学随机调查了他们乡的一些农民,根据收集到的数据绘制了以下的统计图.人数类别没参加合作医疗参加合作医疗24060参加合作医疗得到了返回款占2.5%参加合作医疗但没得到返回款占97.5%问:(1)本次调查了多少村民,被调查的村民中,有多少人参加合作医疗得到了返回款?(2)该乡若有10000村民,请你估计有多少人参加了合作医疗?要使两年后参加合作医疗的人数增加到9680人,假设这两年的年增长率相同,求这个年增长率.2403006.(1)240+60=300(人)240×2.5%=6(人)(2)因为参加医疗合作的百分率为=80%,所以估计该乡参加合作医疗的村民有10000×80%=8000(人)设年增长率为x,由题意知8000×(1+x)2=9680解得x1=0.1,x2=-2.1(舍去),即年增长率为10%答:共调查了300人,得到返回款的村民有6人,估计有8000人参加了合作医疗,年增长率为10%.点评:体现样本估计总体的统计思想