数据的收集、整理与描述——备课人:李发【问题】统计调查的一般过程是什么?统计调查对我们有什么帮助?统计调查一般包括收集数据、整理数据、描述数据和分析数据等过程;可以帮助我们更好地了解周围世界,对未知的事物作出合理的推断和预测.一、数据处理的一般程序二、回顾与思考Ⅰ、数据的收集1、收集数据的方法(在收集数据时,为了方便统计,可以用字母表示调查的各种类型。)①问卷调查法:为了获得某个总体的信息,找出与该信息有关的因素,而编制的一些带有问题的问卷调查。②媒体调查法:如利用报纸、电话、电视、网络等媒体进行调查。③民意调查法:如投票选举。④实地调查法:如现场进行观察、收集和统计数据。例1、调查下列问题,选择哪种方法比较恰当。①班里谁最适合当班长()②正在播出的某电视节目收视率()③本班同学早上的起床时间()④黄河某段水域的水污染情况()2、收集数据的一般步骤:①明确调查的问题;——谁当班长最合适②确定调查对象;——全班同学③选择调查方法;——采用民主推荐的调查方法④展开调查;——每位同学将自己心目中认为最合适的写在纸上,投入推荐箱⑤统计整理调查结果;——由一位同学唱票,另一位同学记票(划正字),第三位同学在旁边监督。⑥分析数据的记录结果,作出合理的判断和决策;3、收集数据的调查方式(1)全面调查定义:考察全体对象的调查叫做全面调查。全面调查的常见方法:①问卷调查法;②访问调查法;③电话调查法;特点:收集到的数据全面、准确,但花费多、耗时长、而且某些具有破坏性的调查不宜用全面调查;(2)抽样调查定义:只抽取一部分对象进行调查,然后根据调查数据来推断全体对象的情况,这种方法是抽样调查。总体:要考察的全体对象叫做总体;个体:组成总体的每一个考察对象叫做个体;样本:从总体中抽取的那一部分个体叫做样本。样本容量:样本中个体的数目叫做样本容量(样本容量没有单位);特点:省时省钱,调查对象涉及面广,容易受客观条件的限制,结果往往不如全面调查准确,且样本选取不当,会增大估计总体的误差。性质:具有代表性与广泛性,即样本的选取要恰当,样本容量越大,越能较好地反映总体的情况。(代表性:总体是由有明显差异的几个部分组成时,每一个部分都应该按照一定的比例抽取到)全面调查抽样调查收集数据整理数据制表绘图描述数据分析数据得出结论条形图扇形图折线图直方图(3)实际调查中常常采用抽样调查的方法获取数据,抽样调查的要求是什么?①总体中每个个体都有相等的机会被抽到;②样本容量要适当.例2、〔1〕判断下面的调查属于哪一种方式的调查。①为了了解七年级(22班)学生的视力情况(全面调查)②我国第六次人口普查(全面调查)③为了了解全国农民的收支情况(抽样调查)④灯泡厂为了掌握一批灯泡的使用寿命情况(抽样调查)〔2〕下面的调查适合用全面调查方式的是.①调查七年级十班学生的视力情况;②调查全国农民的年收入状况;③调查一批刚出厂的灯泡的寿命;④调查各省市感染禽流感的病例。〔3〕为了了解某七年级2000名学生的身高,从中抽取500名学生进行测量,对这个问题,下面的说法正确的是〔〕A、2000名学生是总体B、每个学生是个体C、抽取的500名学生是样本D、样本容量是500〔4〕请指出下列哪些抽查的样本缺少代表性:①在大学生中调查我国青年的上网情况;②从具有不同文化层次的市民中,调查市民的法治意识;③抽查电信部门的家属,了解市民对电信服务的满意程度。Ⅱ、数据的整理1、表格整理2、划记法Ⅲ、数据的描述1、统计表定义:将要统计的数据填入相应的表格内,利用表格统计法可以很好地整理数据;优点:统计表中的数据比较准确、详实,可以清楚地反映各个量之间的真实情况;缺点:统计表得到的信息需要进行分析,表达不够直观;2、统计图(1)条形统计图定义:用一个单位长度在坐标系中表示一定的数量,根据数量的多少画出长短不同的直线;图形:特点:条形图能够显示出各个项目的具体数目、易于比较组间数据之间的差别;优点:能够清楚地表示出各个项目的具体数目(表示数据清);缺点:不能准确地描述各部分量之间的关系;(2)扇形统计图定义:用来表示各部分量与总数之间的关系。图形:155人数1020新闻动画0节目类别体育娱乐41081810%25%20%45%新闻体育动画娱乐特点:扇形图能够用扇形的面积表示出各部分在总体中所占的百分比、易于显示每组数据相对于总数的大小;优点:能够清楚地表示出各部分在总体中所占的百分比(表明百分比);缺点:不能从统计图中看出每个项目的具体数量;步骤:①计算百分数;②计算圆心角;③画出圆和扇形并标明百分数;(用整个圆表示总体,每个扇形代表总体的一部分,用各个扇形的大小表示各部分数据,圆心角0=360百分比)(3)折线统计图图形:特点:折线图更易于显示数据的变化趋势优点:能够清楚地反映事物的变化情况(反映变化清);缺点:不能表示各部分在总体中所占的比值;(4)直方图图形:特点:能够显示各组频数分布的情况、易于显示各组之间频数的差别;绘制频数分布直方图的步骤:①计算最大值与最小值的差;——变化范围②决定组距与组数;——组内数据的取值范围③列频数分布表;——将一组数据分组后落在各个小组内数据的个数叫做小组的频数④画频数分布直方图;注意:组距与组数的确定没有固定的标准,要凭借经验和研究的具体问题来确定。通常数据越多,分成的组数也越多,当数据在100个以内时,根据数据的多少通常分成512个组。小长方形的面积=组距频数组距=频数频数/组距身高(㎝)0251346715215816417014915516116717330%10%百分率20%40%0%青少年成年人老年人年龄段娱乐动画数据的分析——备课人:李发本章是属于“统计与概率”领域的内容,是我们在七年级下册学习了“数据的收集、整理与描述”之后,对数据统计的进一步的认识,为初三学习概率做好铺垫.在前面的学习中,我们学习了收集、整理和描述数据的常用方法,将收集到的数据进行分组、列表、绘图等处理工作后,数据分布的一些面貌和特征可以通过统计图表等反映出来.为了进一步了解数据分布的特征和规律,还需计算出一些代表数据一般水平或分布状况的特征量.对于统计数据的分布的特征,可以从两个方面来分析:一是分析数据分布的集中趋势,反映数据向其中心值(平均数)靠拢或聚集的程度;二是分析数据分布的离散程度,反映数据远离其中.这两个方面分别反映了数据分布特征的不同侧面.本章主要从前两个方面来研究数据的分布特征,集中学习分析数据的集中趋势和离散程度的常用方法.一、知识结构框架本章知识的结构框图:本章知识的展开顺序:二、本章具体内容1、数据的代表平均数、中位数和众数这三个量的相同之处主要表现在:都是用来描述数据集中趋势的统计量;都可用来作为一组数据的代表,且都可用来反映数据的一般水平.平均数的大小与每一个数据都有关,任何一个数的波动都会引起平均数的波动,当一组数据中有个别数据较大或较小,用平均数来描述整体趋势则不合适,用中位数或众数则较合适.中位数与数据排列有关,个别数据的波动对中位数没影响;当一组数据中不少数据多次重复出现时,可用众数来描述.方差极差中位数众数平均数波动情况集中趋势用样本平均数估计总体平均数用样本方差估计总体方差数字特征课题学习实际应用⑴平均数:一般地,如果n个数123,,,nxxxx……,有1231(+)nxxxxxn……,那么x叫做这n个数的算术平均数.①平均数常用来反映一组数据的平均水平或反映这组数据的总体集中趋势,但容易受到极端值的影响.②平均数是唯一的(由于平均数是通过计算得到的,因此平均数会因为每一个数据的变化而变化,而不会受个别数据较大或较小的影响)③计算平均数时,若没有特别说明,计算的结果保留的位数与原数据相同.④平均数是统计中最常用的数据代表值,比较可靠和稳定,因为它与每一个数据都有关,反映出来的信息最充分.其中任何数据的变动都会相应引起平均数的变动.平均数既可以描述一组数据本身的整体平均情况,也可以用来作为不同组数据比较的一个标准.因此,它在生活中应用最广泛,比如我们经常所说的平均成绩、平均身高、平均体重等.主要缺点是易受极端值的影响,这里的极端值是指偏大或偏小数,当出现偏大数时,平均数将会被抬高,当出现偏小数时,平均数会降低.反映了一组数据的平均大小,常用来一代表数据的总体“平均水平”.是一个“虚拟”的数,是通过计算得到的,它不是数据中的原始数据.加权平均数:如果在n个数中,1x出现次1f次,2x出现次2f次,……,kx出现次kf次,(这里12+=kfffn……)那么根据平均数的定义,这n个数的平均数可以表示为11221(+)kkxxfxfxfn……这样求得的平均数叫做加权平均数,其中12kfff、、……叫做权.①这里的“权“是表示数据的重要程度的意思,解题时,正确地确定每个数据的“权”是非常重要的②当一组数据中,有些数据重复出现时,易把重复出现的数据看做一个数据导致计算出错.③权的理解:反映了某个数据在整个数据中的重要程度。学会权没有直接给出数量,而是以比的或百分比的形式出现及频数分布表求加权平均数的方法.例1:某校举行歌咏比赛,10位评委对某位选手的打分为80,85,77,82,78,95,83,79,75,82,去掉一个最高分和一个最低分后的平均分是分.【分析】这是一道关于算术平均数的计算,去掉一个最高分95,去掉一个最低分75,剩下的分数加起来再除以8,可以得到最终答案:80.75.例2:某生期中考试中,语、数、英三科的平均分为78分,物理、政治两科的平均分为80,则该生这5门学科的平均分为.【分析】由部分的平均分求整体的平均分,可列式23280378得到5科平均分:78.8.例3:某中学规定学期总评成绩评定标准为:平时30%,期中30%,期末40%,小明平时成绩为95分,期中成绩为85分,期末成绩为95分,则小明的学期总评成绩为.【分析】本题考查加权平均数“权”的第一种类型:百分数,可列式9530%8530%9540%9230%30%40%.例4:某生在英语技能水平测试中,听、说、读、写四方面的成绩分别为85、83、88、80,请你按听:说:读:写=3:3:2:2的比例算出他的成绩.【分析】本题考查加权平均数“权”的第二种类型:比例,即:842233280288383385为所求.例5:某区参加希望杯数学邀请赛,成绩如图所示:则竞赛成绩的平均数为【分析】这是一道用直方图展现出来的考查加权平均数“权”的第三种类型:数字(人数、次数……)的题目,把每一个分组的头尾两数的平均数作为组中值,则每一分组的组中值分别为55、65、75、85、95,可算出平均分为745253525105952585357525651055.7010050O8060105902535人数成绩(分)⑵中位数:将一组数据按照由小到大(或由大到小)的顺序排列,如果数据的个数是奇数,则处于中间位置的数就是这组数据的中位数;如果数据的个数是偶数,则中间两个数据的平均数就是这组数据的中位数.——唯一且带有单位.中位数作为一组数据的代表,可靠性比较差,因为它只利用了部分数据.但当一组数据的个别数据偏大或偏小时,用中位数来描述该组数据的集中趋势就比较合适.中位数与数据的排列位置有关,而某些数据的变动对它没有影响;它是一组数据中间位置上的代表值,不易受数据极端值的影响.中位数像一条分界线,将数据分成前半部分和后半部分,因此用来代表一组数据的“中等水平”.中位数是一个不完全“虚拟”的数.当一组数据有奇数个时,它就是该组数据排序后最中间的那个数据,是这组数据中真实存在的一个数据;但在数据个数为偶数的情况下,中位数是最中间两个数据的平均数,它不一定与这组数据中的某个数据相等,此时的中位数就是一个虚拟的数.中位数意义:若一组数据中的中位数是a,则说明大于或小于a的数各占一半.⑶众数:在一组数据中,出现次数最多的数(有时不止一个),叫做这组数据的众数.众数作为一组数据的代表,可靠性也比较差,因为它也只利用