数据的收集、整理与描述第一节统计调查调查收集数据的过程与方法(1)在统计调查中,我们利用调查问卷收集数据,利用表格整理数据,利用统计图描述数据,通过分析表和图来了解情况.(2)统计图通常有条形统计图,扇形统计图,折线统计图.(3)设计调查问卷分以下三步:①确定调查目的;②选择调查对象;③设计调查问题.(4)统计调查的一般过程:①问卷调查法-----收集数据;②列统计表-----整理数据;③画统计图-----描述数据.全面调查(即普查)和抽样调查.1、统计调查的方法有全面调查(即普查)和抽样调查.2、全面调查与抽样调查的优缺点:①全面调查收集的到数据全面、准确,但一般花费多、耗时长,而且某些调查不宜用全面调查.②抽样调查具有花费少、省时的特点,但抽取的样本是否具有代表性,直接关系到对总体估计的准确程度.3、如何选择调查方法要根据具体情况而定.一般来讲:通过普查可以直接得到较为全面、可靠的信息,但花费的时间较长,耗费大,且一些调查项目并不适合普查.其一,调查者能力有限,不能进行普查.如:个体调查者无法对全国中小学生身高情况进行普查.其二,调查过程带有破坏性.如:调查一批灯泡的使用寿命就只能采取抽样调查,而不能将整批灯泡全部用于实验.其三,有些被调查的对象无法进行普查.如:某一天,全国人均讲话的次数,便无法进行普查.总体个体样本样本容量(1)定义①总体:我们把所要考察的对象的全体叫做总体;②个体:把组成总体的每一个考察对象叫做个体;③样本:从总体中取出的一部分个体叫做这个总体的一个样本;④样本容量:一个样本包括的个体数量叫做样本容量.(2)关于样本容量样本容量只是个数字,没有单位.抽样调查的可靠性(1)抽样调查是实际中经常采用的调查方式.(2)如果抽取的样本得当,就能很好地反映总体的情况,否则抽样调查的结果会偏离总体情况.(3)抽样调查除了具有花费少,省时的特点外,还适用一些不宜使用全面调查的情况(如具有破坏性的调查).(4)分层抽样获取的样本与直接进行简单的随机抽样相比一般能更好地反映总体.其特点是:通过划类分层,增大了各类型中单位间的共同性,容易抽出具有代表性的调查样本,该方法适用于总体情况复杂,各单位之间差异较大,单位较多的情况.用样本估计总体是统计的基本思想.1、用样本的频率分布估计总体分布:从一个总体得到一个包含大量数据的样本,我们很难从一个个数字中直接看出样本所包含的信息.这时,我们用频率分布直方图来表示相应样本的频率分布,从而去估计总体的分布情况.2、用样本的数字特征估计总体的数字特征(主要数据有众数、中位数、平均数、标准差与方差).一般来说,用样本去估计总体时,样本越具有代表性、容量越大,这时对总体的估计也就越精确统计表统计表可以将大量数据的分类结果清晰,一目了然地表达出来.统计调查所得的原始资料,经过整理,得到说明社会现象及其发展过程的数据,把这些数据按一定的顺序排列在表格中,就形成“统计表”.统计表是表现数字资料整理结果的最常用的一种表格.统计表是由纵横交叉线条所绘制的表格来表现统计资料的一种形式.扇形统计图(1)扇形统计图是用整个圆表示总数用圆内各个扇形的大小表示各部分数量占总数的百分数.通过扇形统计图可以很清楚地表示出各部分数量同总数之间的关系.用整个圆的面积表示总数(单位1),用圆的扇形面积表示各部分占总数的百分数.(2)扇形图的特点:从扇形图上可以清楚地看出各部分数量和总数量之间的关系.(3)制作扇形图的步骤①根据有关数据先算出各部分在总体中所占的百分数,再算出各部分圆心角的度数,公式是各部分扇形圆心角的度数=部分占总体的百分比×360°.②按比例取适当半径画一个圆;按扇形圆心角的度数用量角器在圆内量出各个扇形的圆心角的度数;④在各扇形内写上相应的名称及百分数,并用不同的标记把各扇形区分开来.条形统计图1)定义:条形统计图是用线段长度表示数据,根据数量的多少画成长短不同的矩形直条,然后按顺序把这些直条排列起来.2)特点:从条形图可以很容易看出数据的大小,便于比较.3)制作条形图的一般步骤:①根据图纸的大小,画出两条互相垂直的射线.②在水平射线上,适当分配条形的位置,确定直条的宽度和间隔.③在与水平射线垂直的射线上,根据数据大小的具体情况,确定单位长度表示多少.④按照数据大小,画出长短不同的直条,并注明数量折线统计图(1)定义:折线图是用一个单位表示一定的数量,根据数量的多少描出各点,然后把各点用线段依次连接起来.以折线的上升或下降来表示统计数量增减变化.(2)特点:折线图不但可以表示出数量的多少,而且能够清楚地表示出数量的增减变化情况.(3)绘制折线图的步骤①根据统计资料整理数据.②先画纵轴,后画横轴,纵、横都要有单位,按纸面的大小来确定用一定单位表示一定的数量.③根据数量的多少,在纵、横轴的恰当位置描出各点,然后把各点用线段顺序连接起来.统计图的选择统计图的选择:即根据常用的几种统计图反映数据的不同特征结合实际来选择.(1)扇形统计图的特点:①用扇形的面积表示部分在总体中所占的百分比.②易于显示每组数据相对于总数的大小.(2)条形统计图的特点:①条形统计图能清楚地表示出每个项目中的具体数目.②易于比较数据之间的差别.(3)折线统计图的特点:①能清楚地反映事物的变化情况.②显示数据变化趋势.根据具体问题选择合适的统计图,可以使数据变得清晰直观.不恰当的图不仅难以达到期望的效果,有时还会给人们以误导.因此要想准确地反映数据的不同特征,就要选择合适的统计图.象形统计图(1)根据调查项目和调查目的,设计出用于记录数据的统计表格或对统计表格中缺少的数据进行完善.表格要求简明,覆盖所有调查数据.(2)象形统计图是表现统计数字大小和变动的各种图形总称.其中有条形统计图、扇形统计图、折线统计图、象形图等.在统计学中把利用统计图形表现统计资料的方法叫做统计图示法.其特点是:形象具体、简明生动、通俗易懂、一目了然.其主要用途有:表示现象间的对比关系;揭露总体结构;检查计划的执行情况;揭示现象间的依存关系,反映总体单位的分配情况;说明现象在空间上的分布情况.一般采用直角坐标系.横坐标用来表示事物的组别或自变量x,纵坐标常用来表示事物出现的次数或因变量y;或采用角度坐标(如圆形图)、地理坐标(如地形图)等.按图尺的数字性质分类,有实数图、累积数图、百分数图、对数图、坐标图、指数图等;其结构包括图名、图目(图中的标题)、图尺(坐标单位)、各种图线(基线、轮廓线、指导线等)、图注(图例说明、资料来源等)等.第二节直方图频数与频率(1)频数是指每个对象出现的次数.(2)频率是指每个对象出现的次数与总次数的比值(或者百分比).即频率=频数数据总数一般称落在不同小组中的数据个数为该组的频数,频数与数据总数的比值为频率.频率反映了各组频数的大小在总数中所占的分量.频数(率)分布表1、在统计数据时,经常把数据按照不同的范围分成几个组,分成的组的个数称为组数,每一组两个端点的差称为组距,称这样画出的统计图表为频数分布表.2、列频率分布表的步骤:(1)计算极差,即计算最大值与最小值的差.(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).(3)将数据分组.(4)列频率分布表.频数(率)分布直方图画频率分布直方图的步骤:(1)计算极差,即计算最大值与最小值的差.(2)决定组距与组数(组数与样本容量有关,一般来说样本容量越大,分组就越多,样本容量不超过100时,按数据的多少,常分成5~12组).(3)确定分点,将数据分组.(4)列频率分布表.(5)绘制频率分布直方图.注:①频率分布表列出的是在各个不同区间内取值的频率,频率分布直方图是用小长方形面积的大小来表示在各个区间内取值的频率.直角坐标系中的纵轴表示频率与组距的比值,即小长方形面积=组距×频数组距=频率.②各组频率的和等于1,即所有长方形面积的和等于1.③频率分布表在数量表示上比较确切,但不够直观、形象,不利于分析数据分布的总体态势.④从频率分布直方图可以清楚地看出数据分布的总体态势,但是从直方图本身得不出原始的数据内容.频数(率)分布折线图一般利用直方图画频数分布折线图,在频数分布直方图中,把每个小长方形上面的一条边的中点顺次连接起来,得到频数折线图.注意:折线图要与横轴相交,方法是在直方图的左右两边各延伸一个假想组,并将频数折线两端连接到假想组中点,它主要显示数据的变化趋势.