第二章统计图表[教学目标]1.熟悉整理统计数据的排序与分组方法;2.理解各种统计图表的基本结构及制作要求;3.熟练绘制各种统计图表;4.针对不同的数据类型和研究需求,灵活运用统计图表。第二章统计图表[学习重点]1.各种统计图表的基本结构与编制方法2.各种次数分布表与次数分布图3.直方图、条形图与线形图第二章统计图表各种科学研究的结果大多以数据的形式出现。这些直接获得的数据称为原始数据或观测数据,它们纷乱无章,初看起来难以发现问题,只有经过整理分析才能从中提取出有用的信息构成规律性的知识。第二章统计图表因此,科学工作者在实验或调查结束后的第一项工作就是依据研究的目的要求,对原始数据加以初步整理与分析,制成简单的统计图或统计表,从中发现这些数据分布的形式和特点,再选择必要的统计方法进一步作深入研究。第二章统计图表另一方面,研究结果的呈现既可以采用数字或文字形式,同时,也可以绘制成统计图表,用简单明了的形式来呈现。统计表和统计图简单明确、生动直观地表达数量关系,具有一目了然、整洁美观、容易理解等特点,在科研结果的展示中是不可忽视的一个重要方面。第二章统计图表第一节数据的初步整理第二节次数分布表第三节次数分布图第四节其他类型的统计图表第一节数据的初步整理一、数据排序二、统计分组三、统计表四、统计图一、数据排序数据排序就是按照某种标准对收集到的杂乱无章的数据按照一定的标准进行排列。二、统计分组(一)统计分组前的准备(二)统计分组应注意的问题(三)分组的标志(一)统计分组前的准备在剔除不合格问卷的过程中,注意不能把一些不符合自己主观假设的数据随意去掉。因此这项工作一定要非常慎重。对于个别极端数据是否该剔除,应遵循三个标准差法则。(二)统计分组应注意的问题分组要以被研究对象的本质特性为基础。分类标志要明确,要能包括所有的数据。(三)分组的标志性质类别:按事物的不同性质进行分类。数量类别:按数值大小进行分类并排序。三、统计表统计表是用来表达研究变量与被说明的事物之间数量关系的表格。它可以将大量数据的分类结果清晰、概括、一目了然地表达出来,便于分析、比较和计算。统计表的结构横标目的总标目纵标目横标目数字表2-1统计表的格式顶线底线表线表号标题标目标目表注注:统计表的结构和组成要素图示80名员工对主管尽职情况评定人数①非常不尽职②不尽职③不置可否④尽职⑤非常尽职93010256总计80表2-180名员工对部门主管尽职程度调查结果表号标题标目表注*注:表中的数据来源于例[2-1]标目顶线表线数字底线四、统计图统计图是整理和呈现数据的另一种方法,它把研究变量与被说明事物之间的数量关系用图形表现,直观、形象地表达出事物的全貌及其数据的分布特征,使人一目了然,便于理解和记忆,印象深刻。统计图的构成统计图一般由图号、标题、标目、图形、图注等几部分构成。统计图中的标目由基线和尺度线构成。对于有纵、横轴的统计图,一般以基线表示被观察的现象,而尺度线则表示其数量。统计图结构要素图Y轴名称尺度单位填充图案轮廓线基线X轴名称刻度标记图尺图号图题图目第二节次数分布表简单次数分布表分组次数分布表相对次数分布表累加次数分布表双列次数分布表不等距次数分布表简单次数分布表简单次数分布表就是依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。在心理与教育研究中,许多态度、兴趣、偏好等测验或调查的结果,都能制作成这种简单次数分布表。分组次数分布表的概念当数据量很大时,应该把所有的数据先划分为若干分组区间,然后将数据按其数值大小划归到相应的组别内,分别统计各个组别中包括的数据个数,再用列表形式呈现出来,就构成了分组次数分布表。(1)求全距(R):(2)决定组数(K)与组距(i):决定组距的大小,需要以全距为参考。组数的多少要根据数据的多少来定。如果数据的总体分布为正态,可用经验公式:来计算组数,然后由公式:来确定组距。(3)列出分组区间:列分组区间要注意以下几点:①最高组区间内应包含最大值的数据,最低组区间应能含最小值的数据;②最高组或最低组的下限最好是组距的整数倍;③各分组区间一般在纵坐标上按顺序排列,数值大的分组区间排在上面,数值小的分组区间排在下面。(4)登记次数:依次将数据登记到各个相应的组别内,一般用划线记数或写正字的方法。(5)计算次数:根据登记的结果计算各组的次数,计算各组次数的总和即总次数。(6)抄录新表:新表包括的栏目有:第一列为分组区间,第二列为各分组区间的组中值,第三列为次数。分组次数分布表的编制步骤minmaxXXR52187.1NKKRi分组次数分布表的意义与缺点分组次数分布表的意义编制分组次数分布表,可将一堆杂乱无序的数据排列成序。从表中可以发现各个数据的出现次数是多少,其分布的状态如何。分组次数分布表的缺点分组次数分布表也有缺点,仅从这张表看,原始数据不见了,只见到各分组区间及各组的次数。根据这样的统计表提供的数据资料计算得到的平均值,会与用原始数据计算的值有一定的出入。将分组次数分布表中各组的实际次数转化为相对次数,即用频数比率()或百分比()来表示次数,就可制成相对次数分布表。相对次数分布表%100NfNf累加次数分布表在一般的分组次数分布表上,只标出各分组区间的数据次数。如果想知道某个数值以下或以上的数据的数目,就要用累加次数。累加次数是把各组的次数由下而上,或由上而下累加在一起。最后一组的累加次数应等于数据的总次数。用累加次数表示的次数分布表称为累加次数分布表。累加次数分布表中,累加次数可用实际次数,亦可用相对次数。累加次数的计算方法有两种:①从分布表的小数值端,逐区间的进行次数累加,这种累加次数可回答次数分布表某一分组区间上限以下的次数是多少。②从分布表的大数端逐区间的次数累加,这种累加次数可回答某一分组区间下限以上的次数是多少。双列次数分布表双列次数分布表是对有联系的两列变量用同一表表示其次数分布。所谓有联系的两列变量,是指同一组被试中每个被试两门学业成绩分数,或两种能力分数或两种心理特点的指标,或同一组被试在两种实验条件下获得的结果等。再如,各方面基本相同的两个被试进行同一测量所得的结果也是有联系的。如果有多个这样的被试,他们的测试数据也构成有联系的两列变量。编制双列次数分布表,首先按照分组次数分布表的编制方法,分别列出各变量的分组区间,将一列变量的分组区间竖列,将另一变量横列。竖列的小数端在下,大数端在上,横列的小数端在左而大数端在右。登记时,每次同一对变量同时登记在相应的格内。不等距次数分布表一般分组次数分布表都是等距的。但实际研究中常遇到不等距的情况,如工资级别,年龄分组等,若按等距分组不能确切地反映实际情况,这时可采用不等距分组的方法。这样的不等距分组的分组次数分布表就叫做不等距次数分布表。第三节次数分布图直方图次数多边形图累加次数分布图直方图直方图(等距直方图)是以矩形的面积表示连续性随机变量次数分布的图形。直方图一般用纵轴表示数据的次数(频数),横轴表示数据的等距分组点(即各分组区间的下限)。在制作直方图时,以组距为底边,以分组区间的精确上下限为底边二端点,以次数为高画矩形,各直条矩形之间不留空隙,没有间隔(参见教材图2—3)。也可以不画矩形,只要使直方图包围的面积成封闭的图形即可,这种图又叫组织图(参见教材图2—4)。次数多边形图次数多边形图是表示连续性随机变量次数分布的线性图。绘制次数多边形图时,横坐标是以各分组区间组中值表示的连续变量,纵坐标是数据的频数。以每个分组区间的组中值为横坐标,以各组的次数为纵坐标标点,连接各点,就成为一条折线(参见教材图2—5)。多边形图与直方图虽然都是以面积表示表示连续性数据的次数分布,但次数多边形对次数的轮廓显示得更好,组与组之间的次数过渡是连续而直接的。如果样本很大,能描绘出一条分布曲线,还可据此找到次数分布的经验公式。这样就能够对于总体的理论次数分布的分析提供很多有用的信息累加次数分布图(1)累加直方图这种图的横坐标同直方图一样,标以分组区间,纵坐标是累加次数,其余步骤同绘制直方图的要求一样(参见教材图2—7)。(2)累加曲线(又称递加线)它的画法同次数多边形基本相同,不同点是横坐标为每分组区间的精确上限或下限,纵坐标是各分组的累加次数,分别标出各个交点,连接各交点即可画成累加曲线。如果有累加直方图,连接各组矩形的右顶点可画累加曲线(参见教材图2—8)。第四节其他类型的统计图表一、其他常用的统计表类型二、其他常用的统计图类别一、其他常用的统计表类型简单表:只按研究现象(或变量)的名称、地点、时序等列出数据的统计表。分组表:只按一个标志分组的统计表称为分组表。复合表:按两个或两个以上标志分组的统计表称为复合表。二、其他常用的统计图类别条形图:用直条的长短来表示统计项目数值大小的图形,主要是用来比较性质相似的间断型资料。圆形图:是用于表示间断型资料比例的图形。圆形的面积表示一组数据的整体,圆中扇形的面积表示各组成部分所占的比例。各部分的比例一般用百分比表示。单式条形图0102030405060甲乙丙丁等级人数图2-1某年级操行评定结果条形图基线尺度线图形复式条形图图2-2某年级操行评定结果条形图05101520253035甲乙丙丁等级人数男女例:图2-3三项影响较大的SARS信息对不同文化程度民众的影响00.511.522.533.544.5世卫组织对来本地旅游的警告卫生部、本市的新闻发布会所在单位和住宅区有无患者初中高中大专本科圆形图图2-4某年级操行评定结果圆形图丁4%乙47%丙19%甲30%基线尺度线绘制圆形图的步骤求出各组成部分所占的百分比求出各部分的中心角度以顺时针方向画出扇形标出不同颜色及百分比总数量某一成分数量360总数量某一成分数量丁4%乙47%丙19%甲30%线形图线形图用来表示连续型资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。基于线形图,既可对有关统计变量进行数量比较,又可分析发展的趋势。例如:对有意义的词汇,小学一年级至初中三年级学生视觉、听觉记忆再现率的情况。010203040506070一二三四五六初一初二初三年级百分比视觉记忆听觉记忆图2-5有意义的材料再现率比较线形图散点图