各种科学研究的结果大多以数据的形式出现,这些直接获得的数据称为原始数据或观测数据,他们纷乱无章,只有经过整理分析才能从中提取出有用的信息构成规律性的知识。第一节数据的初步整理第二节次数分布表第三节次数分布图第四节其他类型的统计图表第一节数据的初步整理一、数据排序二、统计分组三、统计表四、统计图统计图和统计表是两种是对数据进行简化的两种最简单的方式。把统计指标和被说明的事物之间的关系用表格的形式表示就是统计表。(简明,清晰,准确)统计图是依据数字资料,应用点、线、画、面、体、色等描绘而成。(具体形象)一、数据排序数据排序(order)就是按照某种标准,对收集到的杂乱无章的数据按照一定顺序标准进行排列。排列后会使数据之间的某种关系有所显示。数据排序是整理数据最简单的方法。排序方法:升序和降序。不同数据的排序(一)字符型数据汉字按拼音或笔画;英文按字母顺序。(二)数值型数据排序后可以划分等级,确定名次。等级的划分要看数据及其所反映的事物本身的性质和研究目的而定。如智商、身高、跑步时间、错误次数等。二、统计分组所谓统计分组(grouping),就是根据被研究对象的特征,将所得数据划分到各个组别中去。(一)统计分组前的准备(二)统计分组应注意的问题(三)分组的标志(一)统计分组前的准备将数据进行分组前,先要对观测数据做进一步的核对和校验。核对和校验数据的目的是为了尽可能地消除记录误差,以便使后续的统计分析建立在一个坚实的基础上。(如果有充分的理由证明某个数据是受到了过失的影响,可考虑将此数据删除,否则不能随意删除。对于一些变异性较大的数据,要遵循三个标准差的准则。)(二)统计分组应注意的问题1、分组要以被研究对象的本质特征为基础。(如:智力测验的结果,可按言语智力、操作智力和总的智力分数分类。)2、分类标志要明确,要能包括所有的数据。(三)分组的标志两种分组:性质类别主要是根据事物的属性不同将被观测的事物加以划分,反映事物在组别、种类上的不同,不说明事物之间的数量差异。(按性别分为男女,按年龄分为老年、中年和青年)数量类别这是以数据的取值大小为分类标志,把数据按数值大小以分组或不分组的形式排出一个顺序来。三、统计表基本内容表号标题标目数字表注性别nM男生2689女生2490合计50-表2.4高一班成绩表1、线条原则:越少越好。基本线辅助线指标性别人数n平均数M男生2689女生2490合计50-顶线横线纵线合计线底线常见错线封口线斜线多余横线××××2、标题和表号1)标题:表的名称性别nM男生2689女生2490合计50-要求:简明扼要表B高一班成绩表2)表号:表的顺序表示方法数字法符号法3、标目作用:说明统计数字意义纵标目横标目纵标目的总标目横标目总标目标目位置横标目纵标目原则阿拉伯数字数位对齐不留空格不带单位或%(放在标目中)4、数字意义:统计表的基本语言。空格处理暂缺或未记录:…无数字:—0或极小数:05、表注表注表中内容的说明底线下如:﹡表中数据来源于例2-1标目表号标题(名称)数字心理学研究常用三线表的形式四、统计图制图要求图形类型统计图一般采用直角坐标系,通常横坐标或横轴表示事物的组别或自变量X,称为分类轴;纵坐标或纵轴表示事物出现的次数或因变量Y,称为数值轴。统计图的基本内容(一)制图的基本要求1、图题和图号图题:图的名称要求简明扼要,字体最大图号:图的序号图题和图号之间要空一个汉字与统计表不同,统计图的标题置于图的正下方等距,左→右,小→大等距,0起点,下→上纵轴:频数,百分频数。图轴横轴(基线):图目内容。2、图目和图轴图目:基线上观察对象的内容类别名称时间成绩统计量等图形主要内容线条最粗图例图形内容的说明12108642030405060708090100成绩次数其他图注:补充说明;图轴比例:纵横之比,3:5;02040男生女生合计男生41611女生811424合计12121035声舞表合尺度线基线图目图形图2-1某班参加课外学艺人数统计图图号图题图例第二节次数分布表一.简单次数分布表二.分组次数分布表的编制次数分布(frequencydistribution)显示初步整理后一组数据的分布情况,如:同一观测值出现的次数,每一个分数区间内包含的观测分数的个数,主要表示数据在各个分组区间内的散布情况。一、简单次数分布表简单次数分布表:依据每一个分数值在一列数据中出现的次数或总计数资料编制成的统计表。男生26女生24合计50性别n表3高一班成绩表比较适用于按类别分的计数资料二、分组次数分布表表的编制当一列连续性测量数据的数据个数很多,分数的分布范围又比较大时,就适合使用分组次数分布表了。分组次数分布表(groupedfrequencytable):当数据量很大时,应把所有的数据先划分为若干分组区间,然后将数据按其数值大小划归到相应的组别中,分别统计各个组别包括的数据个数,再用列表形式呈现出来,就构成了分组次数分布表。(一)次数分布表的编制1、求全距(range):全部数据的距离,即极差。Rg=Xmax-Xmin2、定组数(k)——分组的个数。和组距(interval)(i)——每组包含的数据单位。经验法k:一般10~20;最佳10~16;i:2、3、5、10、20…Rg=98-62=36计算法:总体正态时K=1.87(N-1)2/5K=1.87(100-1)2/5=11.75≈12i=R/K或i=R+1/ki=36/12=3如何掌握分组的标准?3、定组限——每组的起止点,也叫分组区间。组限有表述组限和精确组限两种。一组组距为10的分组数据,它们的表述组限为:10~19,20~29,30~39,40~49;它们的精确组限(实际组限)为:9.5~19.499,19.5~29.499,29.5~39.499等。组限的三种表达方式:10~19[9.5~19.5)10~在呈现表格时,一般用表述组限,但对数据进行归类时,一定要按实际组限。4、登记频数(frequency)某事件在某类的数目。方法:选举唱票法。分组登记次数次数96-||293-|||390-||||487-正|||884-正正|1181-正正正||1778-正正正||||1975-正正||||1472-正正1069-正||766-|||363-|160-|15、次数分布表计算组中值(mid-point):每组的中点值。2精确上限精确下限或cXm次数分布表,第一列为分组区间,第二列为各分组区间的组中值,第三列为次数。(二)分组次数分布表的意义与缺点意义:可将一堆杂乱无序的数据排列成序。缺点:⑴原始数据不见了,根据组中值计算出的平均值和用原始数据计算出的平均值是有出入的。这个误差,我们称为“归组效应”。(次数分布表假定各区间的数据分布是均匀的,但实际上并不一定均匀。⑵同一组数据,分组的组距越大,分组越少,误差越大。三、相对次数分布表ffp%100%pp96-293-390-487-884-1181-1778-1975-1472-1069-766-363-160-1分组f∑1001.00100.02.03.04.08.11.17.19.14.10.07.03.01.01P234811171914107311P%相对次数是各组的次数f与总次数N的比值。分组次数分布表与相对次数分布表它们各有不同的用途,既可以单独使用也可以联合使用。当我们主要对各组的绝对次数感兴趣时,我们编制分组次数分布表,如果侧重于各组次数的相对比例结构时,可编制相对次数分布表。四、累加次数分布表CF(cumulativefrequency)fcfcf%分组f96-293-390-487-884-1181-1778-1975-1472-1069-766-363-160-1∑100cf100989591837255362212521—cf%1.00.98.95.91.83.72.55.36.22.12.05.02.01-意义:上限以下,下限以上方法:向上累加,向下累加五、双列次数分布表又称相关次数分布表,是对有联系的两列变量用同一个表表示其次数分布。有联系的两列变量:同一组被试中每个被试两门学业成绩分数,同一组被试在两种实验条件下获得的结果。六、不等距次数分布表一般次数分布表都是等距的。但实际研究中常遇到不等距的情况,如工资级别、年龄分组等,若按等距分组不能确切地反映实际情况,这时可采取不等距分组的方法。第三节次数分布图次数直方图次数多边图累加次数分布图一、直方图(histogram)直方图是由若干宽度相等、高度不一的直方长条紧密排列在同一基线上构成的图形。纵轴表示数据的次数f,横轴表示各分组区间的上下限,有时也用组中值表示。纵轴的刻度通常从零开始,横轴的刻度可以从任何合适的数字开始,但应与数据的分布范围和组距有关。直方长条的宽度直接受组距大小的影响,底边的两端点分别为精确上下限,直方长条的高度由各组的次数决定。直方图长条的面积表示连续性随机变量次数的分布。直方图下的面积与总次数相等,所以一个直方长条的面积大小与每组的次数分布大小是等价的。如果将总面积定为1,那么,直方图中每一个直方长条的面积就是该直方长条表示的分组内的次数与总次数的比值。二、次数多边图(frequencypolygon)次数多边图是利用闭合的折线构成多边形以反映次数变化情况的一种图形。直角坐标系的纵坐标表示数据的次数,横坐标表示每个组的组中值。以每个组的次数为纵坐标标点,以相应的组中值为横坐标标点,画出各个点并连接起来,就成为一条折线。为构成闭合多边形和计算面积,可将折线两端分别增加前一组和后一组的组中值点。12108642030405060708090100成绩次数次数多边图和直方图都是以面积来表示连续性数据的次数分布,但次数多边图对次数的轮廓显示的更好,组与组之间的次数过渡是连续和直接的。当一批数据个数足够多时,随着分组间距的不断变小,绘制成的次数多边图会越来越连续和光滑,若分为无数组,就形成一条极其光滑的曲线,这种曲线在统计上称为次数分布曲线。将简单次数换成相对次数,就可以画出相对次数多边图。优点是可以在一个图上比较多组次数分布(总次数不同,但组距相同,则可在一个图里表示两个或两个以上不同总数的次数分布)。三.累加次数分布图累加直方图横坐标分组区间,纵坐标是累加次数。可以看出某上限以下的次数或者某下限以上的次数。累加曲线图先同上,标出各交点,再连接各交点。累加曲线的形状正偏态曲线的上支长于下支,说明大数端各组次数偏少且组数较多,各组次数变化小。负偏态曲线的下支长于上支,说明小数端各组次数偏少且组数较多,各组次数变化小正态曲线上下支相当,说明次数分布的大数端与小数端的分组数目及各组的次数相当,变化也相当。第四节其他类型的统计图表一、其他常用的统计表类型二、其他常用的统计图的类别简单表:横标目或纵标目未分组,只列出名称、地点时序或统计指标名称。数值25.037.5赫兹2.8mm178.6ns指标名称人数闪光融合错觉量反应时表2某运动队队员几项心理指标测试结果一、其他常用的统计表类型分组表标目按一个分类标志分组,也叫单向表。男生26女生24合计50性别n表3高一班成绩表表4不同年级控制组和实验组成绩的人数分布复合表横标目按两个或两个以上分组标志进行多层分组二年级控制组22153033实验组358525组别优良中差四控制组23134816实验组3329335六控制组25203520实验组36243010二、其他常用的统计图的类别除了次数分布图,心理与教育统计中常用的统计图还有条形图、线性图、圆形图、散点图等等。条形图圆形图线性图散点图1、条形图(barchart)条形图,也叫直条图,主要用于表示离散型的数据资料,即计数资料。它以条形的长短表示各事物间数量的大小与数量之间的差异情况。条形图的一个轴为分类轴,表示类别,描述计数数据;另一个轴是