第1页共9页《心理统计学》重要知识点第二章统计图表简单次数分布表的编制:Excel数据透视表列联表(交叉表):两个类别变量或等级变量的交叉次数分布,Excel数据透视表直方图(histogram):直观描述连续变量分组次数分布情况,可用Excel图表向导的柱形图来绘制散点图(Scatterplot):主要用于直观描述两个连续性变量的关系状况和变化趋向。条形图(Barchart):用于直观描述称名数据、类别数据、等级数据的次数分布情况。简单条形图:用于描述一个样组的类别(或等级)数据变量次数分布。复式条形图:用于描述和比较两个或多个样组的类别(或等级)数据的次数分布。圆形图(circlegraph)、饼图(piegraph):用于直观描述类别数据或等级数据的分布情况。线形图(linegraph):用于直观描述不同时期的发展成就的变化趋势;第三章集中量数集中趋势和离中趋势是数据分布的两个基本特征。集中趋势:就是数据分布中大量数据向某个数据点集中的趋势。集中量数:描述数据分布集中趋势的统计量数。离中趋势:是指数据分布中数据分散的程度。差异量数:描述数据分布离中趋势(离散程度)的统计量数常用的集中量数有:算术平均数、众数(MO)、中位数(Md)1.算术平均数(简称平均数,M、X、Y):nxXiExcel统计函数AVERAGE算术平均数的重要特性:(1)一组数据的离均差(离差)总和为0,即0)(xxi(2)如果变量X的平均数为X,将变量X按照公式bxay转换为Y变量后,那么,变量Y的平均数XbaY2.中位数(median,Md):在一组有序排列的数据中,处于中间位置的数值。中位数上下的数据出现次数各占50%。3.众数(mode,MO):一组数据中出现次数最多的数据。4.算术平均数、中数、众数之间的关系。5.加权平均数:iiinnn212211第2页共9页6.调和平均数(harmonicmean,MH):一组数值倒数的平均数的倒数。inHxnnxxxM1)111(121Excel统计函数HARMEAN(1)用于描述同一个体(或一组个体)不同时间段的平均学习速度、平均工作效率。(2)用于描述不同能力水平个体的平均学习速度、平均工作效率。7.几何平均数(geometricmean,Mg)是指n个观察值连乘积的n次方根.(1)一组数据中少部分偏大(或偏小),数据分布呈偏态时,几何平均数比算术平均数更能反映数据的集中趋势。nngxxxM21Excel统计函数GEOMEAN(2)用于计算平均学习进步速度、平均发展速度(平均发展倍数),即环比的几何平均数。1111342312nnnnngxxxxxxxxxxM(nxxx、、、21为各个时间段的成果数据)平均增长率:1gM第四章差异量数差异量数:描述一组数据离散程度(离中趋势)的统计量数。差异量数较大,说明数据分布得比较分散,数据之间的差异较大;差异量数较小,说明数据分布的比较集中,数据间的差异较小。差异量数还能反映平均数对一组数据的代表性。差异量数越小,平均数的代表性越好;差异量数越大,平均数的代表性越差。常用的差异量数是标准差、方差、差异系数标准差s:nXXsi2)(Excel统计函数STDEVP(给定样本总体的标准偏差)标准差sn-1:1)(21nXXsinExcel统计函数STDEV(给定样本的标准偏差)方差2s:nXXsi22)(Excel统计函数VARP(给定样本总体的方差)方差21ns:1)(221nXXsinExcel统计函数VAR(给定样本的方差)差异系数(又称变异系数、离散系数、相对标准差):XSCV(1)用于比较不同观测工具测量结果(数据单位不同)的离散程度,例如,身高离散程度大,还是体重离散程度大?(2)用于比较用同一观测工具测得的、均数差异较大的不同样本数据的离散程度。例如:7岁组儿童和13组岁儿童的体重离散程度,哪个较大?标准差的重要特性:如果变量X的标准差为XS,将变量X按照公式bxay转换为Y变量后,那么,变量Y的标准差XYbSS第3页共9页相对位置量数:反映个体(数据)在团体中相对位置的统计量数。主要有标准分数及其线性转换分数(Z分数、T分数)、百分等级(PR)、正态化标准分数等。1.标准分数的计算与应用:SXXZi或:iXZ,5010ZT,500100ZCEEBZ分数的特点:Z分数的平均数为0,即0Z,标准差为1,即1ZT分数的平均数50T,标准差为10TCEEB分数的平均数=___________?,标准差=__________?(1)可用于比较个体各方面水平高低(横向比较,个体内差异评价)。(2)对被试多方面的测量结果进行综合,如对高考各科成绩的综合,各分测验分数的综合。(3)可用于对个体或样组某方面水平进行前后比较(纵向比较),判断其水平是提高了,退步了,还是没有变化。2.原始分数X的百分等级的含义与计算根据简单次数分布表计算:1005.0NFfPRbX根据分组次数分布表计算:100NFfiLXPRbbX第五章相关关系相关关系的描述方法(1)相关散点图:适用于直观描述两个连续性数值变量(等距数据、比率数据)之间的关系。可用Excel图表向导中的“XY散点图”绘制。(2)双向次数分布表(交叉表、列联表):适用于描述两个等级变量(或称名变量、类别变量)之间的关系。可用Excel数据透视表编制列联表)。(3)相关系数(相关关系的特征值)。相关系数:描述两个变量相关关系的统计量数,在-1.00~1.00之间取值,绝对值越大,越接近1,说明两个变量之间的关系程度越密切;绝对值越小,越接近0,说明两个变量的关系程度越低。常用的相关系数:1.积差相关:yxiisnsyyxxr))((Excel统计函数CORREL适用条件:(1)X、Y两个变量都是连续性变量(等距数据或比率数据);(2)X、Y两个变量总体上为正态分布或接近正态分布。2.斯皮尔曼等级相关:是一对(两列)名次变量的积差相关。对数据变量的分布形态没有要求。(1)等级积差相关法(名次积差相关法)。YXRRYYXXRSNSRRRRr))((Excel统计函数CORREL公式中的RX和RY是分别代表两变量中每个数据在变量中的名次。第4页共9页(2)等级差数法(名次差数法)。如果每个等级(即名次)变量中没有相同的等级名次,可用下面公式计算:等级差数法简化公式:)1(6122NNDrR如果等级(即名次)变量中有相同的等级名次,需用下面校正公式计算:等级差数法校正公式:))((222222yxDyxrRC,2x、2y计算方法参见教材125页3.肯德尔W系数(肯德尔和谐系数):描述多个名次变量一致性程度的统计量数。适用于描述和分析不同评价者(如主考、阅卷者)对同一组个体(考生或答卷)评价结果(名次)的一致性程度,在心理测量与教育评价中称为评分信度。例如,5位阅卷老师对10篇论文评分排名的一致性。如果评价者给出的不是个体的水平名次,而是分数(或等第、符号),可先将其转换成名次,然后再计算W系数。)(121)(3222NNKNRRWii校正公式:TNNKNRRWii)(121)(322212)1(2nnT公式中:n为每个名次变量中相同名次的数目。4.点二列相关(point-biserialcorrelation):用于描述一列续性变量和一列真正二分变量(或非正态二分变量)之间的相关。真正二变量:指按某种性质或标准将个体划分为两种结果的变量,如对、错,男、女等。pqsXXrtqppbExcel统计函数CORREL5.二列相关(biserialcorrelation):用于描述由一个正态连续变量人为划分成的二分变量与另外一个正态连续变量之间的相关。或者说,用于描述一正态二分变量与一正态连续变量之间的相关。人为二分变量?是指由连续变量转换而来的二分变量,例如,将测验或考试分数区分为及格和不及格,80分以上和80分以下;按中考(或高考)成绩,将考生区分为录取、未录取。正态二分变量?如果二分变量是根据正态连续变量转换而来,那么,可称之为正态二分变量。ypqsXXrtqpby为将正态分布面积画分为p、q两部分的纵线的高度。y的计算方法:利用Excel统计函数计算标准正态分布区间点函数NORMSINV(p值)→区间点Z值正态分布函数NORMDIST(区间点Z值,0,1,0)→Z值的概率密度y6.Φ相关(Φ系数):))()()((||dbcadcbabcadr用于描述两个真正二分变量的相关程度,也用于描述一个人为二分变量和真正二分变量的相关。注意:Φ相关计算公式是由皮尔逊积差相关计算公式转换来的。因此,如果两列二分变量转换为0、1(或1、2)的数值变量时,可以用Excel统计函数CORREL计算Φ系数。第5页共9页第六章概率分布1.正态分布的特征(见教材)2.Excel软件中正态分布函数和正态分布区间点函数的应用◆标准正态分布函数NORMSDIST的应用:(1)P(Z<1.96)=?=NORMSDIST(1.96)=0.9750(2)P(Z>1.96)=?=1-NORMSDIST(1.96)=0.0250(3)P(-1.5<X<2.5)=?=NORMSDIST(2.5)-NORMSDIST(-1.5)=0.9270◆正态分布函数NORMDIST的应用例如:已知某次测验的分数呈正态分布,平均分为75分,标准差为10分,试计算:(1)低于80分的考生占多大比例,P(X<80分)=?(2)80分以上的考生占多大比例,P(X≥80分)=?(3)80分以上,低于90分的考生占多大比例,P(80≤X<90)=?P(X<80分):“=NORMDIST(79.5,75,10,1)”=0.6736P(X≥80分):“=1-NORMDIST(79.5,75,10,1)”=0.3264P(80≤X<90):“=NORMDIST(89.5,75,10,1)-NORMDIST(79.5,75,10,1)”=0.2528◆标准正态分布区间点函数NORMSINV的应用根据给定的向上累积概率P(Za),标准正态分布的临界值a=?a=NORMSINV(p值)例如:P(Za)=0.90=NORMSINV(0.90)=1.28,a=1.28,P(Z>1.28)=0.10◆正态分布区间点函数NORMINV的应用根据正态变量X的平均数、标准差和向上累积概率P(Xa),计算临界值a=?例:已知某次大规模招聘考试分数呈正态分布,平均分为55分,标准差为12分。现准备录取10%的考生进行面试,录取分数线大致是多少?P(X>?)=0.10,即P(X<?)=1-0.10=0.9,=NORMINV(0.9,55,12)=70.38,最低分数线应为70分。3.测验分数、测评等级的正态化:根据被试样本原始分或等级的简单次数分布表,计算各个不同分数或等级的正态标准分数(1)计算每个不同分数X(或等级)以下累计次数Fb;(2)计算每个不同分数X(或等级)中点以下累积比率CP:NFfCPbX5.0(3)利用Excel统计函数NORMSINV,计算CP对应的正态Z分数。(4)根据需要,将正态Z分数转为其他标准分数形式:T分数、CEEB分数、托福考试分数、离差智商IQ等,5010ZT,500100ZCEEB,50070ZTOEFL,10015ZIQ4.偏态系数(SK)和峰态系数(Kurt)的计算与应用偏态系数:Excel统计函数SKEW;峰态系数:Excel统计函数KURT。偏态系数SK=0,对称分布;SK>0,正偏态分布;SK<0,负偏态分布。峰态系数Kurt=0,正态分布的峰态;Kurt>0,次数分布的峰度比正态分布峰度低阔;Kur