心理与教育统计学第四章作业•根据所学内容命题:•要求:–题型:选择与计算–提供题目与详细参考答案–重点:方差、标准差及其应用–评分标准:命题数量与质量,涵盖知识点的多少,命题水平。•优秀的命题将会出现在期末考试中,命题组会有额外加分。•交作业时间:4月4日(周五上课)第5章相关关系•5.1相关、相关系数与散点图•5.2积差相关•5.3等级相关•5.4质与量相关•5.5品质相关•5.6相关系数的选用与解释有其父必有其子?皮尔逊测量了1078个父亲及其成年儿子的身高。6062646668707274767880父亲的身高(英尺)6062646668707274767880儿子的高度(英尺)•相关系数用于描述双变量相互之间的关系。•所谓双变量,是对于一个变量X的每一个观测值X1,X2,……,Xn,同时有另一个变量Y的相应观测值Y1,Y2,……,Yn与之对应。•例如,每个人的身高和体重是对应的。5.1相关、相关系数与散点图•5.1.1什么是相关•1.事物之间的相互关系:•(1)因果关系,一种现象是原因,另一种现象是结果。•(2)共变关系,表面有联系的两种事物都与第三种事物有关。•(3)相关关系,两类现象在发展变化的方向与大小方面存在一定的联系,但不是前两种关系。2.相关的类别•(1)正相关:两个变量的变化方向相同。例如,你用于学习的时间越多,考试成绩越高。•(2)负相关:两个变量的变化方向相反。例如,你完成考试的时间越少,所犯的错误越多。•(3)零相关:两个变量的变化方向无一定规律。例如,智商与体重的关系。5.1.2相关系数•相关系数(coefficientofcorrelation)用来描述两个变量相关程度的统计指标。•一般样本的相关系数用r表示,总体的相关系数用ρ表示。(1)相关系数的取值:-1≤r≤+1(2)相关系数的符号:“+”表示正相关,“-”表示负相关。(3)相关系数r=1表示完全正相关,r=-1表示完全负相关,r=0表示完全独立,零相关或无相关。(4)相关系数取值的大小表示相关强弱程度。绝对值0≤∣r∣≤1,绝对值接近1一般为相关程度密切,接近0值端一般为关系不够密切。注意:相关分析受样本影响,小样本的相关系数不稳定。相关系数不是由相等单位度量而来的,因此只能比较大小,不能做任何加、减、乘、除运算。5.1.3散点图•在平面直角坐标系中,以X、Y两列变量(如X变量)为横坐标,以另一列变量为纵坐标,把每对数据Xi、Yi当作同一平面上的N个点(Xi,Yi),一一描绘在XOY坐标系中,产生的图形即为散点图。正相关负相关散点的分布形状为椭圆形,可认为两变量之间具有线性关系。完全负相关完全正相关1011121314151610121416AB626466687010121416AC当所有的点都分布在一条直线上时,两变量之间的关系为完全相关。零相关散点的分布没有明显集中在某一方向的趋势,形成圆形区域时,两变量之间的关系为零相关。散点图告诉了我们什么?5.2积差相关5.2.1积差相关及其适用条件•积差相关是英国统计学家皮尔逊于20世纪初提出的一种计算相关的方法,因而被称为皮尔逊积差相关,也称为积矩相关(productmomentcorrelation)。积差相关适用于:•成对的数据;样本容量要大,不宜少于30对。•两列变量各自总体为正态分布;一般情况下,正常人群的身高、体重、智力水平、心理与教育测验的结果,都可按总体正态分布对待;如果要求比较高,则需要对数据进行正态性检验。•两列变量均为连续变量;根据得到数据的方式判断,测量数据。•两列变量之间的关系应是线性关系。可先绘制两列变量的散点图,根据散点图可判断两个变量之间是否线性关系。5.2.2协方差•协方差(covariance)是两个变量离均差乘积的平均数。协方差越大,表示X、Y两列变量的线性关系越强。•用符号COV表示。x、y——两个变量的离均差XXxYYyNxyNYYXXCOV(5.1)为什么协方差表示一致性程度?哪个图中,XY的一致性程度高?散点图AXY散点图BXYXYXminXmaxXYmaxYYminXYXY),(iiYXXXiYYi))((YYXXii表示该点与平均数构成的矩形的面积iXiYXYXY))((YYXXiXiY表示将所有点与平均数构成的矩形的面积加起来+-+-++--++--XYYiXiY+-+-++--++--NYYXXCOV))((的值越大,一致性程度越大。X5.2.3积差相关系数基本公式协方差的值会随着XY的单位的不同而变化,是一个很不稳定的量。为了克服协方差的缺点,除以两变量的标准差sX.sY,得到了积差相关系数:YXYXYXsNsxysNsYYXXssCOVr))(((5.2)x、y——两个变量的离均差XXxYYyXsYs——两个变量的标准差表5-131人的视听反应时(单位:毫秒)NYYNXXNYYXXsNsYYXXrYX22)()())(())((XXYY2XXYYXX2YY被试听觉X视觉Y1174.1177.511.92-3.18-37.86141.9910.092136.4167.4-25.78-13.28342.33664.81176.283118.3116.7-43.88-63.982807.571925.814093.064178.1130.915.92-49.78-792.25253.322477.755186.3199.124.1218.42444.29581.58339.416135.2198.3-26.9817.62-475.54728.14310.57…………30133.4145.5-28.78-35.181012.53828.521237.4231147163-15.18-17.68268.41230.55312.48合计5027.75601.015054.6622406.9428840.75885.263122406.942NXXsX502.303128840.752NYYsY592.0502.30885.263115054.66))((YXsNsYYXXr先计算变量X和Y的标准差:再将数据代入公式计算积差相关系数:5.2.4标准分数计算积差相关系数YXsNsYYXXr))((YXssYYXXN))((1YXsYYsXXN1YXZZNr1(5.3)ZX——为X变量的标准分;ZY——为Y变量的标准分。5.2.5原始数据计算积差相关系数YXsNsYYXXr))((YXsNsYXYXYXXY)(YXsNsYXYXYXXYYXsNsNYXYXXYXYYXsNsNNYNXNYXNYXXY22)(1XXNNsYXsNsNYXXYrYXsNsNYXXY由标准差公式:2222)(1)(1YYNNXXNNNNYXXYrNYYNXXNYXXYr2222)()((5.4a)所以:2222)()(YYNXXNYXXYNr或者:(5.4b)下面运用该公式计算相关系数:XY2X2Y被试听觉(X)视觉(Y)1174.1177.530310.8131506.2530902.752136.4167.418604.9628022.7622833.363118.3116.713994.8913618.8913805.614178.1130.931719.6117134.8123313.295186.3199.134707.6939640.8137092.336135.2198.318279.0439322.8926810.16……30133.4145.517795.5621170.2519409.703114716321609.0026569.0023961.00合计5027.75601.0837818.791040815923446.52NYYNXXNYXXYr2222)()(310.56011040815317.502779.837818310.56017.502752.92344622592.0谢谢!复习YXYXYXsNsxysNsYYXXssCOVr))((YXZZNr1协方差:NxyNYYXXCOV相关系数:NYYNXXNYXXYr2222)()(相关系数的合成。5.3等级相关•在心理与教育领域研究中,有时搜集到的数据不是等距或等比的测量数据,而是具有等级顺序的测量数据。•搜集到的数据是等距或者等比的数据,但其总体分布不是正态。5.3.1斯皮尔曼等级相关•斯皮尔曼等级相关是等级相关的一种。它适用于两列等级变量性质的线性关系的资料,用于称名数据和顺序数据的相关问题。•其相关系数常用rR或rS表示•不要求总体呈正态分布,不要求样本的容量必须大于30。•当连续数据不能满足计算积差相关的条件时,可以转换成等级数据从而计算斯皮尔曼等级相关系数。•缺点:精确度要差于积差相关。)]1()1(4[13NNNRRNrYXRN为等级个数;D指二列成对变量的等级差数;Rx与Ry为两列变量各自排列的等级次数。)1(61)1()(612222NNDNNRRrYXR1.等级差数法:2.等级序数法:计算方法(5.5a)(5.5b)假设有两列变量不服从正态分布,其中第一列变量为:X1、X2、X3……Xn,其等级序数为:RX1、RX2、RX3……RXn;第二列变量为:Y1、Y2、Y3……Yn,其等级序数为:RX1、RX2、RX3……RXn。2)1(21NNNRRYX6)12)(1(212222NNNNRRYX])([21222YXYXYXRRRRRR])([21222YXYXRRRR2)(216)12)(1(YXRRNNNNYYNXXNYXXYr2222)()(222]2)1([16)12)(1(]2)1([1)(216)12)(1(NNNNNNNNNRRNNNYX)1()(6122NNRRYX22]2)1([16)12)(1(]2)1([1NNNNNNNNNRRrYX)]1()1(4[13NNNRRNYX等级差数法:等级序数法:见P114公式5-3a10个高三学生学习潜在能力测验(X)与自学能力测验(Y)成绩序号XYRXRYD=RX-RY190212-1128412111376434-11475545-11573656-11671767-11769878-118683862496610910-111064910911合计132D9212.01100101361)1(6122NNDrR3.有相同等级时计算等级相关的方法如果有相同等级时,可用它们所占等级位置的平均数作为它们的等级。1R21R2R22R3R23R4R24R5R25R29.5252829.5301646.252.5164164164936.252.5426.252.5932.251.56.252.5426.252.5422.251.56.252.5421111随着相同等级数据的增多,有规律的减少,但与相同等级的位置无关。2R假设1、2、3……n个等级相等,新的等级:212)1(1,nnnnnRRi6)12)(1(3212222nnnnR4)1()21(222,nnnR2,2RRC4)1(6)12)(1(2nnnnn12)1(2nn不同等级:相同等级:NRRR