心理统计与测量

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

心理统计与测量第一章描述统计第一节统计图表一、统计图(一)统计图的结构及其绘制规则统计图由标题、图号、标目、图形、图注等项构成。下面按其构成部分说明绘图的基本规则。标题图的名称应简明扼要,切合图的内容,必要时可注明时间、地点。图号文章中若有几幅画,则需按其出现的先后次序编上序号,写在图题的作前方。标目对于有纵横轴的统计图,应在纵横轴上分别标明统计项目及其尺度。图形图形线在图中为最粗,而且要清晰。图注图注不是图中必要组成部分。(二)表示间断变量的统计图1、直条图直条图是用直条的长短表示统计事项数量的图形。它主要是用来比较性质相似的间断性资料。2、圆形图圆形图是用来表示间断性资料构成比的图形。(三)表示连续变量的统计图1、线形图线形图用来表示连续性资料。它能表示两个变量之间的函数关系;一种事物随另一种事物变化的情况;某种事物随时间推移的发展趋势等。2、频数分布图常用的频数分布图有直方图、多边图和累积多边图。(1)直方图直方图用面积表示频数分布。用各组上下限上的矩形面积表示各组频数。(2)多边图多边图以纵轴上的高度表示频数的多少。(3)累积频数和累积百分比多边图二、统计表(一)统计表的结构及其编制的原则和要求。统计表一般由标题、表号、标目、线条、数字、表注等项构成。标题标题是表的名称,应确切地、简明扼要地说明表的内容。表号表号是表的序号。标目标目是表格中对统计数据分类的项目。线条线条不宜过多。数字表内数字必须准确,一律用阿拉伯数字表示,位次对齐,小数的位数一致。表注它不是表的必要组成部分。(二)统计表的总类1、简单表只列出观察对象的名称、地点、时序或统计指标名称的统计表为简单表。2、分组表只按一个标志分组的统计表为分组表。3、复合表按两个或两个以上标志分组的统计表为复合表。(三)频数分布表列法1、简单频数分布表(1)间断变量的频数分布表(2)连续变量的频数分布表步骤:①求全距②决定组数和组距③决定组限决定组限④登记频数2、累积频数和累积百分比分布表(1)累积频数分布表用累积频数表示的频数分布表称为累积频数分布表。(2)累积百分比分布表累积百分比分布表是累积频数分布表的变型。它是用累积百分比表示的频数分布表。第二节集中量数一、算术平均数(一)算术平均数的概念算术平均数是所有观察值得总和除以总频数所得之商,简称为平均数或均数。算术平均数的特征:(1)观察值的总和等于算术平均数的N倍;(2)各观察值与其算术平均数之差的总和等于零;(3)若一组观察值是由两部分(或几部分)组成,这组观察值的算术平均数可以由组成部分算术平均数而求得;(二)算术平均数的应用及其优缺点算术平均数具备一个良好的集中量所应具备的一些条件:(1)反应灵敏。(2)严密确定。简明易懂,计算方便。(3)适合代数运算。(4)受抽样变动的影响较小。除此之外,算数平均数还有几个特殊的优点:(1)只知一组观察值的总和及总频数就可以求出算术平均数。(2)用加权法可以求出几个平均数的总平均数。(3)用样本数据推断总体集中量时,算术平均数最接近于总体集中量的真值,它是总体平均数的最好估计值。(4)在计算方差、标准差、相关系数以及进行统计推断时,都要用到它。算术平均数的缺点:(1)易受两极端数值(极大或极小)的影响。(2)一组数据中某个数值的大小不够确切时就无法计算其算术平均数。二、中数(一)中位数的概念中位数是位于依一定顺序排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。(二)中位数的计算方法1、原始数值计算方法将一组原始数据依大小顺序排列后,若总频数为奇数,就以位于中央的数据作为中位数;若总频数为偶数,则以最中间的两个数据的算术平均数作为中位数。2、频数分布表计算法若一组原始数据已经编成了频数分布表,可用内插法,通过频数分布表计算中位数。(三)百分位数的概念及其计算方法百分位数是位于依一定顺序排列的一组数据中某一百分位置的数值。在心理测量中,常通过计算百分位数来说明、解释和评价分数在团体中所处的位置。计算公式为。(四)中位数的应用及其优缺点中位数虽然也具备一个良好的集中量所应具备的某些条件,例如比较严格确定、简明易懂,计算简便,受抽样变动影响较小,但是它不适合进一步的代数运算。它适用于以下几种情况:(1)一组数据中有特大或特小两极端数值时;(2)一组数据中有个别数据不确切时;(3)资料属于等级性质时。三、众数(一)众数的概念众数是集中量的一种指标。对众数有理论众数及粗略众数两种定义方法。理论众数是指与频数分布曲线最高点相对应的横坐标上的一点。粗略众数是指一组数据中频数出现最多的那个数。(二)众数的计算方法1、用观察法直接寻找粗略众数粗略众数不需要计算,可通过观察直接寻得。2、用公式求理论众数的近似值(1)皮尔逊(K.Person)的经验法利用皮尔逊发现的算术平均数、中位数、众数三者关系来求理论众数近似值的经验公式为(3.6)。(2)金氏(W.I.King)插补法当频数分布呈偏态,即众数所在组以上各组频数总和与以下各组频数总和相差较多时,可以用金氏公式计算众数,以进行比率调整。其公式为(3.7)。(三)众数的应用及其优缺点众数虽然简明易懂,但是它并不具备一个良好的集中量的基本条件。它主要在以下情况下使用:(1)当需要快速而粗略地找出一组数据的代表值时;(2)当需要利用算术平均数、中位数和众数三者关系来粗略判断频数分布的形态时;(3)利用众数帮助分析解释一组频数分布是否确实具有两个频数最多的集中点时。第三节差异量数一、离差与平均差(一)离差:每一个数据与该组数据的算术平均数的差。(二)平均差1、平均差的概念所谓平均差,就是每一个数据与该组数据的中位数(或算术平均数)离差的绝对值的算术平均数。2、平均差的计算方法用原始数据计算平均差的公式为(4.3)3、平均差的优缺点平均差意义明确,计算容易,每个数据都参加了运算,考虑到全部的离差,反应灵敏。但计算要用绝对值,不适合代数运算。二、方差与标准差(一)方差和标准差的概念方差是指离差平方的算术平均数。其定义公式为(4.5),计算公式是(4.7)。标准差是指离差平方和平均后的方根。即方差的平方根。其定义公式为(4.6),计算公式是(4.8)。(二)方差和标准差的应用及其优缺点方差和标准差的优点:反应灵敏,随任何一个数据的变化而表示;一组数据的方差和标准差有确定的值;计算简单;适合代数计算,不仅求方差和标准差的过程中可以进行代数运算,而且可以将几个方差和标准差综合成一个总的方差和标准差;用样本数据推断总体差异量时,方差和标准差是最好的估计量。三、变异系数(一)所谓差异系数是指标准差与其算术平均数的百分比。它是没有单位的相对数。其计算公式是(4.11)(二)差异系数的用途1、比较不同单位资料的差异程度2、比较单位相同而平均数相差数较大的两组资料的差异量程度3、可判断特殊差异情况(三)差异系数的应用条件从测验的理论来说,只有等比量表才使平均数等于零成为不可能。也就是说,用来测量的量尺,既具有等距的单位,又具有绝对零点,这时所测量出的数据其平均数才不可能等于零,这时才能计算差异系数。第四节相对量数一、百分位数公式:二、百分等级公式:三、标准分数(一)公式(二)性质1、Z分数无实际单位,以平均数为参照点,以标准差为单位的一个相对量2、一组原始分数转换得到的Z分数可以是正,也可是负。3、在一组数据中,各个Z分数的标准差是1。4、若原始分数呈正态分布,则转换得到的所有Z分数数值的均值为0,标准差为1的正态分布。(三)优点1、可比性2、可加性3、明确性4、稳定性(四)应用1、用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低。2、计算不同质的观测植的总和或平均值,以表示在团体中的相对位置。3、表示标准测验分数五、相关量数1、积差相关适用资料:两列变量为正态等距,呈线性关系公式:2、等级相关适用于等级变量的资料(1)斯皮尔曼相关适用于两列变量均为等级变量的呈线性相关的资料公式:D为各对偶等级差(2)肯德尔和谐系数适用于K个评价者,评价多个事物的等级变量资料,多用于评分者信度分析。公式:有相同等级3、点二列相关适用于一列为等距正态变量的测量数据,另一列为名义变量数据。常应用于试卷的信度分析。公式:其中是两个二分变量对偶的连续变量的平均数,p、q是二分变量各自所占的比率,p+q=1,St是连续变量的标准差4、二列相关适用于两列变量均为正态等距变量,但一列被人为的分为两类。其中ST与是连续变量的标准差与平均数,y为P的正态曲线的高度5、φ相关当两个相关关联着的变量分布都是真正的二分变量,列联表系数。公式:第二章推断统计第一节推断统计的数学基础一、概率(一)概率的定义概率因寻求的方法不同有两种定义,即后验概率和先验概率。1、后验概率的定义以随机事件A在大量重复试验中出现的稳定频率制作为随机事件A概率的估计值,这样寻得的概率称为后验概率。计算公式是P(A)=limm/n2.先验概率的定义先验概率是通过古典概率模型加以定义的,故又称为古典概率。古典概率模型要求满足两个条件:(1)试验的所有可能结果是有限的;(2)每一种可能结果出现的可能性(概率)相等。若所有可能结果的总数为n,随机事件A包括m个可能结果。(二)概率的性质1、任何随机事件A的概率都是介于0与1之间的正数;2、不可能事件的概率等于0;3、必然事件的概率等于1。(三)概率的加法和乘法1、概率的加法在一次试验中不可能同时出现的事件称为互不相容的事件。两个互不相容事件和的概率,等于这两个事件概率之和。P(a+b)=P(a)+P(b)2.概率的乘法A事件出现的概率不影响B事件出现的概率,这两个事件为独立事件。两个独立事件的概率,等于这两个事件概率的乘积。P(A1,A2…An)=P(A1),P(A2)…P(An)二、正态分布正态分布是一种连续型随机变量的概率分布。(一)正态曲线1.正态曲线函数正态曲线的函数式是公式标准正态分布的函数式是公式2.正态曲线的特点(1)曲线在Z=0处为最高点。(2)曲线以Z=0处为中心,双侧对称。(3)曲线从最高点向左右缓慢下降,并无限延伸,但永远不与基线相交。(4)标准正态分布上的平均数为0,标准差为1。(5)曲线从最高点向左右延伸时,在正负1个标准差是拐点。(二)正态曲线的面积与纵线1、累积正态分布函数2、标准正态分布下面积的求法3、正态曲线的纵线(三)正态分布在测验计分方面的应用1、将原始分数转换成标准分数标准分数的意义:第一,各科标准分数的单位是绝对等价的;第二、标准分数的正负和大小可以反映出考生在全体考分中所处的地位。2、确定录用分数线3、确定等级评定的人数三、二项分布(一)二项试验满足以下条件的试验称为二项试验:(1)一次试验只有两种可能结果,即成功和失败;(2)各次试验相互独立,互不影响;(3)各次试验中成功的概率相等。(二)二项分布函数二项分布是一种离散型随机变量的概率分布。用n次方的二项展开式来表达在n次二项试验中成功事件出现不同次数(X=0,1,…,n)的概念分布叫做二项分布。二项展开式的通式(5.8)就是二项分布函数,运用这一函数式可以直接求出成功事件恰好出现X次的概率。(三)二项分布图从二项分布图可以看出,当p=q,不管n多大,二项分布呈对称形。当n很大时,二项分布接近于正态分布。当n趋近于无限大时,正态分布是二项分布的极限。(四)二项分布的平均数和标准差当二项分布接近于正态分布时,在n次二项实验中成功事件出现次数的平均数和标准差分别可以由公式(前提np≥5且nq≥5)平均数——M=np标准差——r=npq1/2(五)二项分布的应用二项分布函eg:1.某市参加一考试2800人,录取150人,平均分数75分,标准差为8。问录取分数定为多少分?解:X~N(75.82)Z=(x-#)/σx=(x-15)/8~N(0,12)P=150/2800=0.0530.5-0.053=0.447Z=1.615X=1.615*8+75≈88(分)2.某高考,平均500分,标准差100分,一考生650分,设当年录取10%,问该生是否到录取分?解:Zo=

1 / 40
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功