我自考网整理自考教育统计与测量复习必看知识点统计:对事物某方面特性的量的取值从总体上加以把握与认识。教育统计:对教育领域各种现象量的取值从总体上的把握与认识,它是为教育工作的良好运行、科学管理、革新发展服务的。统计学内容:描述统计是通过列表归类、描绘图象、计算刻画数据分布特征与变量相依关系的统计量数,如平均数、标准差和相关系数等,把数据的分布特征、隐含信息,概括明确地揭示出来,从而更好地理解对待和使用数据。推断统计是教育统计的核心内容。如何利用实际获得的样本数据资料,依据数理统计提供的理论和方法,来对总体的数量特征与关系作出推论判断,即进行统计估计和统计假设检验。测量:按一定规则给对象在某种性质的量尺上的指定值。教育测量:给所考查研究的教育对象,按一定规则在某种性质量尺上的指定值。比率量尺:是一种有绝对零点的等单位的线性连续体系,其上的数字量化水平最高,全面具有可比可加可除性。标准化测验(测验):测量工具、施测与评分程序、解释分数的参照体系都以科学地实现标准化。即代表性行为样本的客观而标准化的测验。标准化考试:教育条件下的心理特质是学业成就的标准化测量。量表:标准化测验中的测量工具(考试卷或心理测试项目的集合)与解释分数的常模(或标准),都有物化的形态,合在一起称为量表。教育测量的特点是间接性和要抽样进行。理解教育测量抓住:测量的结果就是给所测对象在一定性质的量尺上的指定值。要达到目的就要按照一定规则来进行一系列工作。工作如何进行和能在什么性质量尺上指定值,归根到底取决于所测对象本身的性质。数据:用数量或数字形式表现的事实资料。数据种类:来源分计数数据、测量评估数据、人工编码数据。反应的变量的性质分称名变量、顺序变量、等距变量、比率变量数据。数据特点:离散性、变异性、规律性。计数数据:以计算个数或次数获得的,多表现为整数。测量评估数据:借助测量工具或评估方法对事物的某种属性指派给数字后所得的数据。人工编码数据:以人们按一定规则给不同类别的事物指派适当的数字号码后形成的数据。称名变量:说明某一事物与其他事物在名称、类别或属性上的不同,不说明事物之间差异的大小、顺序的先后及质的有劣。计算次数或个数,不能进行运算。顺序变量:就事物的某一属性的多少或大小按次序将各事物加以排列的变量,具有等级性和次序性的特点。数据之间有次序和等级关系,不具有相等的单位,也不具有绝对的数量大小和零点,进行顺序递推运算。等距变量:表明相对大小,相等的单位,零点相对,不能用乘除法反映数据之间的倍比关系。比率变量:具有量的大小、相等的单位、绝对零点、进行运算,用乘除法处理数据,做比率描述。不同性质的测量量尺:名义量尺(指定数字有类别标志意义,无性质优劣、分量多寡涵义,量化水平最低);顺序量尺(数字量化水平最高,有优劣大小先后之别,单位不等,有可比性无可加性);等距量尺(数量化水平更高,数字是单位相等但零点可任意指定的线形连续体系上的值,有可比可加性无可除性);比率量尺(是一种有绝对零点的等单位的线性连续体系,其上的数字量化水平最高,具有可比可加可除性)。次数分布:一批数据中各个不同数值所出现次数多少的情况,或者是这批数据在数轴上各个区间内所出现的次数多少的情况。编制次数分布表的步骤:求全距:数据中最大值与最小值之间的差距。定组数:确定把整批数据划分为多少个等距的区组,数据个数200个以内,组数取8-18组。定组距:全距与组数的比值取整数就是组距,取奇数或5的倍数。写出组限:每个组的起止点界限,如10-15(9、514、5)。求组中组:组中值等于(组实上限加组实下限)除以2,选奇数。归类划记:设计表格记录上述有关结果对数据归纳划记。登记次数。次数分布图—次数直方图:由若干宽度相等、高度不一的直方条紧密排列在同一基线上构成的图形。次数多边图:利用闭合的的折线构成多边形以反映次数变化情况的图示方法。累计次数曲线图绘制步骤。1、纵轴为累计次数的量尺,横轴代表测验的分数量尺。2、对于“以下”分布来讲,各个坐标点的位置,其横坐标是各组的实上限,纵坐标是累计的次数。3、用连续光滑的曲线把点的轨迹连起来,再与横轴上最低组的实下限所在点连起来,形成“S”形曲线。线形图绘制:1、横轴代表自变量,纵轴代表因变量。2、根据有关统计事项的具体数据,在由纵横两轴所决定的平面上画记圆点,用稍粗的线段把相邻的点依次连接。3、在同一个图形中,可画若干条线(不超过3条)不同的线形图,便于比较分析。用不同的折线,在图形的适当位置上标明图例。次数多边图制作:1、画纵轴和横轴。二者长度之比5:3,纵轴为次数的量尺,横轴代表测验的分数量尺,并在横轴上最低组与最高组外各增加一个次数为0的组。2、在两轴所夹的直角坐标平面上,分别以每个组的组中值为横坐标,相应低次数为纵坐标,画出两个点。3、用线段把相邻的点依次连接起来,连同横轴,构成一个闭合的多边形。统计分析图——散点图:用平面直角坐标系上点的散布图形来表示两种事物之间的相关性及联系模式。适应描述二元变量的观测数据。线形图:以起伏的折线表示某种事物的发展变化及演变趋势的统计图。适于描述事物在时间序列上的变化趋势,藐视一种事物随另一事物发展变化的趋势模式,比较不同人物团体在同一心理或教育现象上的变化特征几相互联系。条形图:用宽度相同的长条表示各个统计事项之间数量关系的图形。用于描述离散性的统计事项。圆形图:以单位圆内各扇形面积占整个圆形面积的百分比表示各统计事项在其总体中所占相应比例的图示方法。用于描述具有百分比结构数据。集中量数:观测数据不仅具有离散性的特点,而且在多数情况下具有向某点集中的的趋势,反映次数分布集中趋势的量数。作用—提供整个分布中多数数据的集结点位置,集中反应一批数据在整体上的数量大小,是一批数据的典型代表值。种类—算术平均数、中位数、众数。算术平均数:一批数据总和除以数据总次数所的的商。特点(反应灵敏、确定严密、简明易懂、概括直观、计算简便、代数运算、应用普遍)。性质—数据组全部观测值与其平均数的离差之和为0。每一观测值都加上一个相同常数c计算变换后数据的平均数等于原有数据的平均数加上这个常数。每一观测值都乘上一个相同常数c所得新数据的平均数,其值等于原数据的平均数乘以这个常数。对每个观测值做线性变换,即乘上相同的常数,再加上另一常数d,计算变换数据的平均数,其值等于原数据的平均数做相同线性变化后的结果。中位数:Mdn位于数据分布正中间位置上的数。特点—根据全部数据的个数确定位置,意义简明,对排成顺序的数据来讲,计算容易。中数计算基于中间位置相邻的部分数据,不受极端数据的影响。顺序变量的观测结果适合采用中数作为分布的集中量数。不足—观测我自考网整理数据已分组归类或当原始数据分布中靠近中数附近有重复数据出现时,难以用观察法或简单的方法确定中数。中数一般不适合于作代数运算。由于中数不受其数据分布中两端数据的影响,中数缺乏灵敏性。适用—数据分布中有个别异常值或极端值出现,用中数作代表值客观合理。在次数分布的某端或两端的数据只有次数没有确切数量时,用中数作为次数分布的集中量数。在态度测验价值观测验或民意测验问卷测验中,向被调查对象提出一些事项,要求被调查对象对这些事项排序,在这些资料的信息数据整理分析中,用中数指标概括各个事项的总体排序结果。众数—一个次数分布中出现次数最多的那个数Mo。中数、众数、平均数经验公式:Mo=3Mdn-2X。差异量数:反映一组数据离散程度的量。差异量数作为一组数据离散程度的概括化特征量数,判断一组数据与其中心位置的平均差异程度;比较两组数据的离散程度;数据的中心位置通常用平均数或中数两个集中量数来刻画,差异量数与集中量数是相互联系的。差异量数大,说明数据偏离集中量数所在位置的程度也较大。差异量数小,说明集中量数的代表性较好。平均差、标准差、方差。离中趋势:数据具有偏离中心位置的趋势,他反映一组数据本身的离散程度和变异性程度。平均差:各数据与其平均数的离差绝对值的平均值AD。从平均的角度反映了各个数据偏离中心位置的整体差异程度,直观易理解,科学性较强。实用性好,应用广泛。方差:一组数据的离差平方数的算术平均数S2。标准差:一组数据方差的算术平方根用S表示。标准差运算性质。1、全组数据每一个观测值都加上一个相同的常数C后,计算得到的标准差不变。2、若每一个观测值都乘以一个相同的常数C后,所得到的标准差等于原标准差乘以这个常数的绝对值。3、每个观测值都乘以同一个非零常数C,再加上另一个常数d,所得数据的标准差等于原标准差乘以这个常数C。差异系数:把差异量数与集中量数两相比较后所形成的相对差异量数。CV=S/X×100。反映相对离散程度的系数,即相对差异量数,失去单位。地位量数:反映次数分布中各数据所处地位的量。百分等级(百分位):PR反映某个观测分数以下数据个数占总个数的比例的百分数,在0到100之间取值。百分位数:位于特定百分中的相对地位的组内常模。未归类数据确定各数百分比步骤:1、把观测数据从大到小依次排列。2、按不同的数据逐个统计次数,并列表记录。3、从低端开始向高端方向,计算各个观测点数据以下的累计次数(不包括本得分点次数)4、计算各观测数据的“以下累计相对次数”,即比例数,计算方法是把“以下累计次数”cf除以数据总个数n。5、确定各观测点数据的百分等级PR,方法是把各数据的“以下累计次数”乘以100即可。难度:被试完成项目作答任务时所遇到的困难程度。难度指数:定量刻画一个测验项目的被试作答困难程度的量数。信度:测验在测量它所测特质时得到的分数的一致性。测验效度:测验实际上测到它打算要测的东西的程度。内容效度:测验项目构成应测行为领域代表性样本的程度。效标关联效度:测验预测个体在类似或某种特点情景下行为表现的有效度。结构效度:测验测得心理学理论所定义的某一心理结构或特质的程度。效标污染:效标测量质的评定受到了测验分数值的信息的影响。随机现象(不确定现象):相同条件下其结果也一定相同的现象。随机变量:记录各种随机实验结果的变量(学生测验分数)。正态分布:是连续性随机变量中常见的一种概率分布形态。正态分布:正态分布是由平均数和标准差唯一决定的,且平均数为0,标准差为1。从形态上看,是一条单峰、对称呈种形的曲线。其对称轴为过X=u的纵线。曲线在X=u点取的最大值。从X=u点开始,曲线向正负两个方向递减延伸,不断向X轴逼近,但永不与X轴相交,因此曲线在正负两个方向上都以X轴为渐进线。一般的正态分布可以转化为标准正态分布。T分布:单峰、对称呈种形的分布,对称轴过分布的平均数,曲线在正负两个方向上以横轴为渐进线,与正态相比T分布中间低而尖,两头高而平缓,特点是一族分布每一个T分布的形态受自由度的制约.对应一个自由度就有一个T分布,随自由度的增大,曲线的中间高而平缓,两头低而陡,曲线接近正态分布,自由度接近无穷大时,变成正态分布.X2分布的一般形态,与正态分布及T分布的异同点:X2分布通常是正态分布,X值永远不会有负值。Ζ分布,即正态分布与T分布均为对称分布,平均数所在的点是对称轴所经过的中心点。X2分布是非对称分布,但与T分布曲线的形态随着自由度df改变而有所改变一样,X2分布曲线的形态也随着自由度的改变而有所改变,但当自由度df趋向无穷大时,X2分布曲线就会变成一条正态分布曲线。总体:客观世界中具有某种共同特征的元素的全体。样本:从总体中抽取的部分个体组成的群体。总体和样本区别:是不是具有同一特征的个体都已包含在所研究的群体内,是的话该群体为总体,否则为样本。二者在同一研究中是绝对的。在不同研究中两者的区分又是相对的。样本是总体的一部分,具有承接总体各种特征的固有特点,对总体具有代表性。影响样本对总体代表性的因素:总体本身的离散性;抽取样本容量的大小;抽样方法,随机抽样是一种优良的统计抽样方法。简单随机抽样原则:机会均等,相互独立。分层抽样:总体较大,所抽样本容量比较小,总体内部结构复杂使用。原则是总体中各部分元素之间的差异要大