统计学名词解释超级大全第一章导论统计学:一门阐明如何去采集、整理、显示、描述、分析数据和由数据得出结论的一系列概念、原理、原则、方法和技术的科学,是一门独立的、实用性很强的通用方法论科学。教育统计学:专门研究如何搜集、整理、分析在心理和教育方面对实验或调查所获得的数字资料,如何根据这些资料所传递的信息,进行数学推论,找出客观规律的一门科学。描述统计:对实验或调查所获得的数据加以整理(如制表、绘图),并计算其各种代表量数(如集中量数、差异量数、相关量数等),其基本思想是平均,如在集中量数中将原始数据进行平均,在差异量数中将离均差进行平均,在相关量数中将积差进行平均等等。推断统计:又称抽样统计。它是根据对部分个体进行观测所得到的信息,通过概括性的分析、论证,在一定可靠程度上去推测相应团体。换言之,就是根据已知的情况推测未知情况。实验设计:研究如何更加合理、有效地获得观测资料,如何更正确、更经济、更有效地达到实验目的,以揭示试验中各种变量关系的实验计划。统计常态法则:从总体中随机抽取一部分个体所组成的样本,差不多可以保持总体的特征。这种样本特性保持着总体特性的现象叫做统计常态法则。小数永存法则:第一个样本中所表现出的特性,在其他样本中也会存在,这就是小数永存法则。此处“小数”是指小数量的意思。大量惰性原则:某一事物的某一性质或状态,在反复观察或试验中是保持不变的。有效数字:指能影响测量准确性的数字。变量:又称随机变量。具有变异性的数据。三个特性,离散型,变异性,规律性。数据:某个数值一旦被取定了,则称这个数值为随机变量的一个观察值。即数据。总体:性质相同的一类事物的全体。个体:构成总体的每一基本单位或单元。样本:总体抽出的部分个体。参数:表示总体特征的量数。统计量:直接从样本计算出的量数,代表样本的特征。名称变量:指一事物与其他事物在属性、类别上不同。顺序变量:事物的某一属性的多少或大小按顺序排列起来的变量。既无相等的单位又无绝对的零点的变量。等距变量:只具有相等的单位,而没有绝对的零点的变量。比率变量:既有相等的单位,又有绝对的零点的变量。连续变量:指取值可以是某区间内任一数值的随机变量,它是指测量单位之间可以划分成无限多个细小单位,其数字形式多取小数。离散变量:指测量单位之间不能再细分的数字资料,其数字形式常取整数。计数数据:计算人或物的个数所获得的数据。度量数据:用一定的测量工具或测量标准测量时所获得的数据。指标:表明总体数量特征的概念和具体数值,又称统计指标,它是把各个个体的特征加总起来的综合结果。标志:指统计总体中各个个体共同具有的属性和特征,它是说明个体属性和特征的名称。绝对数:用来表明在一定时间、地点条件下某种教育、心理现象的总体规模和发展水平的统计指标,又称总量指标。相对数:指教育与心理现象中两个单位相同的相互联系的指标数值的比率。品质标志:是表明个体属性特征的,不能用数量说明,只能用文字说明。数量标志:是表明个体数量特征的标志,是用数值表示的。第二章数据的搜集、整理与表达次数:某一事件在某一类别中出现的数目,又叫频数,用f表示。频率:指每一组的数据个数除以数据的总和,又称相对次数。用符号p表示。百分频率:频率与百分数的乘积。组中值:每一组的中点值,常用m或Xc表示。全距:全部数据的距离,也称极差,是用一群数据中的最大值减去最小值。组距:指每一组所包含的间隔或数据单位,用i表示。组限:指每一组的起止点或每一组的界限。统计表:以表格的形式表达统计资料数量关系的方式或工具。统计图:以几何图形和形象图形表示统计资料数量关系的工具。次数分布累积次数:以简单次数为基础,从最低组开始逐级累加直至最高组,或从最高组开始逐级累加直至最低组,用符号cum﹒f或F表示。累积百分频率:各组累计次数与总次数的比值。一时性资料:在一定时限内所收集的有关问题的资料为一时性资料。来源三个方面,教育与心理调查,教育与心理测量和教育与心理实验。经常性资料:主要是日常工作中的记录和统计报表等。直条图:用直条(或矩形)的长短表示统计数据多少的图形。直方图:以矩形面积表示连续变量的统计图。折线图:以纵轴的高度表示次数,并将各点用线段连接的统计图形。散点图:表示事物相互关系的图形。圆形图:用圆的面积表示一组数据的整体,用扇形表示各组成部分所占比重或百分比的统计图。枝叶图:把首位数字或首几位数字定位枝,其他位数定为叶的一种数字图。第三章集中量数集中量数:一组数据的代表值,用以说明一组数据分布的典型情况或一般水平,它比个别数据更能反映客观现象或事物的实际情况。集中趋势:在实验、测量或调查中获得的大量观测数据,具有一种向数据中央某一点靠拢的趋势。平均数:所有观测值(或变量值)的总和除以总个数所得的商。中数:按一定顺序排列的一组数的中央位置的数值。众数:一群数据中出现次数最多的那个数值,又称范数。几何平均数:几个变量值乘积的n次方根。调和平均数:指一群数据倒数的算术平均数的倒数,又称倒数平均数。百分位数:任意百分位上的数值。四分位数:1/4位置上的数值和3/4位置上的数值。第四章差异量数离中趋势:差异量数:描述一组数据离中趋势的量数。方差(S2/V/MS):一列数据离差平方的算术平均数。一列数据平均差距地平方。标准差(S/SD):方差的算术平方根。一列数据的平均差距。平均差(AD):离差绝对值的平均数。全距(Rg):最大值与最小值的差。偏态量(SK/α3):三级中心动差。峰态量(α4):四级中心动差。百分位差:表示某两个百分位数之间差异程度的指标。四分位差:是百分位差的特例。用于分析P75与P25之差的一半。统计动差:在统计学上,借用物理学中的动势(或动差)概念而称为统计动差。中心动差:以平均数所在的位置为原点,以各组观测值与均数的差(X-X)为力臂,各组次数为作用力来计算动差。这种以均数为原点计算的统计动差叫做中心动差。第五章相对量数相对地位量数:就某一特质来描述个体在团体中所占的地位的量数。相对差异量数:指差异量数与集中量数的百分比,又叫差异系数。用符号CV表示。标准差系数:标准差与平均数的百分比,用符号CVS表示。百分等级:指把一组观测值先按高低次序排列起来,然后计算出某个个体的分数在百分位上超出多少人,或是在此分数下占多少百分比的一种量数,用符号PR表示标准分数:它有许多变形,其中最典型的标准分数为Z分数。以标准差为单位所表示的“原始分数”与平均数的偏差,亦即原始分数与其平均数之差除以标准差所得的商。第六章相关量数相关量数:分析或研究两个或两个以上变量之间相互关系的量数。正相关:指一列变量由大到小或由小而大变化时,另一列变量亦由大而小或由小而大的变化,即两列变量是同方向变化的,属“同增共减”的关系。负相关:指一列变量由小到大或由大而小变化时,另一列变量却由小而大或由大而小的变化,即两列变量是反方向变化的,属“此增彼减”的关系。零相关:又称无相关,指两列变量的变化看不出一定的趋势。相关系数:表示相关方向和大小的一种数值。用符号r表示。直线相关:指两列变量中的一列变量在增加时,另一列变量随之而增加;或一列变量在增加,另一列变量却相应的减少,形成一种直线关系。曲线相关:指两列相伴随变化的变量,未能形成直线关系。简相关:指只有两个变量的相关。复相关:指有三个或三个以上变量的相关。积差相关:直线相关中最基本的方法。利用离差乘积的关系来说明事物的关系,是将原始记分转换为离差乘积,再转换为标准积差后所求得的标准积差的平均数。用符号rXY表示斯皮尔曼等级相关:根据两列变量的成对等级差数计算的相关系数,又称“等级差数法”,用符号rp或rs表示。肯德尔W系数:用于描述多列等级变量相关程度或一致性程度的相关方法。点二列相关:研究一列等距或比率变量与一列“二分”名称变量之间相关的统计方法。rpb二列相关:研究一列正态的比率或等距变量和一列人为“二分”名称变量之间相互关系的统计方法。用符号rb或rbis表示phi系数:专门研究两列“二分”变量之间相关的统计方法,衡量两个分类变量均分为两类时其关联程度的指标。即Φ相关。用符号rΦ或Φ表示。第七章概率分布及其应用二项分布:二项试验结果的概率分布。正态分布:就是中间量数次数分布多,两端量数次数分布少,呈对称型的概率分布。又叫高斯分布。t分布:由小样本统计量形成的概率分布。频率:一种随机事件发生的次数与总试验次数的比值。概率:随机事件在试验中发生可能的程度或可能性的大小,用P表示。概率的统计定义是指通过频率来计算的概率;又称经验概率。概率的古典定义是根据问题本身所具有的“对称性”特点直接计算事件的概率;又称先验概率。中心极限定理:推断统计中最基本的理论与方法,用极限的方法所求得随机变量分布的一系列定理。随机抽样:随机样本:指按照概率的规律抽取的样本,即随机样本所包含的研究对象不是由某个人或集体的意向所决定的,只能凭各研究对象相互独立的机会而定。抽样误差:由于抽样的随机性所引起的样本统计量与总体参数之间的不同。标准误:样本统计量分布的标准差或某统计量在抽样分布上的标准差。用符号SE或σx表示。自由度:在推断统计中,把一群数据或观测值可以独立自由变动的数目称为自由度。df/n’确定性事件:指在一定条件下必然会发生或必然不会发生的事件。分为必然事件和不可能事件。必然事件:指在一定条件下必然会发生的事件。不可能事件:指在一定条件下必然不会发生的事件。随机事件:在一定条件下,可能发生,也可能不发生的事件。模糊事件:指对象类属边界和性态不确定的事件。第八章参数估计参数估计:根据样本统计量去估计相应总体的参数。总体平均数估计:用样本的均数去估计总体的均数。点估计:在参数估计中直接以样本的统计量作为总体参数的估计值。区间估计:以统计量的区间值来估计相应总体。置信系数:指被估计的总体参数落在置信区间内的概率D,或以1-α表示,又叫置信水平,置信度,可靠性系数,置信概率。置信区间:指在特定的可靠性(即置信系数)要求下,估计总体参数所落得区间范围,亦即进行估计的全距。置信限:被估计的总体参数所落区间的上、下界限。推断统计:指由样本资料区推测相应总体情况的理论与方法,也就是部分推全体,由已知推未知的过程。无偏估计量:用统计量估计总体参数必然存在一定误差,恰好相等的情形是极少见的,当然,无偏性并不是说没有一点误差,而是要求用各个样本的统计量作为估计值,其偏差为0。即∑(X-μ)=0。这时的统计量被称为无偏估计量。第九章参数检验假设检验:由于在进行差异检验时需要先对事物是否存在差异作出假设,然后再作统计检验,因此称为假设检验,又称差异的显著性检验。α错误:指虚无假设本身是正确的,但由于抽样的随机性而使检验值落入了拒绝虚无假设的区域,致使做出了拒绝虚无假设的结论,又称Ⅰ型错误。β错误:指虚无假设本身不正确,但由于抽样的随机性而使检验值落入了接受虚无假设的区域,致使作出了接受虚无假设的结论,又称Ⅱ型错误。双侧检验:把拒绝性概率值置于理论分布的两端或两侧。单侧检验:把拒绝性概率值置于理论分布的一尾或一侧。虚无假设:研究人员为了证实研究假设是真的而利用概率论的反证法所进行的假设。根据检验结果予以接受或拒绝的假设。用Ho表示。研究假设:研究者希望证实的假设。用Ha表示。显著性水平:拒绝虚无假设,接受研究假设的小概率值。方差齐性:独立样本:指从两个无关的总体中随机抽取的两个或多个样本,或者说是独立抽取的,彼此间的数据不存在对应关系的样本。相关样本:从具有一定程度相关的总体中抽取的两个或多个样本,亦即彼此的观测值之间存在一一对应的关系的样本。第十章方差分析方差分析:就是对多个平均数进行比较的一种统计方法,又称变异数分析。变异率:根据方差分析的原理,需比较组间变异和组内变异,若用一个统计量来揭示组间变异,则称这一统计量为变异率。组间变异:组与组之间的差异称组间变异,它反映各组平均数的不同。组内变异:同一组内部被试(个体)之间的差异称组内变异,它反映每一个人分数的不同。区组变异:多重比较:F检验的后续检验。因素:自变量(实验者所操作的变量)。水平:自变量的配置或范围。处