0272《心理统计学》2016年6-7月期末考试指导

kkyytti
1 ℃
2020-01-15

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

10272《心理统计学》2016年6-7月期末考试指导一、考试说明本课程闭卷考试，满分100分，考试时间90分钟。可能的考试题型包括：1、单项选择题2、判断题3、简答题4、计算题5、综合应用题二、重点复习内容（一）绪论1、心理学统计学的内容：描述统计、推论统计、实验设计。其中，描述统计的指标包括数据的集中趋势，数据的离散趋势和数据间的相关2、数据的种类按照测量的水平，可以划分为称名变量、等级变量、等距变量和比率变量。（1）称名变量，是指根据事物的某一特征，用来划分、区别事物的不同种类所形成的变量。这类数码并无数量和序列的含义，不能进行数量化分析，不能做加减乘除的运算。（2）等级变量，在对事物进行分类过程中，依据事物某种属性程度的大小排列顺序形成的变量。等级变量既无相等单位，也无绝对零，不同组的等级变量间不能进行加减乘除的运算。（3）等距变量，是指在观测标识事物某一特定属性时，具有相对参照点、有相等单位的变量。可以进行加减运算，但是由于等距变量的参照点是相对的，即无绝对零点，因此不能进行乘除的运算。例如，测量温度的℃。（4）比率变量，是指既有相等单位又有绝对零参照点的变量，如身高、体重、反应时、各种感觉阈值的物理量等。这类变量可以进行加减乘除的运算。（二）统计图表1、次数分布表：各种次数分布的列表形式和图示形式。次数分布包括简单次数分布、分组次数分布、相对次数分布、累积次数分布等。2、编制次数分布表的步骤（1）求全距:从最大值的数据中减去最小值的数据，所得差数就是全距。用符号R表示（2）定组数（3）求组距：指每一组的间距，用符号i表示。（4）定组限：指各组数据在数值上的起点值和终点值。（5）求组中值：各组实际上限数值与实际下限数值的中点数值，即上、下限数值的平均值。（6）归类划记：将原始观测值按照一定的顺序逐一归组。（7）记录各组次数（f）。（8）核对，抄录新表。3、连续变量的单位是无限的，例如整数180的实上限和下限分别为179.5和180.5，而测量数据8.35的下实限是8.345。4、累加次数分布表：如果想知道某个数值以下或以上的数据的数目，就要用累加次数。5、次数分布图：编制次数分布表与绘制次数分布图，对于了解一组数据的分布情况，平均水平，差异情况等非常有用。由于数据的性质不同，有时实验结果的次数分布图上会出现双峰。（三）集中量数集中量数主要用来描述一组数据的集中趋势，常用的代表性的集中量数有算术平均数、中数、众数。1、算术平均数：又称平均数，是集中量数中性能最好的一个统计量，一般用M表示。2平均数是一种受极端数据值影响的统计量。2、加权平均数加权算术平均数是指一组数据中每个数据与其权重乘积的总和除以权重总和所得的商。在心理与教育研究中，经常会遇到由各个平均数计算总平均数这类实际的统计计算问题。在这个问题中，可以把各小组的平均分数，视为该小组每个个体的分数，而把每个小组的人数，视为权数。3、次数分布表中算术平均数的计算对于已经列成次数分布表的数据，其算术平均数的计算公式为：NfXXC式中，CX为各组的组中值，f为各组的次数，N为总次数，即fN。4、中数与众数中数：又称中点数，中位数，中值。符号为Md或Mdn。中数是按一定顺序排列在一起的一组数据中居于中间位置的数。当数据的个数为偶数时，则取据中间两个数据的平均数为中位数。对于数据较多的资料，其算术平均数与中位数的值不会相差太大。众数：又称为密集数、范数等，常用符号M0表示，众数是指在次数分布中出现次数最多的那个数的数值。5、平均数、中数与众数三者之间的关系在正态分布中三者相等，在正偏态分布中，平均数大于中数，中数大于众数。在负偏态分布中，平均数小于中数，中数小于众数。MMdMo。对于数据较多的资料，其算术平均数与中位数的值不会相差太大。（四）差异量数差异量数是对一组数据的变异性，即离中趋势特点进行度量和描述的统计量，也称为离散量数。1、全距、百分位差和四分差全距又称两极差，用符号R表示，用最大值减去最小值就是全距。例如，4，4，5，3，5，5，2。这列数据的全距为3百分位差是用百分位数之间的差值来表示离中趋势的一种差异量数。四分差，又称为四分位差，通常用符号Q来表示，指在一个次数分配中，中间50％的次数的全距之半，也就是上四分点与下四分点之差的一半。例如，已知在甲分布中P90-P10=38，在乙分布中P90-P10=24，两个分布的分散程度，则甲乙。2、标准差、方差（1）方差：也称变异数，均方。作为样本统计量，用符号s2表示，作为总体参数，用σ2表示。它是每个数据与该组数据平均数之差乘方后的均值，即离均差平方后的平均数。标准差的计算公式为NXXS）（标准差是一组同质数据间变异度大小的量度指标，但是如果两组数据平均数相差较大时，不能采用标准差进行比较。标准差、方差是描述数据的离散趋势最好的统计值。（2）方差性质：可加性、可分解性标准差特性：每一个观察值都加一个相同常数C之后，计算得到的标准差等于原标准差。每一个观察值都乘一个相同常数C，则所得到的标准差等于原标准差乘以常数C。以上两点结合，每一个观察值都乘以一个常数C（C不等于0），再加上一个常数d，所得标准差等于原标准差乘以常数C。（3）方差、标准差的意义：是表示一组数据离散程度的最好指标。其值越大，表示数据的离散程度越大，该组数据越分散；其值越小，表示次数分布的数据比较集中，数据的离散程度越小。33、分组资料标准差的计算方法对于次数分布表中的数据标准差计算公式为：22)(NfXNfXSCC4、差异系数：又称变异系数、相对标准差等，是一种相对差异量，用CV表示，为标准差对平均数的百分比，计算公式：CV=S/M×100%。差异系数的心理与教育研究中常用于：（1）同一团体不同观测值离散程度的比较，如身高和体重离散程度的比较；（2）对于水平相差较大，但进行的是同一种观测的各种团体，进行观测值离散程度的比较。5、标准分数：（1）又称基分数或Z分数，是以标准差为单位表示一个原始分数在团体中所处位置的相对位置量数。标准分数的计算公式：___XXxzss（2）标准分数在实际中的应用：①用于比较几个分属性质不同的观测值在各自数据分布中相对位置的高低；②计算不同值的观测值的总和或平均值，以表示在团体中的相对位置；③表示标准测验分数。（五）相关系数1、相关系数用于描述双变量数据相互之间的关系，是两列变量间相关程度的数字表示形式，或者说是用来表示相关强度的指标。样本相关系数用r表示，总体一般用表示。相关系数的取值介于-1.00至+1.00之间，常用小数形式表示。相关系数的正负号，表示相关方向，取值的大小表示相关的程度。如果两个相关系数取值相同，正负号不同，则相关程度相同。当XY相关程度很小时，从X推测Y的可靠性就很小。2、散点图（1）散点图是用相同大小圆点的多少或疏密表示统计资料数量大小及变化趋势的图。通常以圆点分布的形态表示两种现象间相关程度。（2）在实际中的用途：在相关研究中，通常用散点图表示两个变量之间的关系。通过点的散布形状和疏密程度来显示两个变量的相关趋势和相关程度，能够对原始数据间的关系做出直观而有效的预测和解释。因此，散点图是确定变量之间是否存在相关关系及关系紧密程度的简单又直观的方法。3、积差相关适用的条件：（1）两列数据都是测量的数据，而且两列变量各自总体的分布都是正态的，即正态双变量。（2）两列变量之间的关系应是直线性的，非直线性的双列变量，不能计算线性相关。（3）两变量测量到的数据必须是成对的数据，对于不成对的数据无法计算相关，即使计算，得到的相关也没有意义。计算公式：yxSNSxyr式中XXx，YYy，N为成对数据的数目，xS为X变量的标准差，Sy为Y变量的标准差。利用原始数据计算，公式可以转化为：4NYYNXXNYXXYr2222)()(其计算步骤为：（1）计算X变量的X、2X和2)(X；（2）计算Y变量的Y、2Y和2)(Y；（3）计算XY，XY；（4）将有关数据代入公式，求得r。例如，计算12名学生两项心理测验的得分的相关系数，可以利用积差相关。4、等级相关（1）斯皮尔曼等级相关：适用于两变量的资料为等级测量数据，且具有线性关系；连续变量的测量数据，按其大小排成等级，也可以用等级相关法计算；不要求总体呈正态分布。例如，想了解某一测验结果（测验结果服从正态分布）与文化程度是否有关联，可以采用等级相关。5、相关系数的选择：主要取决于要处理数据的性质类别以及某一相关系数需要满足的假设条件。6、点二列相关两列变量一列是正态连续性变量，另一列是二分变量，描述这两个变量之间的相关，称为点二列相关。7、肯德尔和谐系数一般常用来表示评分者信度。（六）概率分布1、概率的基本性质概率的公理系统：任何一个随机事件A的概率都是非负的；在一定条件下，必然发生的必然事件的概率为1；在一定条件下必然不发生的事件，既不可能事件的概率为0。任何一个随机事件的概率介于0和1之间。在统计推断中小概率事件一般被称为不可能发生的事件。事件的概率仅由事件本身决定，与我们用什么方法去求它无关。2、正态分布（1）正态分布又叫常态分布，是连续随机变量概率分布的一种。自然界，人类社会，心理与教育中大量现象均按正态的形式分布。正态分布曲线函数又称密度函数，一般方程为：22221）（xey其中，是圆周率3.14159...e是自然对数的底2.71828...；X为随机变量取值〈〈X；为理论平均数，2为理论方差；y为概率密度，即正态分布的纵坐标。（2）正态分布的特点①正态分布的形式是对称的，它的对称轴是经过平均数点的垂线；②正态分布的中央点（即平均数点）最高，然后逐渐向两侧下降，曲线的形式是先向内弯，然后向外弯，拐点位于正负一个标准差处，曲线两端向靠近基线处无限延伸，但终不能与基线相交；③正态曲线下的面积为1，过平均数点的垂线将其面积划分为相等的两部分；④正态分布是一族分布，它随随机变量的平均数，标准差的大小与单位不同而有不同的形态；⑤正态分布中各差异量数值相互间有固定的比例；⑥正态分布曲线下，标准差与概率（面积）有一定的数量关系。5决定正态分布曲线的最高点在横轴上确切位置的是平均数（即μ）。（3）在实际中的应用①化等级评定为测量数据；②确定测验题目的难易度③在能力分组或等级评定时确定人数④测验分布的正态化例如，某班级一次考试成绩服从正态分布，全班平均成绩为70分，标准差为10分，一个学生成绩为80分，他在全班的名次为前20%又如，某班成绩服从正态分布，平均数为80，标准差为4分，那么得76分至80分之间的学生比率为0.343、样本分布：是样本统计量的分布，是统计推论的重要依据。常用的样本分布有平均数及方差的分布。当样本足够大时，样本分布与总体分布相同。（1）平均数的样本分布：所谓平均数的样本分布是指从随机变量为正态分布的总体中，采取有放回随机抽样方法，每次从这个总体中抽取大小为n的一个样本，计算出它的平均数，这样抽取无限多次就将获得无限多个平均数，这无限多个平均数构成的分布就是平均数的样本分布。正态分布以及渐进正态分布:①样本平均数的分布：总体服从正态分布且总体方差已知，该统计量对应的标准误XSE为：nSEX；总体服从正态分布且总体方差未知时，该统计量对应的标准误为nsn1②方差与标准差的分布：自正态总体中抽取容量为n的样本，当n足够大时（n≥30），样本方差及标准差的分布，渐趋于正态分布。（七）参数估计1、自由度自由度是指统计运算与推断中变量值独立自由变化的数目，用符号df表示。自由度与统计运算和统计推断中样本容量及限制因素的个数有关。2、参数和统计量参数又称为总体参数，是指描述一个总体情况的一些统计指标；统计量又称为样本统计量，是用来描述样本情况的一些统计指标。3、点估计和区间估计点估计：是用样本统计量来估计总体参数。样本统计量为数轴上某一点值，估计的结果也以一个点的数值表示，所以成为点估计。区间估计：就是根据估计量以一定可靠程度推