第二部分心理统计方法上篇基础统计部分一、Z检验的原理是什么?检验样本的均值是否与总体的均值有差异的原理是将样本均数转换为Z分数,看其是否落在临界点之外。Z=X−XS标,S标=σ√n。二、什么是Ⅰ类错误,什么是Ⅱ错误?什么是统计效力?1.Ⅰ类错误:又称ɑ错误,弃H0,故称弃真错误,较严重,判无罪为有罪,无中生有。主要原因是取样问题,极端数据,决策标准较为宽松。2.Ⅱ类错误:又称β错误,存假,主要原始是设计不灵敏,样本变异大过大,实验处理效应过小,可改进程序。3.统计效力:1-β,正确侦察真实验处理的效力。当处理效应越大,显著标准ɑ越大,检验为单尾,样本容量越大(此时样本分布变异越小,分布形态越狭长)的时候,效力越大。三、假设检验的前提是什么(概率论)?随机取样;观测值独立,两个被试之间成绩不会相互影响;处理前后总体方差不变保持恒定,因为在处理后进行样本标准误计算时仍用的是处理前𝜎除以√n;样本均值分布正态。四、t检验的原理是什么?同Z检验一样,只不过在Z检验中总体方差已知,σ2=SS总N,N为总体个数,SS总为总体的和方。而在t检验中,总体方差未知,需要用样本方差来取代总体方差,但样本方差为S2=SS样n−1,SS样为样本的和方,n为样本量。t=μ−XS标,S标=S√n。五、如何进行独立样本的t检验?(一)前提:观测值独立;两个总体均为正态分布,否则用大样本;两个样本分布形态相同,即方差齐性。▲为什么要求两个样本方差齐性:因为进行独立样本t检验时,对两总体的分布并不知,需要用两个样本的方差进行估算,即用两个样本防方差的加权平均值Sp2(如下),如果两个样本的方差相差较大,可能会计算出显著的t值,所以造成统计错误。如果方差不齐性,可以用非参检验。(二)检验步骤:1.提出虚无和备择假设;2.确定是单侧检验还是双侧检验;3.确定显著水平和自由度,df=(n1−1)+(n2−1),并查出临界值;4.估计两个样本的总体方差,S12=SS1df1,S22=SS2df2,并检查同质性,F=S12S22;5.计算联合总体方差:Sp2=SS1+SS2df1+df2;6.计算联合样本的均值标准误:S标=√Sp2n1+Sp2n2;7.计算t值:t=1X−2XS标,看是否大于临界值。(三)效应值:ES=1X−2XSp,ES越大,说明两个样本重叠部分越小,效应越明显。效力:样本容量越大,效应值越大,效力越好;如果效应值低,则需要大样本,才保证效力大。六、如何进行相关样本的t检验?(一)前提:观测值独立;总体均为正态分布,否则用大样本。▲相关样本t检验为何不需方差齐性:因为检验的样本都是同一组样本,而且无需像独立样本t检验一样用两个样本的方差去估计总体方差,从而计算标准误。相关样本t检验中则只需要两组的均值之差来作为考察对象。(二)检验步骤:1.提出虚无和备择假设(μ0=0,μD≠0);2.确定是单侧检验还是双侧检验;3.确定显著水平和自由度,df=(n−1),并查出临界值;4.计算差异样本的总方差:SD2=SSDdf=∑D2−(∑D)2nn−1;6.计算差异样本的均值标准误:S标=√SD2n;7.计算t值:t=DS标,看是否大于临界值。(三)效应值:ES=DSD▲同样的数据如果来自独立样本与来自相关样本得出的结论相差很大,这是因为t检验的统计量不同。当独立时,由于样本无关,联合样本方差可用两个样本相加来结算,即Sp;当相关时,SD2=S12+S22−2rS1S2,需排除相关的部分。所以S独=D√S12+S22nS相=D√S12+S22−2rS1S2n(三)相关样本的评价:1.优点:(1)有效地控制了个体差异,使因变量受无关变量影响小;(2)相关样本使样本的方差大大减小,方差代表数据的变异,越大,越难辨别处理效应。相关样本方差小,易识别处理效应。2.缺点:练习效应;顺序效应;延迟效应;一些自变量无法重复,如性别和年龄;相关样本设计节约被试,却使自由度少了近一半,t临界值显著减小,侦察显著差异的能力也减弱。▲故两种设计可以综合使用。七、点估计的无偏性和一致性指什么?如何进行区间估计?(一)点估计的无偏性和一致性:前者是指样本容量固定,样本组数增加,估计值趋近于总体参数;后者指样本容量无限多时,越趋近于总体参数。两者无关。(二)区间估计:1.找到一个较好的点估计值:即X;2.研究这个估计量的抽样分布:X的分布(μ,σ2n)的分布。3.找一个枢轴量,使其只与待估参数有关,与其它未知参数无关:𝙯=X−XS标(S标=σ√n),服从N(0,1)的分布,此时的分布至于未知参数μ有关。4.确定枢轴量应该在的范围:(-1.96,1.96),95%的置信度(置信度越大,置信区间越宽,即越有把握,估得也越不准)。5.另枢轴量落在这个区间内,并把未知参数的范围反解出来。分三种:(1)通过样本估计总体;(2)估计两个独立样本的差异值范围;(3)估计相关样本的差异值范围。(利用上面t检验中提到的标准误)八、方差分析的原理和前提是什么?(一)研究假说和统计检验假说:1.研究假说:可检验和可证伪的,引导研究者探索某种现象和解释某种事实,是对感兴趣的现象之间关系的猜测;可以建立变量之间“如果…那么…”的推测;可以用实验观察确定假说的真伪,研究假说存在备择假说,因为不经证明,假说就不止一种。2.统计检验假说:是由研究假说或备择假说转换而来的虚无假说,是备择假说的无差别形式,是一组有关不同处理总体参数的精确假说。其基本思想是两总体平均数存在差异是小概率事件即ɑ水平;如果事实证明两者存在差异的出现大于一定概率,即1-ɑ,那么就可以推翻虚无假设。因此,对于备择假设的检验师基于统计推理得的。3.无什么是检验虚无假说而不是备择假说?因为在经验科学中,通过随机取样收集数据然后估计总体参数得到结论,这是归纳推理。其特点是不可能穷尽所有的样例,而是通过一个作决策的规则推翻虚无假说,间接接受备择选择,即通过证伪来进行检验,这是经验科学研究的一个重要特征。比如,要证伪“所有昆虫都有6条腿”比证实“所有昆虫都有6条腿”要容易得多,前者只需抓一个不是6条腿的昆虫即可,后者需要一个个抓。(二)基本原理:假设组内变异来自随机误差,如果组间变异显著不同于组内变异,则表明处理效应存在;如果组间变异与组内变异相比差异不显著,则表明处理效应相当于随机误差,处理效应是不存在的。1.组间变异、组内变异和误差变异:(1)组间变异:不同处理条件下平均数的差异,包含处理效应、误差变异和个体差异。(2)组内变异:对于同一处理组的被试,由于接受了同样的处理条件,最理想的状态时每个被试的得分都应该相同,但是由于无关因素引起的误差变异和被试个体间存在差异导组内各个被试得分不一样,这就是组内变异,由此可见,其包括了个体差异和误差变异两部分。在被试间设计中,不同组接受了不同的处理条件,误差变异无法从组内变异种分离出来,所以在F检验时F=处理间变异(组间变异)处理内变异(组内变异)。组内变异和组间变异是独立的,可以改变其中任何一个而其它一个可以不变。(3)误差变异:在(2)中提到,误差变异由于无关因素影响的,在被试间设计中,存在于组内变异中无法分离出来;而在被试内设计中,可以将每个被试的所有处理效应值进行平均。每个被试接受的是相同处理条件,因此,处理效应平均值反应的就是被试间差异。又称,可以将被试间差异从组内变异中分离出来,得到误差变异。F=处理间变异(组间变异)误差变异。▲F检验的真正目的就是看处理间变异与误差变异之间的比值,只不过在被试间设计中误差变异无法从组内变异种分离出来。这也是为什么被试内设计对实验处理效应更加敏感的原因,因为分母变小了,F值增大了,处理效应更易被识别出来。2.自由度:指独立观察的数量减去受限的数量,比如有5个样本观察值,平均数为7,只有4个数字式自由的,即只有4个数字可以任意变换,因为只要其中4个数字确定,那么最后一个必然也确定了,即35减去前4个数之和。因而叫失去了一个自由度。3.方差的分解:F值计算要用均方而不是和方,因和方取决于各自的n,所以需除自由度。SS总和=SS组间+SS组内,F=MS组间MS组内=SS组间df组间SS组内df组内。(二)前提:1.观测独立:只有各样本独立,来自真正的随机抽样,才能保证变异具有可加性;2.总体分布正态:各组随机误差被假定正态分布,因此要求各单元格残差正态分布;3.方差齐性:在F检验时,组内变异是各个处理组的组内变异之和;如果不同组之间的组内变异不同,如某个组的组内变异很大,那么组内变异之和可能就会偏差很大,不能准确反应多个处理组变异的情况,受到了单个组组内变异的影响,使统计检验受影响;另外,如果方差不齐,残差分布与自变量变异相关,就更无法进行统计检验。因此要求不同组的观测值应该方差齐性。由于各组随机误差被假定正态分布,各单元格需要变异程度相同。一般来说,如果数据分布不是明显偏态,不存在极端值,方差齐性和正态性不会又太大问题,所以方差齐性一般只限于理论探讨。但对于重要的研究,建模后进行残差分析是必须的,如果残差成随机分布,则可知单元格内原始数据满足正态分布条件。注:在SPSS中方差齐性检验需每个单元格的观测点至少在3个才能进行。(三)实验设计模型及其假设:3种模型实验处理不一样。1.固定效应实验设计模型:实验设计中包含了所有研究者感兴趣、要得出推论的有关的处理水平。如果重复实验,研究者会使用同样的处理水平。在这种情况下,实验所得的结论仅限于实验设计中包含的几个水平。自变量水平由研究者根据理论假设确定的,可称自变量为固定因素。2.随机效应实验设计模型:实验中的处理水平是从更大的多个水平的总体中随机取样的,如果重复实验,研究者可能会抽样不同的处理水平。在这种情况下,实验所得结果推论到处理水平意外的更大总体。自变量水平是从一组可能的自变量水平中随机取样的,也可称自变量为随机因素。3.混合模型:既包含股的固定因素又包含随机因素的实验设计。(四)多重比较:当发现实验处理主效应显著时要进行多重比较,看究竟是哪些组间存在差异。1.每个比较的错误率和实验的错误率:如果选择控制Ⅰ型错误的水平为ɑ,那么每进行一次比较会犯一次ɑ水平的错误,这就是每个比较的错误率,记为αPC;将这些每个比较的错误率进行某种方式的累加就会得出整个实验的错误率,记为αEW。当多重比较之间是独立的时,αEW=1−(1−αPC)c,c为独立比较次数。因此,为实验错误率αEW不大于界定的ɑ水平如0.05,就可以令αEW=0.05,然后求出αPC的值,再进行多重比较的时候用求出αPC值作为临界标准。要保持实验的总错误率在ɑ水平内,一是减少比较的数量,另一个是减少每个比较的错误率。2.多重比较的种类:(1)计划的或事先比较:比较的确定基于理论或前人经验的,是在实验数据收集之前确定的。对比分析是事先比较的重要分析工具(用t检验),比方差分析更优越。主要是通过设置需要比较的因素的权重系数,只要总权重等于0。一般需要比较的因素权重系数符号正负不同。如比较A1和A2的差异,设置A1为-1,A2为1。当要比较的A1与A2及A1与A3的差异,可以甚至A1为-2,A2和A3都为1。这些均可在SPSS中实现。①非正交比较:研究者要比较的两个问题是不相互独立的。②正交比较:研究者要比较的两个问题是相互独立的,优点在于不受其它问题的影响,且用最小的数量的对比抽取最大的有用信息。▲趋势分析:在正交比较中,可以探察实验处理效应为线性还是非线性的,以保证结论的正确性。如果随着自变量水平的增加,处理效应平均数稳定地上升或下降的现象称为线性变化,如果随着自变量水平的增加,处理效应平均数的变化时多方向的,则是非线性的。(2)无计划的事后的非正交比较:事后比较都是非正交比较,比较之间不可能独立,指实验数据收集后,并看到结果之后确定要进行的比较,实验者在实验实施之前没有特殊的假设。事后比较容易使实验错误率随着比较的数量增加而增加。①LSD检验(最小显著差异检验):对实验错误率不加任何控制,将每个比较的错误率和实验错误率等同起来,忽略理解错误。