心理学研究数据类型与统计方法——谈函数型数据分析的引入

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

心理科学进展2010,Vol.18,No.8,1314–1320AdvancesinPsychologicalScience1314心理学研究数据类型与统计方法——谈函数型数据分析的引入焦璨1,2熊敏平1张敏强1(1华南师范大学心理应用研究中心,广州510631)(2深圳大学师范学院心理学系,深圳518000)摘要心理学研究数据大致分为截面数据、时间序列数据和面板数据,三种数据类型的分析方法及使用前提因数据属性不同而有所不同。心理学截面数据的统计方法过于依赖模型的线性结构和假设条件等,在处理心理学面板数据中难以充分发挥统计方法的功用。函数型数据分析方法主要适用于面板数据处理,特别适宜ERP、fMRI、发展心理等心理实验中存在时间序列的面板数据的统计分析,为心理学研究提供了有力的新工具。关键词心理研究方法;截面数据;时间序列数据;面板数据;函数型数据分析分类号B841.21引言对心理学而言,研究方法特别是统计技术的进步,能够在更深入、更广泛的层面上对心理研究所获得的数据资料做进一步的挖掘,从而让研究者能够更加深入、客观地了解研究对象的本质及变化过程,进而起到推动整个学科发展的作用。心理学的研究对象常常是某一特定的群体、个体的一些心理特征。显然,要从群体或个体中总结或归纳出某些心理特征,除了要做好实验设计,恰当地应用调查、测量方法外,用不同的方法对数据作分析,也会得到不同深度的结果。由于心理研究中各种数据的获取,大多数是用间接测量的方法,因而,心理研究的量化水平相对于数学、物理等自然科学而言较低,因而凸显了统计方法在心理研究中的应用的重要性。应该说,统计理论与方法本身也是在心理学研究需要的推动下不断发展的,从传统的推断统计方法到因素分析、多元回归分析、路径分析,再到结构方程模型、多层线性模型、以及本文讨论的函数型数据分析(FunctionalDataAnalysis,FDA),其每一阶段的发展无不反映出心理学研究需要推动的烙印。收稿日期:2009-12-28*广东省自然科学基金(9151063101000002)、教育部人文社科基地重点项目(2009JJDXLX006)、广东省哲学社会科学“十一五”规划课题(09sxlq001)的资助。通讯作者:张敏强,E-mail:zhangmq1117@yahoo.com.cn显然,在计算方法、计算速度已得到充分发展的今天,统计方法因为计算繁杂的困难已经不再是方法应用的障碍。而心理科学的发展,则对方法的应用提出了更高的要求,要求方法应更为细致地刻画研究事物的本质。比如,发展心理学研究中不同阶段的各种测试数据、ERP、fMRI实验中不同刺激或激活的表现或变化等等,都迫切需要寻求新一代的数据分析或统计分析方法、提升或改进传统的统计分析方法,以满足研究的需要。本文拟从计量数据类型的分类(白仲林,2007)为介入点,将心理学研究数据分为截面数据(Cross-sectionalData)、时间序列数据(Time-seriesData)和面板数据(Paneldata),根据不同的数据类型分别介绍相对应的数据分析方法并作出述评,重点介绍函数型数据分析在心理研究中的应用、发展的可能性、必要性及其数理基础。2截面数据的分析方法在心理实验中,实验组的结果往往需要与控制组或对照组进行比较,才能揭示自变量的效果。这种数据在心理学中尤为常见。截面数据也称横截面数据(Charach,Cao,Schachar,&To,2006)是指在某一固定时间点上收集到得N个不同对象的数据,但它是一维数据。2.1截面数据分析方法述评心理研究中的截面数据分析方法基本上都第18卷第8期心理学研究数据类型与统计方法——谈函数型数据分析的引入-1315-是采用我们熟知的统计方法:描述统计、推断统计以及多元统计方法,这是现阶段心理研究中应用比较广泛的统计方法。国内有学者通过调查、分析近11年(1998~2008)国内昀具代表性的两种杂志《心理学报》、《心理科学》中应用了统计方法所发表的论文或研究报告发现,两种杂志发表的论文较多地使用了简单的描述及推断统计方法,各年份均占总方法数的80%及以上,而较为复杂的多元统计方法的使用比例相对较少(焦璨,2009)。不同的统计方法有不同的应用假设前提条件,当所应用的统计方法前提条件没有得到适当的满足时,统计分析的结果可能会被“扭曲”。传统的描述统计、推断统计方法、多元统计方法虽然倍受心理研究者的青睐,但是这些方法在应用中昀主要的问题是:在前提条件不满足的情况下,由部分推知全体,“显著性差异”的实验结果可能只限于当前样本有效,而不具备可重复性。同时,这些方法应用的前提条件是强假设,如正态性、独立性等,在许多情形下难以全部满足。而未能满足假设前提时,“显著性差异”可能来自分布的影响(焦璨,2009)。心理学文献中,很多的研究只是呈现结果是否差异显著,研究者常常因为“显著性差异”而欢喜。所以,该项研究指出《心理科学》、《心理学报》两种杂志近11年来的文章对应用统计方法的前提条件进行检验的仅占3%。由于长期以来的惯性使用,目前心理学发表的研究论文,绝大部分文章都没有向读者提供实验中使用假设检验方法时应有的其他重要信息(如前提条件检验、效果量等)。因此,这些常用的统计分析方法的应用还有很大的改进空间。2.2截面数据分析方法的进展心理与教育实验研究的目的是探讨因变量与自变量之间的关系。在研究变量之间的关系时,相关、回归分析和路径分析等是常用的统计方法,但是使用这些方法时,常难以保证数据的测量误差很小或者没有误差。因此,20世纪70年代,心理研究方法引入了结构方程模型,至20世纪90年代,该方法在心理学研究中得到了越来越广泛的应用。结构方程模型是回归分析、路径分析的拓展与延伸,是在已有的回归分析等理论基础之上,用线性方程系统表示该理论的一种统计分析方法。结构方程引入心理学研究中,使心理研究在多个因素多个水平的研究中,不仅可以知道差异的显著性,还可以分析得到自变量从哪一个方向、以何种程度对因变量产生了影响以及测量误差的大小。结构方程模型属于一种理论驱动模型,是一种从统计的角度建构理论模型的参数化研究方法。但理论驱动模型有其局限性,包括难于合并交互影响和进行非线性分析,不能处理定性数据和缺失数据,尤其是很难满足其对多元正态的要求。如果没有量化的变量,无法应用。但目前很少有文章对这些问题进行研究和分析(赵海峰,万迪窻,2003)。贾新明和刘亮(2008)亦指出结构方程模型虽然直接处理测量误差,但是再优良的结构方程模型也难以弥补研究设计方面的误差,比如调查问卷设计、抽样和调查等方面的误差。近年来,结构方程模型在心理学领域的应用,为许多心理研究提供了实证的方法,获得了较多的研究成果。但是任何方法都会有不足之处,进一步的发展和完善结构方程在心理研究中的应用是一个努力的方向。3时间序列数据的分析方法心理研究常需作追踪研究。比如,在发展心理学中研究儿童语言能力的发展,究竟是哪一个年龄(岁)的某月份是孩子语言发展昀迅速的时间段,是否有语言学习年龄期间昀优期,类似的研究还包括记忆能力、数学能力等。这些都需要心理研究者在固定的等距月份,比如,每个月对儿童的语言能力发展情况进行测试、记录,这时在每个月就可以得到所有被试儿童的一组截面数据。单一的截面数据并不能反映儿童的发展趋势,多个截面数据则组成了时间序列数据,即对同一对象在一系列按时间序列排列的观测点上所得到的数据,时间序列数据也是一维数据。将多个截面数据反映的心理变化、学习能力等连接在一起,进而研究这些心理现象发生发展的内部动力机制,找出它们发展的内部规律,这就是纵向研究。从心理学应用纵向研究方法的进展来看,逐渐由以往的只注重总体平均趋势的发展过渡到既考虑总体平均趋势又注重个体发展差异的系统分析的问题。但是时间序列数据收集困难,更为考验研究者的毅力及忍耐力。如果严格按照随机取样的方法及长时间的跟踪分析,无疑时间序列数据的分析结果将比截面数据的结果更具说服力。-1316-心理科学进展2010年3.1时间序列数据统计分析方法述评重复测量方差分析、多元回归分析和时间序列分析是处理时间序列数据的方法,主要是解决总体平均发展趋势的问题。重复测量方差分析和多元回归分析都是以方差齐性和随机误差独立性为前提假设,并且重复测量方差分析不能处理依时间变化的协变量对因变量的影响(刘红云,孟庆茂,2003)。时间序列分析能比较个体间心理特征发生发展的趋势,确定动态变化变量间的因果关系,还可以实现对人类心理和行为的预测和控制。由于心理学的研究对象是内隐的,且会随着时间发生变化,因此,基于小样本理论的时间序列分析在心理学研究中应该有其用武之地。时间序列分析的方法引入到心理学领域始于20世纪末,主要用于心理动力学、管理心理学、社会及家庭心理、心理治疗的时间序列数据分析中。目前,研究方法工作者还尝试将其用到神经网络学习过程、功能磁共振成像、认知心理学等领域。时间序列分析的方法在心理学研究中的应用所涉及的领域日趋广泛,内容也越来越丰富,推动了心理学各种理论和研究方法的发展。但是由于时间序列分析的数学要求较高,需要长时间坚持不懈的施测和记录,对于习惯单个研究或者单个实验的研究者而言,操作甚是不便,也是一种挑战。3.2时间序列数据统计分析方法的进展近年发展的多层线性模型、潜变量增长模型、潜变量混合增长模型是时间序列数据分析常用的方法。这些方法除了能对总体平均增长趋势进行分析外,同时注重个体发展趋势之间的差异(刘红云,2007)。多层线性模型是用于分析具有嵌套结构特点数据的一种统计分析技术,近年来在教育、管理等领域有相当广泛的应用。与传统统计技术相比,多层线性模型具有以下优势:不需要方差齐性和随机误差独立性为前提假设;允许缺失值的存在;允许不同时间间隔;允许研究者在不同层面提出不同假设(盖笑松,张向葵,2005)。葛建军(2004)亦分析了中国目前对分层数据研究的现状:研究者不能分清问题的数据是不是分层的结构;研究中要求样本中的层次分明且要获取每一层的样本,增加了心理研究的难度。经费开支增大,以致齐全的分层数据不易获得;多层线性模型分析结果与现实大相径庭等。由此可见,多层线性模型有优点也有缺点,心理研究者在纵向研究中可以充分利用多层线性模型的优势,提高纵向研究的质量。同时,还要注意多层线性模型存在的不足,慎重对待其研究结果。潜变量增长曲线模型适用于在某几个固定时间点上观测得到的纵向研究数据,是基于协方差结构模型的理论。潜变量增长曲线模型需要非常大的样本容量,而且要求所有个体的测试时间间隔相同,如果个体的变化随时间变化趋势不是很明显,则与传统方法相比没有明显趋势(刘红云等(人),2003)。在总体同质的情形下,多层线性模型和潜变量增长曲线模型为解决时间序列数据提供了有效的方法。但是如果所研究的总体本身不同质,就需要一种能够描述总体中不同质子总体的不同发展特点的方法。为了满足这一实际需要,近年来一种被称之为潜变量混合增长模型的分析技术应运而生,潜变量混合增长模型为分析个体之间发展变化的差异提供了更加合理有效的工具,尤其是在探索总体中是否有不同潜在变化类别存在的情景下,具有一般追踪研究方法无法比拟的优势(刘红云,2007)。4面板数据的分析方法面板数据从20世纪90年代出现,Finkel(1995)定义了面板数据是指N个不同对象在一系列按时间序列排列的观测点上所得到的数据,属于二维数据。从定义可以看出面板数据也可称作时间序列截面数据或混合数据,例如,对政府工作满意度的调查研究中,有月调查,年调查等。与一般的截面设计相比,面板设计具有很多的优点。因为建立了因果过程的时间维度,使之具有更强的因果推理属性(Finkel,1995)。这时,仅仅依靠原有的统计方法已经不能满足数据分析的需要,与其他数学方法相结合成了一条解决问题的必由之路。4.1面板数据分析方法评述传统面板数据的处理方法一般分为静态模型和动态模型。面板数据的静态模型主要有两类:固定效应模型(FixedEffectModel)和随机效应模型(RandomEffectM

1 / 7
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功