心理科学进展2010,Vol.18,No.1,170–176AdvancesinPsychologicalScience170人员选拔中人格问卷可用性之争李永瑞(北京师范大学管理学院,北京100875)摘要个性调查问卷旨在通过一系列专门设计问题的施测结果来预测候选人的工作绩效。以往的研究由于对工作绩效内涵及对应参照效标的界定、问题设计的逻辑基础等方面存在各自的局限,一直以来对个性调查问卷的有效性存在分歧。文章对此进行了全面综述与分析,并提出了从平衡计分卡四个维度定义工作绩效参照效标,采用内嵌并纵贯模式跟踪候选人工作绩效参照效标,应是检验并提升个性调查问卷预测效度值得探索的研究方向。关键词个性调查问卷;预测效度;平衡计分卡;内嵌并纵贯模式分类号B841;B849:C931引言个性调查问卷作为个性测试的一种重要工具,因其省时、经济等特点,在人员选拔等诸多领域中已得到了广泛应用,但其有效性一直倍受质疑。1965年,Guion和Gottier(1965)对1952~1963年间发表在《PersonnelPsychology》和《JournalofAppliedPsychology》两本权威学术期刊上有关“个性测试在人员选拔中的应用”相关主题文章进行了全面综述,认为“在多数情况下,以个性调查问卷结果作为人事决策的依据是不值得提倡的”。受此影响,该专题相关研究在主流学术期刊上沉寂了长达25余年之久。直到1991年,Barrick和Mount(1991),Tett,Jackson和Rothstein(1991)对人员选拔中个性测试的效度所作的元分析的专题报告发表后,这种局面才有所转变。他们的研究报告指出,尽管个性调查问卷的表面效度确实不高,但从元分析的角度对其进行矫正后,其科学性还是可以保证它在人员选拔中继续使用。这种观点随后得到Kanfer,Ackerman,Murtha和Goff(1995)等人的首肯。自此以后,个性测试在人员选拔中的应用相关主题研究在工业与组织心理学领域逐渐回暖,并渐呈井喷状。以1985~2005年间发表在上述两本权威学术杂志上的文章,以及每年在美国工业与组织心理学协会年会上报告的相关主题文章收稿日期:2009-05-26通讯作者:李永瑞,E-mail:liyongrui@bnu.edu.cn数量为例:在Kanfer等人(1995)文章发表前的第一个五年里,每年(1985~1990)发表或报告的文章多在1篇左右;在第二个五年(1991~1995)期间,该专题渐受青睐,每年发表或报告的文章数量多在5~10篇之间;而在Kanfer等人(1995)文章发表之后的第三、四个五年(1996年~2005年)间,每年发表或报告文章的平均数量均超过30篇。这种欣欣向荣的局面在2007年又再度出现了重大转折。起因于美国工业与组织心理学会2004年年会上专门组织的一场“个性测试中的作假行为”的专题讨论。参与讨论的Murphy,Campion等人认为,比作假行为更值得关注的是个性调查问卷预测效度一直偏低的问题。Campion就认知能力(基于13份元分析报告)和个性测试(基于12份元分析报告)对工作熟练性和培训效标的预测效度进行了比较(见表1)。结果发现,认知能力测试对工作熟练性与培训效标的原始(矫正)预测效度分别为0.20(0.40)和0.38(0.62),而个性测试仅为0.10(0.18)和0.11(0.23)。这与42年前Guion和Gottier(1965)报告的0.09,16年前Barrick和Mount(1991)报告的大五人格维度中昀高的0.13并没有根本性的变化。基于这些实证数据,与会的上述两本权威学术期刊在任与曾任的七位主编中的六位,在2007年《PersonnelPsychology》秋季号上联合发表论文声称“个性调查问卷对工作绩效的预测效度非常低,在人员选拔等高风险决策中要谨慎使用(Morgesonetal.,2007b)。”第18卷第1期人员选拔中人格问卷可用性之争-171-表1认知能力和个性测试元分析预测效度估计比较工作熟练性培训效标测试工具原始效度平均值矫正效度平均值原始效度平均值矫正效度平均值认知能力测试0.200.400.380.62个性测试0.100.180.110.23资料来源:根据Morgesonetal.,(2007b)整理在紧随其后的冬季号上,连续发表了三篇文章,其中前两篇(Tett&Christiansen,2007;Onesetal.,2007))分别从不同角度对Morgeson(2007b)等人的观点进行了反驳。Tett和Christiansen(2007)的报告指出,基于工作分析技术并对特质与绩效之间的双向关系给予充分考虑的验证性研究的元分析报告表明,大五人格等个性调查问卷的预测效度较为理想,原始(矫正)效度达到了0.26(0.38)。而Ones等人(2007)专门对大五人格量表及其相应维度对总体工作绩效、目标绩效、保持领先、保持一致、公民行为、利他主义、个人偏离、组织偏离、领导者脱颖而出、领导者有效性、变革型领导、培训绩效、企业家精神、团队绩效、目标设定、自我效能、工作满意度、生涯满意度等重要的组织行为变量的预测效度进行了全面回顾,结果发现效度系数多在0.20~0.50之间。报告还特别指出,综合使用诚实性测试与基于客户需求开发的量表,对工作绩效的预测效度较为理想(大多数研究报告预测性效度达到0.40以上)。因此,他们认为尽管个性调查问卷的效度不高,但经过统计处理后的个性调查问卷结果对候选人工作绩效还是具有相当的解释力,建议在人员选拔等高风险决策中继续使用个性调查问卷。后一篇为Morgeson(2007a)等人再度联手,“向那些在人员选拔中正使用个性调查问卷的人们提个醒,个性调查问卷存在着效度低等诸多问题”。Morgeson等人(2007a)认为,Tett和Christiansen(2007),Ones等人(2007)的回应与他们此前所提出的问题“要么没有关联,要么只擦了点边”。比如诸如Ones等人(2007)报告中所提到的生涯满意度、领导者脱颖而出等因变量,就不是Morgeson等人(2007a)所指的可观察到的工作熟练性效标。又如,Tett和Christiansen(2007)所提到的诸如使用基于工作分析并对特质与绩效之间的双向关系给予充分考虑等技术的应用,作为改善特质的总体绩效的方法可能更为合适,不能将其视为个性调查问卷预测效度偏低的理由。昀后他们语重心长地再度强化了他们的观点,“有相当多的证据表明,真实人员选拔背景下个性调查问卷预测效度非常低,甚至接近于零。”双方激烈争辩后,上述两本权威杂志上发表的个性测试与人员选拔相关主题文章,不仅在数量上从23篇(2006)、29篇(2007)骤减到16篇(2008),同时研究重心上也发生了本质的变化。在2008年发表的该主题相关的文章中,其中10篇对人员选拔中包括个性调查问卷在内的测试工具的效度进行了探索与验证(Karvitz,2008;Schmidtetal.,2008;VanIddekinge&Ployhart,2008;Moonetal.,2008;Komaretal.,2008;Mumfordetal.,2008;Lievensetal.,2008;Arthuretal.,2008;Meriacetal.,2008;Stewartetal.,2008)。另外6篇分别探讨了不同群体个性特征之间的差异(Foldesetal.,2008;Rothetal.,2008;Ohetal.,2008),以及不同个性特征对对离职行为、组织文化与领导绩效的影响(Zimmerman,2008;Andersonetal.,2008;Ngetal.,2008)。由此看来,个性调查问卷的预测效度能否足以保证它可继续用于人员选拔等高风险决策中,目前仍在不断探索之中。个性调查问卷何去何从?是很值得探讨的问题。2个性调查问卷预测效度的影响因素根据MarkCook(2007)的观点,在人员选拔中使用个性调查问卷,主要解决四个方面的问题:一是某项工作具有何种个性特征的候选人昀为匹配?二是同一岗位上绩效优秀者与绩效一般者在个性特征上昀本质的区别都有哪些?三是在实际工作中,特定个性特征在工作行为中如何体现?四是具有某些个性特征者在实际工作中应该怎样调整自己以保证更好的绩效产出?-172-心理科学进展2010年很显然,这四个问题本质上都是如何保证个性调查问题与岗位胜任特征需求昀大程度契合,从而保证个性调查问卷对工作绩效有效预测的问题。个性调查问卷旨在通过一系列专门设计的问题,要求候选人按照自己的真实感受或真实行为表现来诚实应答,并基于测试结果来预测候选人工作绩效。所以,个性调查问卷的预测效度不仅取决于“一系列专门设计的问题”与候选人真实工作情景中决定其工作绩效的胜任特征的契合度,还取决于个性调查实施过程中候选人应答问题时的诚实度。前者是“问正确的问题”,参照效标的界定与个性调查问题设计的逻辑假设,都是其昀重要的影响因素;后者要求“候选人诚实应答”,测试指导语、问题呈现方式、测试过程控制、问卷的设计版式、问题的不同提问方式、候选人所在行业的劳动力景气指数、个体的阅读理解能力等都对候选人应答时的作假动机、作假的可能性与现实性等具有重要影响(Hough&Oswald,2008)。本文拟对“问正确的问题”影响因素相关研究进行全面回顾,并在此基础上就如何验证并有效提升个性调查问卷的预测效度进行初步探索。2.1工作绩效参照效标的界定岗位胜任特征是个性调查问卷设计的逻辑起点。Spencer等人(1993)认为,胜任特征是指与参照效标有因果关联的个体的潜在特征,或者说是能将某一工作岗位上表现优秀者和表现一般者区分开来的个体潜在特征。因此,参照效标是候选人在工作场景中所实施的一系列的动作和行为的准则和标准,而决定这些动作和行为的方向与程度的个体潜在特征,就是岗位胜任特征,所以,工作绩效参照效标决定了个性调查问题的内容。参照效标不同,个性调查问卷的内容也就不同。按照Rotundo和Sackett(2002)的观点,工作绩效在结构上可分为任务绩效(taskperformance,指生产某种产品或提供某项服务核心技术的动作和行为)、公民绩效(citizenshipperformance,指促进组织目标实现的社会、组织和心理氛围的营造相关的动作和行为)和反生产绩效(counter-productiveperformance,指有损组织良性运营的动作和行为)。但对任务绩效、公民绩效、反生产绩效的具体内涵的界定,以及对应的参照效标的选择,不同研究人员由于研究视角不同,对其赋予了不同的内涵。对任务绩效,Murphy(1989)将其定义为圆满完成特定工作对应的职责和义务;Borman和Brush(1993)将其视为一种能有效促进组织技术核心(organization'stechnicalcore)形成的一系列活动;还有人(Welbourne,Johnson,&Erez,1998)将其定义为工作产出的质量和数量。对公民绩效,不同学者分别发现利他主义、责任心、礼貌性行为、公民美德(Organ,1988),融洽的人际关系(Murphy,1989),好消息的传播(George&Brief,1992),提建设性建议,认可、支持、捍卫组织目标(Borman&Motowidlo,1993),良好的人际交往氛围(Borman&Brush,1993),准确的组织角色定位(Welbourne,Johnson,&Erez,1998)等都能从不同角度、不同程度上改善组织运营的社会和心理氛围,进而促进组织目标的实现。反生产绩效与任务绩效、公民绩效一样,学术界对其内涵的界定也很不聚焦。诸如工厂停工检修期间员工破坏性或灾变性行为(Murphy,1989)、个人行为自律性(Campbell,McHenry,&Wise,1990),个人行为偏离、政治性欺骗、人身攻击、毁坏公物(Robinson&Bennett,1995),无组织