0目录前言................................................................................................错误!未定义书签。第一章、试题反应理论的概念与发展........................................错误!未定义书签。第一节试题反应理论的基本概念....................................错误!未定义书签。第二节试题反应理论与古典测验理论的比较................错误!未定义书签。1.模式特性:.................................................................................................42.试题参数特性.............................................................................................53.能力与分数量尺特性.................................................................................54.测量精准度.................................................................................................65.应用.............................................................................................................7第三节常见的IRT模式...................................................错误!未定义书签。(一)二元计分模式.........................................................错误!未定义书签。(二)多元计分模式.........................................................错误!未定义书签。第四节IRT的基本假设....................................................错误!未定义书签。1.单向度.......................................................................................................172.局部独立性...............................................................................................18第五节当代IRT的发展...................................................错误!未定义书签。第六节IRT的应用............................................................错误!未定义书签。1.编制测验(量表)........................................................................................202.测验等化(equating)..................................................................................213.建立题库...................................................................................................224.组合测验...................................................................................................225.发展计算机化适性测验...........................................................................23第二章、IRT在测验编制上的应用............................................错误!未定义书签。第ㄧ节测验(量表)设计原理.............................................错误!未定义书签。1.测量模式的概念.......................................................................................24第二节选择模式................................................................错误!未定义书签。第三节估计受试者程度值................................................错误!未定义书签。1.最大概似估计法.......................................................................................302.最大后验估计法.......................................................................................303.期望后验估计法.......................................................................................31第四节试题分析................................................................错误!未定义书签。第五节测验讯息量与测量标准误....................................错误!未定义书签。第六节检视资料的符合性................................................错误!未定义书签。一、基本假设的检定............................................................错误!未定义书签。1.单向度.......................................................................................................362.局部独立性...............................................................................................381第七节以IRT编制测验的实例.......................................错误!未定义书签。ㄧ、能力测验的编制....................................................错误!未定义书签。2前言试题反应理论(IRT)是测验领域中较新的技术,它已经被应用在教育、心理、医疗等相关领域中,如国中基本学力测验、托福、GRE、GMAT考试,以及国外的一些人格量表与医学相关量表的编制。当代著名的计算机化适性测验(CAT)也必须仰赖IRT的理论与技术才能运作。本次工作坊的主要内容是以介绍IRT的概念与实务应用为主,上午的课程是先对IRT做基础概念的介绍,接着以生活质量量表与国中基本学力测验的发展为例,介绍IRT的基础应用,并有实际数据让学员上机操作,对于有量表发展需求者而言相当实用。下午是IRT的进阶课程,介绍IRT在多向度测验及计算机化适性测验上的应用,对于有兴趣发展人格量表、多元性向测验等多向度测验,或是想发展计算机化适性测验的人而言是很适合的课程。3第一章、试题反应理论的概念与发展第一节试题反应理论的基本概念试题反应理论(itemresponsetheory;IRT)主要是用来描述试题特性(难度、鉴别度、猜测度)与受测者的能力(潜在特质)如何影响其答题反应的一种数学模式。最简单的IRT模式如下列公式(1)所示(Rasch,1960):)()(1ijijbbijeeP,(1)其中j为考生j的能力,bi是试题i的难度,而Pij是受测者答对某个题目标机率。在IRT的模式中,受试者在某个题目上的答对机率是同时受到受试者能力与试题难易度所影响;而受试者在测验上的整体表现就是各题目答对机率的联合机率。藉由这个数学模式与联合机率的概念,我们就能根据受试者在各个题目上的答题反应来估计受试者的能力以及题目的难易度,并且让接受不同题目的受试者其能力可以互相比较。IRT其实是许多试题反应模式的总称,当代已经有许多IRT模式分别适用在许多不同的测验情境中。常见的IRT模式可以根据其所包含的试题参数数目来分,分为单参数的Rasch模式、二参数模式与三参数模式(Birnbaum,1968)。也可以依据计分型态来分,分成二元计分(Dichotomous)与多元计分(polytomous)模式;或是依据适用的作答方式来分,分成评定量尺(ratingscale)模式、部分计分(partialcredit)模式、名义量尺(nominalscale)模式等。第二节试题反应理论与古典测验理论的比较4试题反应理论与传统测验理论(classicaltesttheory;CTT)的比较见表1-1所示(Embretson&Reise,2000;Hambleton&Swaminathan,1986)。大致可以从模式特性、试题参数特性、能力与分数量尺特性、测量精准度与应用等几个层面来看。1.模式特性:IRT的模式是针对单一试题的作答反应所提出的数学模式,在其模式中同时考虑了受试者能力与试题特性对答对机率的影响,所以它是一种直接描述作答行为的模式。此外,IRT其实是许多试题反应模式的总称,这些IRT模式是分别依据各种不同计分方式与不同作答方式的测验情境所发展出来的。表1-1试题反应理论与传统测验理论的比较试题反应理论传统测验理论模式特性1.针对单一试题的作答反应所提出的数学模式。2.现有各种不同的IRT模式,适用于不同计分方式与作答方式的测验中。1.针对测验总分所提出的数学模式。2.各种不同计分方式与作答方式的测验都使用同一套模式。试题参数特性题目特性(参数)的估计不会受到试者能力所影响。题目特性(参数)的估计会受到试者能力所影响。能力与分数量尺特性1.对受试者的能力估计不会受到题目特性所影响。2.根据IRT模式与概似函数估计受试者最有可能的程度值,有比较强的数学理论基础。3.可以直接参照题目的特性来解释分数,也可发展出一套参照标准(常模参照或标准参照)来解释分数。4.用某些IRT模式可算出等距量尺。1.对受试者的能力估计会受到题目特性所影响。2.根据各题目的配分直接加总所得的分数,间接推测出受试者的程度值,较缺乏数学理论基础。3.通常需要额外发展出一套参照标准(常模参照或标准参照),才能解释测验分数的意义。4.当群体的分数完全符合常态分布时,才能转换出等距量尺。测量精准度(信度)测量精确度的评估是以题目为单位来计算再加总起来,因此受试者的