PISA与TIMSS中有关数学评价的比较分析_刘晓玫PISA与TIMSS中有关数学评价的比较分析刘晓玫1,陈娟2(1.东北师范大学教育科学学院,吉林长春130024;2.福州十一中学,福建福州350001)[摘要]PISA与TIMSS是近年来较为活跃的两个国际评价项目,它们在评价的目的、使用的评价框架以及试题的形式等方面有所不同,但其中又包含一定的相似的成分,对二者异同的分析将有助于我们进一步认识数学课程实施及数学素养评价的要素和关键。[关键词]PISA;TIMSS;国际评价;数学素养;数学课程[中图分类号]G40-058.1[文献标识码]A[文章编号]1006-7469(2007)02-0077-04[收稿日期]2006-10-25[作者简介]刘晓玫(1962-),女,辽宁沈阳人,东北师范大学教育科学学院博士生,首都师范大学数学科学学院副教授;陈娟(1982-),女,福建福州人,福州十一中学教师。2007年第2期外国教育研究No.2,2007第34卷总第200期StudiesinForeignEducationVol.34GeneralNo.200PISA(TheOECDProgrameforInternationalStu-dentAssessment)与TIMSS(TheTrendsinInterna-tionalMathematicsandScienceStudy)是近年来较为活跃的两个国际评价项目,它们分别吸引了数十个国家的参与,因而有着广泛的国际影响,其评价理念、评价指标和内容受到世界各国的重视。我国虽然没有参加这两项国际测评,但国内已有一些文章分别对它们的情况进行了评介。那么,两项国际评价项目的关注点有哪些不同呢?各自的特点又体现在哪些方面呢?本文拟就两者的总体上的异同以及在数学评价方面的差异进行分析比较,以便对数学课程及学生数学学习评价进行进一步思考。TIMSS是继FIMS、SIMS之后国际教育成就评估协会(IEA)于1995年启动的另一项国际评价,由其名称即知它是针对数学和科学两个知识领域进行评价研究的。TIMSS每4年一轮,2003年进行的一轮评价,共有49个国家与地区的4年级和8年级(分别以9岁和13岁为主)的学生参与评价。TIMSS作为有史以来最大的一项国际比较研究,其意义远远超出了传统意义上的成就测试。PISA创立于1997年,是由OECD成员国政府所致力于的一项在共同的国际框架下进行的评价,它主要以15岁学生的成绩来检测教育系统的结果。PISA的评价内容主要关注阅读、数学和科学三个知识领域,每3年进行一轮,每一轮都有一个“主”领域,首轮于2000年启动。2003年进行的第二轮评价以数学领域为主,共有42个国家和地区参与,包括中国的.和澳门地区。这两个国际性评价项目在某些方面有相似之处,如都对数学、科学进行评价,都采取“纸笔测验”和“背景问卷”相结合的评价方式,都把题型分为两大类———多项选择题(multiple-choice)和问答题(constructed-response)。但是应该提及的是,二者在评价的目的上是迥然不同的———PISA侧重的是描述教育的“产出”(the“yield”educationsystems),而TIMSS着重考察的则是各国的课程成绩(curriculumachievement)。同时,在考察对象年龄的不同上也体现了这一点。PISA的研究认为,15岁年龄段的学生正临近于初中教育的结束阶段,他们所掌握的知识和技能的程度将影响着他们的未来或进一步的深造,正是基于此,所考察的知识和技能不能只局限于学校课程,而应该是学生在未来生活中所必需的。相对而言,TIMSS所考察的则是各国课程中的共同部分,用以界定各国适合参评的年级,对年龄的界线就比较模糊。具体在各个领域中,二者也都体现出一定的差异。下面将着重在“数学”这个二者共有的评价领域内进行比较分析,以期能使读者对二者的数学评价有一个比较清晰的认识。一、对数学评价的基本理解PISA是建立在对“literacy”的评价之上的。Lit-eracy原意为“读写能力”,PISA借用了.文化学(soci-cultural)的研究将其理解为“人类对语言的使用”,同时认为,一个人精通某门语言意味着他必须知道这门语言的语义背景并能使其发挥不同的.功用。在这个层面上我们就可以更好地理解PISA对数学素养(mathematicalliteracy)的界定:“数学素养是个体作为一个有创新精神、关心他人及有思想的公民所应具有的数学能力:能判断和理解数学在现实世界中的作用;能运用数学做出有充分根据的决策;能在个体生活需要时使用和渗透数学。”[1]在这里,PISA不是简单地停留于关注学生对数学知识的掌握及对技能的运用,而是希望个体在把握数学知识和技能的基础上,创造性地将其运用于各种情形中,以获得一种精神和方法,并适应未来生活的需要。在上述界定中,PISA对其中的一些名词作了阐释,如“现实世界”是指个体所处的自然、.和文化背景。正如弗洛伊丹塞尔(Freudenthal)于1983年所指出的:“我们的数学概念、结构和思想是作为一种用来组织物理、.和精神世界的工具而发明的。”而“使用和渗透”不仅指运用数学及解决数学问题,还包括广泛的个体参与,如交流、涉及、评价甚至是欣赏和享受数学。“个体生活”包括私人生活、职业生活及与同伴、亲属和作为社区一分子的.生活。此外,PISA还指出,虽然与数学有关的态度、情感等不在数学素养的界定和评价范围内,但是与数学素养也是重要相关的。而在TIMSS中则只是将数学框定为学校数学课程中的数学。数学之所以被IEA选为研究的第一个领域,不仅因为它是每一个国家的核心课程,且大多数国家都在进行有关科学和技术教育改革的项目,而作为它们的基础的则是数学的学习。此外,IEA也认为,从逻辑上看,数学也是一门在不同国家背景下最容易达成一致的学科。二、数学评价的框架和内容由于PISA将数学作为一门“语言”来界定,因此,数学这门“语言”有着它自己内在的设计特征(de-signfeature),如数学术语、数学符号和记号、数学运算的程序和技能等。此外还有它的.功能(func-tions),如在不同的环境下运用各种数学思想去解决非常规问题(non-routineproblem)。而这两个方面则支撑起了数学评价的框架。至于TIMSS在这方面则没有明确地提出。基于其评价的目的及IEA对所评价的数学的界定,我们可以认为,数学评价的框架基础是对各国数学课程的分析,也就是说,通过分析各国的数学课程的内容及其他要素,来确定对学生进行测试的标准和内容。为了尽可能地保证将评价的重点放在大多数国家共同的核心课程上,TIMSS将课程分为三类来进行把握,即期望课程(Intendedcurriculum)、实施课程(Im-plementedcurriculum)和获得课程(Attainedcurricu-lum)。根据期望课程列出测试所包含的所有数学分支的详细情况;实施课程则收集了大量的有关教师信念、态度和实践的信息;利用测试进行成就测验来考察获得课程的情况。在PISA项目中,数学领域的组织(organizationofdomain)包含三个部分,即“数学素养”的三个维度:1)数学内容,包括四个“总体思想”(overarchingideas);2)数学过程,主要指总体的数学能力,包括使用数学语言、建模和问题解决技能;3)数学运用,即在个人的、教育的或职业的、公共的和科学的诸多方面运用数学。分析地看,PISA是在“运用数学的情况”下,对“数学内容”和“数学过程中的能力”进行考察。这与TIMSS中提及的两个维度———内容和认知相类似(见表1)。从表1中可以看出,在内容与内容的比较上,PISA与TIMSS仍各自沿承了两者的评价目的。PISA是总体数学思想指导下的数学评价。它首先用现象学的研究方式将数学考虑为四个指导思想,提供一副“数学眼镜”去看数学课程;其次才考虑相关的数学课程分支,如数、代数、几何等,而这些却是TIMSS所考察的内容。在TIMSS中,这些具体的分支又被细化成许多“主题块”(topicareas),如代数被划分为模式(Patterns)、代数表达式(Algebraexpressions)、方程与公式(Equationsandformulas)和关系(Relation-ships)这四个部分。其次,PISA中的数学过程和TIMSS中的数学认知在提法上似乎无法进行比较。PISA中的数学过程指的是“数学化”(mathematization),是学生解决现实生活中的问题的基本过程,这一过程需要学生的数学能力。PISA于2003年在总结尼斯(Niss)等人的研究的基础上提出了8大数学能力,并认为无论在解决任何问题时都有若干个能力共同起作用,人为地?78?外国教育研究2007年第2期No.2,2007刘晓玫,等:PISA与TIMSS中有关数学评价的比较分析?79?将这些能力进行分开评价是无意义的。同时,为了便于理解和评价,在结合各种认知需求(cognitivede-mands)的基础上,PISA提出了表中的三大能力群。这三大能力群中都包含了对8大能力的评价,只是难易程度不同。对技能和能力(skillsandabilities)的描述则构成了TIMSS中的认知领域的界定,而且对每个领域的评价也是在内容中展开的,此外,在TIMSS框架后,还提及了数学地交流(communicatingmathe-matically)是各项评价的基础。事实上笔者认为,PISA中的数学过程和TIMSS中的数学认知在某种程度上是统一的。PISA中数学过程的出发点是依照认知需求将能力所划分成的三大能力群;而TIMSS中对数学认知的评价也同样要借助于学生的技能和能力的表现。二者之所以有提法的不同,一个重要的原因还在于评价目的的不同。PISA评价的是15岁学生的素养,又带有课程外拓展的性质,对数学能力的要求自然就比TIMSS中对9岁和13岁的学生在不能太游离于各国课程外的能力评价的要求要高。三、数学测试问题的类型及特点PISA与TIMSS的数学测试在题型、时间安排及题目的组织形式上也有所不同。就题型而言,PISA和TIMSS都是由选择题和问答题构成,但比例略有不同,PISA中二者之比为1∶2,TIMSS中二者的比例则相反。需要提及的是,PISA中的问答题还分为开放题和封闭题两种形式,其中封闭题主要指答案是确定的、惟一的,因此评价时的分数也是惟一的;而开放题是指答案有几种可能,而且分数也定为不同的等级。TIMSS中试题也类似。在题目的组织形式上,PISA倾向于将有着一些相关刺激材料(即带有背景的条件)的题目放在一起构成一个小单元(aunit),以逐渐加深问题的复杂程度,全面考察各个技能群。这样不仅使题目更真切地体现现实生活的复杂性,也减少了学生解决问题时逐一“进入状态”所花的时间。TIMSS则没有如此划分,而是依据各个“主题块”下的各个部分自成一题。正因为如此,PISA所提的问题也更多不是知识的简单再现,而是知识的综合运用。以下将通过一个例子对PISA与TIMSS的区别进行分析。某PISA试题为:苹果树(此内容隶属“变化与联系”)。问题以一个农民在种植苹果树的同时,为了使苹果树免遭风的侵袭,就在果园的四周种上针叶树为背景(见图1),于是提出了如下三个问题。第一,完成一个表格,分别写出n=1、2、3、4时的苹果树和针叶树数量。第二,按以上方法排列的苹果树和针叶树数量可利用公式计算:苹果树数量=n2;针叶树数量=8n(n代表苹果树的行数),问当n为何值时两种树的数量相同?求出n并写出计算过程。第三,若该农民想多种些树来扩大果园规模,问哪种树的数量增长得更快些?并解释你的答案[2]。可以看出,在这个关于“变化与关系”的单元中,我们所列举的这个问题既包含了关于刻画一个事物变化规律的模式的探讨,也包含了模式之间关系的比较分析,但TIMSS的呈现方式却不同,它将模式和关系的考察独立起来。例如,它在类似于上面的PISA的试题