我国小学六年级学生学业成就调查报告中央教育科学研究所中小学生学业成就调查研究课题组*简介:本报告系国家哲学社会科学基金“十一五”规划(教育类)2006年度国家重点课题“中小学生学业成就调查研究”(课题批准号:AHA060008)的研究成果。本课题由基础教育研究中心、课程教学研究中心、教育督导评估研究中心等多个部门的研究人员参与研究。课题研究成果被全国教育科学规划办公室鉴定为优秀等级。一、调查背景近年来,关注教育质量、科学测评学生学业成就已成为世界教育发展的一大趋势。目前国际上比较有影响的学生学业成就调查主要是IEA和OECD开展的国际比较研究。此外,一些发达国家定期组织进行的本国学生学业成就调查,如美国的NAEP、英国的APU、日本的学力调查等都已形成独立的学业成就测评体系,在促进本国或区域教育质量提高方面发挥了独特作用。我国目前已开始重视和加强推进这方面的工作,并进行了一些较大范围的学生学业成就调查,如教育部基础教育质量监测中心的“基础教育质量监测”、北京市教委的“北京市义务教育教学质量监控与评价”以及联合国儿基会的“东亚太平洋地区学生学业评价”等。在世界各国普遍重视并探索和进行宏观教育质量监控的背景下,对我国义务教育小学阶段学生的学业成就状况进行调查,全面、客观、真实地了解和把握我国小学教育的质量,对于推动基础教育课程改革的深化、改进和提高教育教学水平、提高教育质量、促进教育公平和教育均衡发展具有非常重要的意义。二、调查内容与方法本次调查研究的主要内容是:(1)研制适合我国国情的小学六年级学生语文阅读、数学问题解决、科学、品德与社会四个学科学业成就评价的指标体系和测评工具;(2)在全国范围内进行小学六年级学生语文阅读、数学问题解决、科学、品德与社会学科学业成就水平的调查研究;(3)对影响小学六年级学生学业成就的相关因素进行分析,为学科教学和学生学习提供反馈,促进教学改进和学生学习的提高。*课题主持人:田慧生;核心成员:孙智昌、陈琴、刘芳、蔡永红、任春荣、胡军、陈晓东、杨莉娟、张鹏举、马晓强、马延伟、杨宝山、江明、冯新瑞、王晓霞、李嘉骏等。本次调查采用标准参照评价模式,以《全日制义务教育课程标准(实验稿)》为依据,根据SOLO分类理论关于学习结果的分类来编制语文、数学、科学、品德与社会四个学科的试卷。各学科均以《课程标准》中对学生在学科内容和基本能力两个维度的发展要求作为依据来确定评价的基本框架(见表1),编制各科试卷。各学科试题中体现学生单一结构、多元结构和关联结构的题目比例约为2∶2∶1。除四科试卷外,本次调查还进行了学生问卷和学校问卷的调查。表1小学六年级各学科评价的基本框架语文数学科学品德与社会内容维度字词句段篇章数与代数空间与图形统计与概率综合运用生命世界物质世界地球宇宙世界公民与社会健康与安全历史与文化地理与环境能力维度认读理解运用知识技能数学思考解决问题呈现应用探究认知理解运用本次调查采用分层随机抽样的方法从全国东中西部8省共31个区县抽取了18600名小学六年级学生,最终参与测试的学生为18226人。其中,城市学生占68.5%,农村学生占31.5%;男生占46.6%,女生占53.4%。每名学生都参加语文、数学、科学、品德与社会四个学科的测试。学生问卷的测试对象为所有参与学科测试的学生,学校问卷的测试对象为所有参与学科测试的学校,共372所。本次调查的施测时间为2009年5月。各科试卷和问卷的回收率均达到了90%以上。本次调查运用项目反应理论(IRT)计算试卷参数和学生能力参数。在项目反应理论指导下的整卷层面的质量分析以单维单参数计分模型(RASCH模型)为基础,对测试的质量进行分析。试卷分析的指标主要包括信度和效度、题目难度、区分度、题目特征参数等。调查结果显示,语文、数学、科学、品德与社会四门学科的测试都具有较好的信度和效度,各学科之间的相关系数也达到了非常显著的水平。各学科题目的难度分布较广,题目的区分度比较理想,各学科题目特征曲线的形态都符合项目反应理论(IRT)模型,表现出能力越高的学生,答对难度大题目的概率越高。本次调查依据学生对《课程标准》的掌握情况将学生分为优秀、良好、合格、基本合格和不合格五种水平。不合格水平是指学生未达到《课程标准》所规定的基本要求;基本合格水平是指学生基本掌握学科所要求的基本知识和基本技能,但在某些知识和技能方面仍有待提高;合格水平是指学生比较全面地掌握学科基本知识和基本技能,具有基本的学科能力;良好水平是指学生能综合运用所学知识和技能来分析和解决问题;优秀水平是指学生在良好水平的基础上能够创造性地思考和解决问题。三、学生各科学业成就状况分析(一)学生各科学业成就的总体状况1的要求调查结果表明,学生在语文、数学、科学、品德与社会四门学科的学习达到合格及以上水平的都超过了60%,而达到基本合格及以上水平的学生则都超过了90%,其中,数学、科学、品德与社会三门学科更是有95%以上的学生达到了基本合格及以上水平,不合格学生所占比例均不到10%。这表明,小学六年级学生在语文、数学、科学、品德与社会四门学科的学习都基本达到了《课程标准》的要求。2本次调查发现,在四门学科中,学生的数学合格率最高,科学、品德与社会居中,语文最低。从图1中可以看到,数学达到合格及以上水平的学生最多,占783%,其次是科学、品德与社会,分别为71%和673%,语文最少,仅为628%。有近30%学生的语文成绩是处于基本合格水平,即对一些基本知识和技能的掌握不足。因此,关注学生的母语学习,提高学生的语文素养应当引起全社会的普遍重视。图1学生在四门学科上的学业水平分布3学生灵活地运用学科知识解决现实生活问题的能力是新课标中着重强调的一个重要方面。本次调查发现,达到良好及以上水平即能够综合运用学科基本知识和技能来分析和解决问题的学生所占比例在四门学科上均不到30%(见图2)。以科学学科为例,只有约三分之一的学生能够准确读出用温度计分别测到的4种液体的温度,并按由低到高的顺序排出来。在品德与社会学科,只有31%的学生能够灵活地依据图示上呈现的早晨太阳所在的位置来进行实际的学校方位的判断,并进而正确地解决问题,寻找到最佳路线。因此,关注学生综合解决问题能力的发展是新课程在修订过程中应该进一步强调并在具体的课程标准中加以明确的一个重要方面。图2各学科达到良好及以上水平的学生比例4本次调查表明,东部地区学生学业成就水平明显高于中西部地区,两者间的差异非常显著(F=113.014,P=0.0000.05),而西部和中部地区学生间的差异则并不明显。从下面的图中可以很清楚地看到,虽然东中西部在基本合格和合格这两级水平上的学生比例基本相当,但东部地区学业成就达到良好和优秀水平的学生所占比例都明显高于中西部地区,特别是达到优秀水平的学生比例东部地区比中西部地区均高了约10个百分点,而不合格学生所占比例则东部明显低于中西部地区近15个百分点。这表明,东部地区学生在综合运用能力方面的发展明显高于中西部地区。图3东中西部学生学业成就水平的比较另外,城市学生的学业成就水平明显高于农村,两者间的差异非常显著(z=-6.663,p=0.000.01)。从图4中可以看到,城市学生的学业成就达到良好和优秀水平的比例均高于农村学生近3个百分点,基本合格和不合格水平的学生比例则均低于农村,特别是在不合格水平上城市学生的比例要低于农村近4个百分点。图4城市和农村学生学业成就水平的比较为了降低抽样偏差的影响,我们将地区变量和城乡变量同时放入多水平模型中检验,模型中仅包含常数和地区、城乡变量,数据层次设为样本区县、学校和学生三个水平。检验结果表明,东部地区学生学业成就水平显著高于中部和西部地区1.755个标准分(标准误=0.718,p0.05)和2.134个标准分(标准误=1.024,p0.05),中部和西部地区学生间的差异不显著,差异系数为0.379个标准分(标准误=0.96,p0.05)。在相同地区,农村学生的学业成就水平比城市学生低0.735个标准分(标准误=0.335,p0.05)。5本次调查采用非参数检验发现,男女学生在数学学科上无显著的性别差异(Z=-0.10,P=0.9230.05),在科学学科上男生的成绩高于女生(Z=-3.86,P=.0000.05),而在阅读、品德与社会学科上女生的成绩则显著高于男生(Z=-11.48,P=.0000.05;Z=-2.19,P=.0280.05)。但进一步通过统计效力检验(effectsize)我们发现,男生和女生在语文、数学、科学、品德与社会四门学科上的学业成就水平均无显著差异。从图5我们可以很清晰地看到,在数学、科学、品德与社会三门学科上达到合格及以上水平的男生和女生比例基本相当,在语文学科上虽然达到合格及以上水平的女生则略多于男生,表明女生的语文阅读能力略高于男生,但两者间的差异并不显著。图5达到合格及以上水平学生的性别差异比较(二)学生在各个学科的学业成就状况分析依据《课程标准》和各学科的测试框架,在对学生学业成就的总体状况进行分析的基础上,我们进一步从内容和能力两个维度对学生在各个学科的学业成就状况进行了分析,主要是通过对学生在不同领域的得分率进行比较以及在一些典型测试题上的表现来了解学生各个学科的学习状况。1语文学科学业成就测试框架的内容领域主要包括“字词”、“句段”、“篇章”三个部分,能力领域主要包括“认读”、“理解”、“运用”三个方面。学生在不同领域的得分率见表2。表2学生语文学科各领域的得分率(%)内容领域能力领域字词句段篇章认读理解运用得分率815963827627(1)学生对字词内容的掌握明显好于句段和篇章。从内容领域来看,学生得分率最高的是字词,句段和篇章的得分率相对较低。这表明学生对于字词内容的掌握要明显好于句段与篇章。如,绝大多数学生“能够准确地理解词语在语言环境中的恰当意义”、“能够准确地理解成语特定含义”,但是“能够从文中准确地提取相关信息”、“能够准确地理解诗歌的主要内容”以及“能够在语境中准确地辨析多音多义字的读音”的学生仅为三分之二左右,而“能够准确地理解并用自己的语言概述文章的主要内容”以及“能够体会并用自己的语言评价表达效果”的学生则不到十分之一。(2)学生具备了基本的认读和理解能力,运用能力有待提高。从能力领域来看,学生在认读和理解方面的得分率最高,而在运用方面的得分率较低,其差异达到了非常显著的水平。这表明学生已经具备了基本的认读和理解能力,但在感知和理解的基础上进行判断、推理和运用的能力还有待提高。这一特点也体现在不同能力组学生所能完成的任务上。基本合格组的学生能够进行词句的理解和运用以及在篇章中根据需要搜集信息,如“准确地理解关联词”、“准确理解词语在语言环境中的恰当意义”等;合格组学生能够在篇章语境下提取并整合信息以及理解文章的主要内容,如“从说文明中准确提取并整合相关信息”、“准确理解诗歌的主要内容”等;而在篇章语境下的理解和运用,如“能够准确判断、推理并用自己的语言表达”则是优秀组学生才能完成的任务。2数学学科学业成就测试框架的内容领域主要包括“数与代数”、“空间与图形”、“统计与概率”、“综合运用”四个部分,能力领域主要包括“知识技能”、“数学思考”、“解决问题”三个部分。学生在不同领域的得分率见表3。表3学生数学学科各领域的得分率(%)内容领域能力领域数与代数空间与图形统计与概率综合应用知识技能数学思考解决问题得分率81746665807864(1)学生对数与代数、空间与图形内容的掌握要好于统计与概率以及综合运用。从内容领域来看,学生得分率最高的是“数与代数”和“空间与图形”领域,而“统计与概率”、“综合应用”方面的得分相对低一些。这表明学生对“数与代数”、“空间与图形”的掌握好于“统计与概率”以及“综合运用”。这一特点也反映在不同能力组学生所能完成的具体任务上。如,“从时间—路程图中间接获得关于速度的信息”、“从时间—路程图中获得正确的隐藏信息”、“根据统计图中的数量关系进行计算等任务”要在良好及以上组的学生