1西南大学研究生课程考试答卷纸考试科目院、所、中心专业或专业领域研究方向级别学年学期姓名学号类别(①全日制博士②全日制硕士③教育硕士④高师硕士⑤工程硕士⑥农推硕士⑦兽医硕士⑧进修)年月日研究生院(筹)制2课程类别课程考试方式题号得分教师评价一二三四五六七八九十总分任课教师签名:备注:成绩评定以百分制或等级制评分,每份试卷均应标明课程类别(①必修课②选修课③同等学力补修课)与考核方式(①闭卷笔试②口试③开卷笔试④课程论文)。课程论文应给出评语。3西南大学外国语学院免师教育硕士“学科(英语)教育测量与评价”课程作业要求:保留原题题干及数据,然后在其下面插入空白来呈现答案。不得篡改问题或者数据。在编辑将要提交的作业的Word文件时,需确保欲呈现的内容能被打印出来。一、简答题(50分)1.测量的基本要素有哪些?(1分)单位(如米、克,教育测量的单位不能直接加减乘除);参照点(计算的起点,有绝对零点和相零点);量表(测量工具)。2.什么是教育测量?(1分)教育测量是根据测量学的原理和方法对教育现象及其属性进行数量化研究的过程。它主要包括对学生的内在精神属性的测量,教育测量主要是一种间接的测量。3.教育测量有哪些量表类型?(1分)类别量表,顺序量表,等距量表,等比量表4.什么是教育评价?(1分)教育评价是指根据一定的教育价值观或教育目标,运用可行的科学手段,通过系统地收集信息、分析解释,对教育要素,过程和效果进行价值判断的活动。5.教育测量与教育评价有什么不同?(1分)两者着眼点不同:教育测量是为了取得数据;教育评价是要分析解释,对教育价值作出判断。两者特点不同:教育测量是一种纯客观的过程,具有客观性特点;教育评价具有客观性与主体性相结合特点。两者复杂程度不同:教育测量是对教育数量化的描述,关心量的获得,活动较为单一;教育评价着眼于事物质的判定,含定性与定量分析,活动是多重的。46.教育评价与教育评估有什么异同?(1分)区别:评估有估价的含义,模糊粗略;评价相对是较为精确的价值判断。评估多用于群体或单位的状态及效果的估价;评价则既有对群体和单位的价值判断,又有对个人的判断。7.教育测验、考试与教育测量有什么不同?(1分)教育测验和考试是教育测量的一部分。8.教育测量与评价,按照实施的时间阶段的不同,可以区分为哪几种类型?各自使用的目的是什么?(1分)按照实施的时间阶段的不同可以分为诊断性、形成性和总结性评价。诊断性评价一般在教学前进行,目的是分析学生的起点行为,摸清学生的现有水平及个别差异以便安排教学。形成性评价通常在教学过程中实施,是教师及时了解学生学习进展情况的重要方式,又称诊断进步评价或进展评价。总结性评价是对一个完整的教育过程的总体结果进行的评价,又叫终结性评价,通常在一门课程或一项教学活动结束之后进行。9.教育测量与评价,按照参照点的不同,区分为哪几种类型?各自适用的情形是什么?(1分)根据评价参照点的不同,可以把教学评价分为常模参照评价和标准参照评价常模参照评价是以学生所处的团体的平均成绩或团体中的常模作为参照标准,根据个体的相对位置(或名次)报告评价的结果。标准参照评价是在评价对象群体之外,预定一个客观的或理想的标准,并运用这个固定标准去评价每个对象的评价方式。10.教育测量与评价,按照被测量与评价的行为的性质,区分为哪些类型?它们各自适用于什么情形?(1分)根据测量与评价的行为的性质,分为最佳行为测量与评价,典型行为测量与评价。其中,最佳行为测量与评价,是以被试者最佳行为表现为目的;典型行为测量与评价,不在测量与评价被试者能力的高低,而是测量与评价其是否具备某种(或某些)典型行为。11.按照教育测量与评价的内容,教育测量与评价区分为哪几种类型?它们各5自适用于什么情形?(1分)它们被分为标准化测量与评价和非标准化测量与评价。标准化测量与评价是只由测量专家严格按照标准程序而编成的一种测验。12.什么是重测信度?(1分)它是指用同一测验试卷,在先后两个不同时间内同一组被试进行测验,两次测验实得分数的相关系数。13.什么是复本信度?(1分)复本信度又称等值性系数。它是以两个等值但题目不同的测验(复本)来测量同一群体,然后求得被试者在两个测验上得分的相关系数。14.Kappa一致性分析可以用来说明教育测量与评价的哪些类型的信度?(1分)重测信度15.肯德尔和谐系数分析的功能是什么?(1分)肯德尔和谐系数是计算多个等级变量相关程度的一种相关量。Spearman等级相关讨论的是两个等级变量的相关程度,用于评价时只适用于两个评分者评价N个人或N件作品,或同一个人先后两次评价N个人或N件作品,而kandall和谐系数则适用于数据资料是多列相关的等级资料,即可是k个评分者评(N)个对象,也可以是同一个人先后k次评N个对象。通过求得kandall和谐系数,可以较为客观地选择好的作品或好的评分者16.什么叫分半(half-split)信度?(1分)分半信度(split-halfreliability)常用信度检验方法之一。反映测验项目内部一致性程度,即表示测验测量相同内容或特质的程度。具体分析是在测验后将测验项目分成相等的两组(两半),通常采用奇偶分组方法,即将测验题目按照序号的奇数和偶数分成两半,然后计算两项项目分之间的相关。相关越高表示信度高,或内部一致性程度高。17.什么叫克伦巴赫alpha系数?(1分)Cronbacha信度系数是一套常用的衡量心理或教育测验可靠性的方法,依一定公式估量测验的内部一致性.作为信度的指标.它克服部分折半法的缺点,是目前社会研究最常使用的信度指标,它是测量一组同义或平行测总和的信度.618.什么叫效度(validity)?什么叫效度验证(validation)?(1分)效度是测量结果的准确性和有效性程度,也是指测量是否达到了预期的目的。19.什么叫内容效度?什么叫表面效度?什么叫反应效度?(1分)内容效度指的是测验题目对有关内容或行为取样的适用性,从而确定测验是否是所欲测量的行为领域的代表性取样。表面效度指被试或其他未受过专门训练的人员对测量有效性程度的估计。反应效度是指测试者对测试内容的是否感兴趣,测试内容是否满足被测试者需求的估计。20.什么叫构念(construct)?什么叫构念效度(constructvalidity)?(1分)构念(construct)是指心理学理论所涉及的抽象而属假设性的概念或特质。构念效度是指一个测量实际测到所要测量的理论结构和特质的程度,或者说测量能够说明测量的理论结构和特质的程度。21.什么叫效标(Criterion)?什么叫效标效度(criterion-relatedvalidity)?(1分)效标是衡量测验有效性的参照标准,它是独立于测验之外,体现测验目的的行为变量。通常指我们所要预测的行为。效标效度是指问卷(量表)测量结果和效度标准(被假设或定义为有效的某种外在标准)之间的一致程度。22.什么叫同期效度(concurrentvalidity)和预测效度(predictivevalidity)?(1分)同时效度(ConcurrentValidity),即同时在研究对象中进行测评和效度标准测量得到的结果之间的相关程度。预测效度(PredictiveValidity),它是指问卷(量表)测量结果经过一段时间后与未来实际结果予以相关性分析,两者之间的吻合程度。23.试题的难度系数可以怎么计算?(1分)难度是测验试题的难易程度,是试题对学生知识和能力水平的适合程度的指标。公式:P=R/N;P表示难度指标;N代表参加考试的总人数;R表示答对某道客观题的人数。24.什么是测试题目的区分度(DiscriminationIndex)?题目的区分度如何计算?7(1分)区分度是指测验对考生实际水平的区分程度。公式:D=PH-PL;D代表区分度;PH表示高分组的难度;PL表示低分组的难度。D0为正区分,D0为负区别,D=0为零区。25.什么是级差相关(Pearsoncorrelation)?(1分)级差相关是当两个变量都是正态连续变量,两者之间呈线性关系时,表示这两个变量之间的相关。26.什么是等级相关(Spearmancorrelation)?(1分)斯皮尔曼等级相关(Spearman’scorrelationcoefficientforrankeddata)主要用于解决称名数据和顺序数据相关的问题。适用于两列变量,而且具有等级变量性质具有线性关系的资料。27.什么是点二列相关(point-biserialcorrelation)?在SPSS中,怎么计算点二列相关系数?(1分)当两列变量中一列为来自正太总体的等距或等比的测量数据(点数据),另一列是真正的二分变量,用公式计算得的相关,称为点二列相关。在SPSS中计算点二列相关的方法就是计算这二列变量的Pearson相关系数。只是需要注意的是其中的那列二分变量的取值范围必须是{0,1}28.什么正相关?什么是负相关?(1分)正相关是指两个变量变动方向相同,一个变量由大到小或由小到大变化时,另一个变量亦由大到小或由小到大变化。负相关是指两个变量变动方向相反,一个变量的增加可能引起另一个变量的减少。29.什么是相关系数显著性检验中的双侧(2-tailed)检验和单侧(1-tailed)检验?(1分)双侧检验指按分布两端计算显著性水平概率的检验,应用于理论上不能确定两个总体一个一定比另一个大或小的假设检验。一般假设检验写作H1:μ1≠μ2。单侧检验指按分布的一侧计算显著性水平概率的检验。用于检验大于、小于、高于、低于、优于、劣于等有确定性大小关系的假设检验问题。这类问题的确定是有一定的理论依据的。假设检验写作:μ1μ2或μ1μ2。830.什么是独立样本(independentsamples)?什么是相关样本(relatedsamples)?(1分)两个样本中样本A中成员变动时对样本B不造成影响,则它们被称为独立样本。两个样本的成员是相关的,即样本A的成员变动,则样本B会的成员也一起变动,或者两个样本是同一体,都是相关样本。31.什么是独立样本t检验中的双侧(2-tailed)检验和单侧(1-tailed)检验?(1分)对两组独立样本进行显著性水平概率的检验,双侧检验,就只需检验他们的相关性是否显著。单侧检验则是有方向性的,比如样本A和样本B比较,μ1μ2或μ1μ2。32.通常情况下,教育评价表的构成要素有哪些?(1分)教育评价表的构成要素有:评价指标;指标权重表示指标的重要性程度;评价标准指的是评价对象达到评价指标要求的尺度。33.什么是评价标准的标度,标号,强度或频率?(1分)标度:评价的档次,可以是定性的,也可以是定量。定性时必须赋值,使定性标度转换成能够定量标度,以便统计处理。标号:不同强度和频率的标记符号,通常用字母、文字或数字表示。没有独立的意义,只表示一种分类。强度:指标达到项目要求的程度或各种规范行为的优劣程度,又称定性指标。频率:达到指标项目要求的数量或各种规范化行为的相对次数,也称定量标准。34.什么是客观性试题和主观性试题?客观性试题和主观性试题分别有些什么类型?(2分)客观性试题学生在测验中从事先提供的多种答案中确认出一个正确答案,如选择题、是非题、匹配题等。主观性试题是让学生根据对测验所提问题的认识和理解,用自己的语言形成答案,如简答题、论述题、案例分析、应用题、作文题、比较题等。35.什么是表现性测验?表现性测验有些什么类型?(2分)表现性测验是指通过客观测验以外的一类以行动、作品、表演、口头回答、操作、写作、科学研究、制作等更真实的行为表现,来测量和评价学生在真9实情景或模拟真实情景下的所知于所能的一种评价方法。类型有口头测验、写作测验、实验技能教学考试评价和行为检核于评价等。36.教育目标,教学目标,测验目标几者之间有什么关系?(2分)教育目标决定教学目标,教学目标决定测验目标。37.布卢姆教育目标分类的认知领域的内容,在早期理论和修订版框架之间,有什么异同?(2分)修订版吸收了现代认知心理