第一部分(概念):1.测量:用数字对一个事件或特征进行描述。2.评估:取样和观察学生技能、知识和能力的所有方法。3.形成性评估:为了制定计划或实施诊断而在教学之前或教学过程中进行的一种不给出等级的测验。4.前测:为了评价学生的知识,准备程度和能力而进行的形成性测验。5.终结性评估:教学之后让教师和学生知道目标完成水平的测验。6.常模参照测验:个体分数与其他人的平均分进行比较的测验。7.标准参照测验:将测验成绩与某一给定标准或标准行为进行比较的测验。8.信度:当重复测验时,从理论上对分数变化的估计值。9.重测信度:同一个测量工具在两个不同的时间对同一组被试施测所得结果的一致性程度。10.复本信度:两个平行测验测量的同一批被试所得结果的一致性程度。11.分半信度:把一个测验的所有题目随机地划分为对半的两个部分,然后估计所有被试在这两部分题目上得分的一致性程度。12.测量误差:测量所得值与欲测品质实际值之间的差异值。13.测量标准误:测量误差的假设分布的标准差。14.置信区间:某人的特定分数可能落入的区间范围。15.真分数:测量工具实际所测到的测值,包括目标真分数与非目标真分数。16.效度:测量工具所测得的预测的特征或行为特征的效果和程度。17.内容效度:内容是不是测量目标特质或行为领域的一个有代表性的样本。18.结构效度:测量工具测量的心理学中某种特质或特质结构的程度。19.效标效度:测量工具评价结果与效标评价结果之间的关联性程度。20.评估偏见:评估工具因学生的性别、种族、社会经济地位、宗教和一些其他的群体特征而造成冒犯学生或不公平对待学生的性质。第二部分(区分)1.测量与评估的区分2.形成性评估与终结性评估的区分3.常模参照测验与标准参照测验的区分