教育统计与测量的基础知识第一节教育统计基础知识一、教育统计与测量概述1.什么是统计学统计学是研究统计原理和方法的科学。具体地说,它是如何搜集、整理、分析反映事物总体信息的数字资料,并以此为依据,对总体特征进行推断的原理和方法。(1)数理统计:以概率论为基础,对统计数据数量关系的模式加以解释,对统计原理和方法给予数学的证明。(2)应用统计:统计原理在某个行业的具体应用。如工业统计学、教育统计学等。2.统计学分类3.教育统计教育统计是运用数理统计原理和方法,研究教育问题的一门应用科学。主要包括:描述统计;推断统计;实验设计。.教育统计中几个名词频数:随机事件在n次试验中出现的次数,称这个随机事件的频数。频数分布:各种随机事件在n次试验中出现的次数分布,称为频数分布。离差:个体量和某一群体的平均量之差。教育统计中几个名词正态分布:是一种连续型随机变量的概率分布。二项式分布中当p=q时,且n很大时,二项式分布接近于正态分布XnXXnqpCP表2:一个学生做10题正误题做对不同题数的概率分布(做对每题的概率p=1/2;做错的概率为1/2)做对题数012345678910出现方式数1104512021025221012045101二、统计表构成:统计表一般由标题、表号、标目、表注等构成。编制基本原则:结构简明,一目了然。统计表基本格式横标目的总标目(亦可空白)纵标目(一般设谓语)横标目数字表的标题???注脚:说明资料来源等XXX(顶线)(底线)性别成绩合计优良中差男9137433女489223合计132116656表1初三(1)班男女生数学成绩分布统计表三.统计图统计图由标题、图号标目、图注等项构成。1.直条图2.圆形图图2.1某年级操行评语评定结果0102030405060甲乙丙丁等级人数图2.2 某年级操行评语评定结果甲13%乙43%丙35%丁9%3.线条图4.频数颁布直方图图2.4中考化学统计成绩直方图图 2.310题正误题做对不同题数概率分布01002003001234567891011做对题数频数5.累积频数图图2.52004年中考化学抽样得分情况累积频数图累积频数014123164991191271290204060801001201402004年中考化学抽样得分累积频数分布曲线44861281682062562832872870.10.20.30.40.50.60.7110.90.8111050100150200250300350得分率累积频数102030405060708090100图2.6:高一语文四、集中量1.算术平均数()所有观察值总和除以总频数之和所得商。NXXXNXXN......21X四、集中量2.加权平均数()是不同比重数据(或平均数)的平均数或.N表示各组的频数;X表示各组的平均数。wXWWX............212211NXNNNNXNXNXNXkkkW............212211例1:一个学生某门课期中考试成绩为72分,期末考试成绩为86分,而期考试占总成绩的40%,期末占60%,这个学生的学期总分是多少?4.806.04.06.0864.072WX例2:某校初一共有3个班,某次语文测验中,一班50人均分为68,二班45人均分为75,三班40人均分为80,问全校初一语文的平均成绩?不能用:(68+75+80)/3=74.3389.73404550804075456850WX正态分布图正态颁布图00.050.10.150.20.250.31234567891011Xp(x)图1.5:做10题正误题做对不同题数的概率分布0501001502002503001234567891011做对题数频数偏正态分布0501001502002503001234567891011系列1五、差异量1.全距(R)一组数据中最大值和最小值之差表示,又称极差。2.标准差(σ或S)标准差概念:标准差是指离差平方和后平均的方根。222)()(NXNXNXX问题1:某班甲乙两组在一次测验中的成绩分别为65,68,71,72,74(均分为70分)和30,50,86,90,94(均分为70分)。如何评价两组的学习情况?方法一:根据定义式计算方法二:根据原始数据计算方法三:利用计算器计算方法四:利用计算机计算16.35/)7074()7071()7068()7065(222242.25)59490865030(594908650302222223.差异系数(变异系数)两个群体测量单位不同,或虽测量单位相同,平均数相差很大时,不能用标准差比较他们离散程度,可利用差异系数。%100XCV问题2:某校期末考试语文平均成绩为69.3分,标准差为11.2分;英语平均成绩为94.8,标准差为13.8分。问哪一学科离散程度大?%2.16%1003.692.11)(语文CV%6.14%1008.948.13)(英语CV问题3:设某考区已录取高中学生语文平均分为69分,标准差为12.5分,而未录取高中的学生语文平均分为40分,标准差为12.5分。比较他们语文成绩的离散程度。CV1=12.5/69*100%=18.12%;CV2=12.5/40*100%=31.25%。未录取学生的离散程度大。问题4:下表中是某班甲乙两同学的期末考试成绩,问:(1)甲同学的语文和数学哪科相对较好?(2)甲同学和乙同学相比,哪一个学业成绩较好?甲生乙生项目个人成绩所在班级平均成绩标准差Z个人成绩所在班级平均成绩标准差Z语文7348.313.91.86248.313.91.2数学7966.918.50.78566.918.50.8英语7567.2140.68067.2140.9合计227227六、标准分(1)概念:标准分是将原始分数(测验分数)与平均分数相减,再除以标准差所得的商。甲同学:z(语文)=(73-48.3)/3.9=1.8z(数学)=(79-66.9)/18.5=0.7XXZ(2)标准分特点标准分是以标准差为单位的,故称为标准分。它是一种相对地位分。标准分有正负之分,一般在[-3,3]中(几率为99.74%),平均值为零。标准分可比性根据在于标准正态分布。T分数:T=100Z+500(一般200≤T≤800)(3)标准分应用比较各个学生成绩在班级中地位;比较某个学生两科或多科测验中所得分的优劣,精确地计算学生的总成绩。确定等级评定的人数。七、相关系数相关:是指两个或两个以上变量之间存在相互依存关系。如数学课成绩与数学竞赛成绩、数学与物理成绩等。正相关负相关零相关相关系数:用来描述两个变量相互之间变化方向及密切程度的数字特征量称为相关系数。最常用的是积差相关系数。NZZNYYXXryxyxxy))((数学与物理、物理与英语相关性比较数学物理英语物理170757675260636063382756575444605660552557055690978597780894889r0.910.26相关系数与相关程度表一览表表|r|0≤0.30.3|r|≤0.50.5|r|≤0.80.81.0相关程度零相关微相关切实相关密切相关高度相关完全相关八、差异显著性检验★假设检验的基本原理1.假设虚无假设(零假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)无区别的假设,一般H0表示。备择假设(研究假设):是关于当前样本所属的总体(指参数)与假设总体(指参数)相反的假设,一般用H1表示。由于直接检验备择假设的真实性困难,假设检验一般都是从虚无假设出发,通过虚无假设的不真实性来证明备假设的真实性。八、差异显著性检验2.小概率事在随机事件中,概率很小的事件被称为小概率事件,习惯上约定在0.05以下,即当P(A)5%时,则称A为小概率事件。在统计推断中认为,小概率事件在一次试验或观察中是不可能发生的。八、差异显著性检验3.显著性水平两种水平(1)α=0.05,显著性水平为0.05,即统计推断时可能犯错误的概率5%,也就是在95%的可靠程度上进行检验;(2)α=0.01,显著性水平为0.01,即统计推断时可能犯错误的概率1%,也就是在99%的可靠程度上进行检验。八、差异显著性检验22212121NNXXZ4.双样本Z检验双样本均为大样本,N1、N2都大于30,并标准差相差不很大。(N小于30要用t检验)八、差异显著性检验例3:某校高一进行数学教改实验,若实验前两班的化学成绩无显著性差异,实验一段时间后的数学测验成绩,实验班51名为均分为62.37,标准差为13.65,对照班45名学生的均分为56.16,标准差为16.37,试进行差异性检验。(1)提出假设虚无假设H0:μ1=μ2(实验班和对照班样本来自同一个总体)。备择假设H1:μ1≠μ2(实验班和对照班样本不是来自同一个总体)。(2)选择统计量,计算其值(3)确定显著水平α=0.05。(4)统计决断|Z|=2.01.96,则P<0.05,拒绝零假设。实验班和对照的化学成绩存在显著差异.00.24537.165165.1316.5637.622222212121NNXXZ双侧Z检验统计决断规则|Z|与临界值比较P值检验结果|Z|<1.96P0.05保留H0,拒绝H11.96≤|Z|<2.580.01<P≤0.05在0.05显著水平上拒绝H0,接受H1。|Z|≥2.58P≤0.01在0.01显著水平上拒绝H0,接受H1。第二节教育测量的质量特性一个高质量的测验,它的结果是可靠而且是有效的;可靠性(信度)和有效性(效度)是评价测验质量的两个重要指标。一、教育测量的信度和效度当一个测验多次测量的结果一致时,它就被认为是可靠的;估计测量一致性程度的指标被称为信度。如果在大体相同的条件下,几次测验都得到了大体相同的分数,那么这个测验的信度是较高的,反之,信度就低;即如果被试的实得分数与真实分数差距小,则测验的分数越可靠,信度越高。通常用信度系数衡量测验好坏:一般能力与学籍测验的信度系数常在0.9以上;性格、兴趣、态度等人格测验常在0.8-0.85之间,有的认为0.7以上。估计信度的方法再测信度复本信度分半信度内部一致性信度试卷的信度σ2i:每一道试题的方差;σ2:全卷的方差;k试卷中试题的数目。)1(122ikkr信教育测量的效度效度是测量的有效性,即一个测验对它所要测量的特性准确测量的程度。效度不仅受随机误差的影响,还受系统误差的影响。效度的类型内容效度构想效度内部效度统计结论效度外部效度内容效度题目对欲测的内容或行为范围取样的适当程度,即是否充分代表了该范围内的基本知识和基本能力。要具备好的内容效度要满足两个条件:确定好内容范围;测试题目具有该范围的代表性。确定内容效度的方法专家判断法再测法内容效度较适合评价教育成就测验和职业选拔测验;缺乏可靠的数量指标,妨碍各测验间的相互比较。构想效度测验对理论上的构想或特质的测量程度;即测验所提供的数据同理论假设的符合程度。要获得较高的构想效度:理论构思必须结构严谨,符合逻辑,层次分明,形成某种“构思网络”;对研究的各种变量作出明确、严格的说明;给变量下明确的操作定义,并制定相应的、客观的测量指标;消除或控制影响构思效度的因素。影响构思效度的因素对构思缺乏明确的说明,概念解释模糊,逻辑关系不清;单一方法和操作引起的偏差;构思水平之间的混乱;研究过程中主试的期望、被试因猜测而发生的心理与行为的改变,不同实验处理的相互作用等。内部效度自变量与因变量之间存在一定关系的明确程度;即所研究的两个或多个变量之间是否存在一定的关系?是否确实是自变量的变化引起了因