差异量数

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1差异量数2引例甲、乙两名学生在某次期末考试中的成绩:数学语文英语物理化学各科平均学生甲797880838080学生乙95585097100803主要内容全距四分位差、百分位差方差、标准差*•标准差的应用:标准分数差异(变异)系数4第一节全距和四分位差5一组数据的最大值与最小值之差,R=Xmax–Xmin全距(range)离散程度的最简单测度值易受极端值影响,不稳定、不可靠、明显受抽样变动影响一种低效的差异量数,一般主要用于对数据作预备性检查6四分位差(quartiledeviation)排序后处于25%和75%位置上的值,分别称为第一四分位和第三四分位Q1Q325%25%25%25%四分位差:Q=(Q3-Q1)/2反映出数据分布中间50%数据的散布情况7四分位差的适用条件常与中数联系起来共同应用在两极端数据不清楚时,可以计算四分位差稳定性较差,反应不够灵敏,不适合进一步代数运算8四分位差的计算---未分组数据Q1,Q3位置的确定4)1(34131nQnQ位置位置计算Q1,Q3相应的数值,根据定义计算四分位差9四分位差的计算---分组数据与分组数据中,中数的计算方法类似ifFNLQbb411ifFNLQbb433Lb表示四分位数所在组的精确下限,Fb表示小于的各组次数的和,f表示百分位数所在组的次数,i表示组距101112ifFNLQbb411ifFNLQbb4331115727424.5528.3316Q3315798439.5543.6124Q13箱线图(box-plot)1415形状的分布与箱线图1617百分等级与百分位数百分等级是指一组有序数据中某一数据以下所含次数占总次数的百分比,通常用符号PR表示在教育上通常用百分等级表示一个分数在团体中的相对位置。百分等级越低,个体在团体中所处的位置越差。如果某分数的百分等级PR=70,则表明团体用有70%的人成绩低于该分数与百分等级相对应的数值为相应的百分位数18百分等级的计算---未分组数据R-给定分数在团体中的等级,N-总的数据个数)1(100NRPR19例:15名学生的考试成绩如下:98,93,62,92,91,92,65,66,90,87,78,86,81,85,83。问90分学生百分等级是多少?解:将成绩从大到小排序:98,93,92,92,91,90,87,86,85,83,81,78,66,65,62。60)1561(100)1(100NRPR20百分等级的计算---分组数据2122小练习某考生在一项测验中得分60,经换算百分等级为70,这表明在所有考生中,得分低于该考生的人数占总人数的()。A.30%B.40%C.60%D.70%23第二节方差、标准差24平均差(averagedeviation)平均差是指所有原始数据与平均数绝对离差的平均值。平均差用A.D.表示。平均差计算方法:•未分组数据•分组数据25方差(variance)22122)()(NxNxNxiiNii总体方差样本方差22122)1(11)(nxnxnxxsiiNii样本自由度df26自由度(degreeoffreedom)一组数据中可以自由取值的数据的个数当样本数据的个数为n时,若样本均值确定后,只有n-1个数据可以自由取值,其中必有一个数据则不能自由取值27无偏统计量如果从很多不同样本中得到样本统计量的平均数等于相应的总体参数值,则一个样本统计量是无偏的。例:一个N=6的总体:0,0,3,3,9,9,其平均数μ=4,方差σ2=14。从中选择n=2的样本,一共9个样本。28例:一个N=6的总体:0,0,3,3,9,9,其平均数μ=4,方差σ2=14。从中选择n=2的样本,一共9个样本。29标准差(standarddeviation)总体标准差样本标准差NxNii12)(1)(12nxxsnii30标准差的计算未分组数据---利用定义(或原始数据)计算分组数据(次数分布表)1)(2nfxxsc标准差的合成(教材pp.90-91)31标准差的性质每一个观察值都加一个相同常数C之后,计算得到的标准差等于原标准差。即如果Yi=Xi+C,则有SY=SX。每一个观察值都乘以一个相同常数C,计算得到的标准差等于原标准差乘以这个常数。即如果Yi=C*Xi,则有SY=CSX。每一个观察值都乘以一个相同常数C(C≠0),再加上常数d,计算得到的标准差等于原标准差乘以这个常数。即如果Yi=C*Xi+d,则有SY=CSX。32方差、标准差的优缺点方差与标准差是表示一组数据离散程度的最好的指标。它们是描述统计与统计推断分析中最常用的差异量数。标准差基本具备一个良好的差异量数应具备的条件:反应灵敏;计算公式严密确定;容易计算;适合代数运算;受抽样变动的影响小;与原始数据单位相同。数据中有极端值、模糊数据时不适用。33小练习一组数据中每个数的值都是5,那么这组数据的方差和标准差是()。A.0,0B.5,25C.0,5D.0,25有一组数据:2,3,4,5,6,7,8。该组数据的平均数和标准差分别是5和2。如果给这组数据的每个数都加上3,再乘以2,那么可以得到一组新数据。其平均数和标准差分别是A.8,2B.8,5C.16,4D.16,1034在差异量数中,性能最好的一个统计量是()。A.平均差B.四分位差C.标准差D.方差下列说法错误的是()。A.一组数据每个观测值都加上一个相同的常数c,其标准差等于原标准差B.一组数据每个观测值都乘以一个相同的非零常数c,其标准差等于原标准差C.一组数据每个观测值都乘以一个相同的非零常数c,再加上一个常数d,其标准差等于原标准差乘以cD.标准差的单位与原数据相同35计算下列数据的标准差与平均差。11.0,13.0,10.0,9.0,11.5,12.2,13.1,9.7,10.536标准分数(z-score)标准分数是以标准差为单位表示一个分数在团体中所处位置的相对位置量数。sxxzii计算公式:37标准分数的性质Z分数无实际单位,是以平均数为参照点,以标准差为单位的一个相对量。一组原始分数转换得到的Z分数可以是正值,也可以是负值。一组原始分数中,各个Z分数的平均数为0,标准差为1若原始分数呈正态分布,则转换得到的所有Z分数值的均值为0,标准差为1的标准正态分布。38均值等于0标准差等于13940标准分数的应用—比较不同质数据Bob在一次心理学考试和一次生物考试中分别得了60分和56分。已知生物考试的全班平均成绩为48分,标准差为4分;心理考试的全班平均成绩为50分,标准差为10分。Bob哪一科的成绩比较好呢?解:答:从班级相对名次的角度说,Bob的生物成绩更好。1.0105060心理z2.044856生物z41应用2—不同质数据求和或平均值下表是高考中甲、乙两名学生的成绩。试问根据高考成绩应该优先录取哪名考生?42应用3—表示标准测验分数经过标准化的心理和教育测验,为了克服标准分数出现的小数、负数和不易为人们所接受等缺点,常常把Z分数变成一个预先设好整数平均数和标准差的分布。其目的是构建一个新的分布,使得其平均数和标准差具有“简单”值,同时不改变分布内任何值的位置。转换公式:例:韦氏智力测验分数IQ=15Z+100baZZ'43例:总体具有μ=37,σ=2。如果这个分布被转换成一个新的分布,具有μ=100,σ=20,那么下列分数将被变成什么新值:35,36,37,38,39?解题思路:1.原始分数变换为Z分数2.Z分数进一步变成新的X值,使得预先设定的μ和σ被达到44异常值的取舍经验法则表明:当一组数据对称分布时•约有68%的数据在平均数加减1个标准差的范围之内•约有95%的数据在平均数加减2个标准差的范围之内•约有99%的数据在平均数加减3个标准差的范围之内4546下面关于标准分数的描述错误的是()。A.可用于比较几个性质不同的观测值在各自数据分布中相对位置的高低B.可用于计算不同质观测值的总合或平均值C.表示标准测验分数D.标准分数有实际单位,以平均数为参照点小练习47一个总体的平均数是μ=45,σ=7,求出下列每个X值的z分数:X=47X=35X=40X=60X=55X=42一个数与平均数之差是8,其对应的z分数为0.5。总体的标准差是多少?在一个分数分布中,X=62的z分数为0.5,X=52的z分数为-2.00。求分数分布的平均数和标准差。48周一下午,Bill在英语考试中的分数是73分,整体的平均数是μ=65,σ=8。在同一天,John在数学考试中的分数是63,整体的平均数是μ=57,σ=3。谁的分数更好些,Bill还是John?解释你的答案。49第三节差异系数50差异系数(coefficientofvariation)在对不同样本的观测结果的离散程度进行比较时,常会遇到下述情况:1.两个或多个样本所测的特质不同,即所使用的观测工具不同,如何比较其离散程度?2.即使使用的是同一观测工具,但样本的水平相差较大时,如何比较它们的离散程度?51差异系数(coefficientofvariation)差异系数是指标准差与其算术平均数的百分比,用CV表示。其计算公式如下:%100xsCV52差异系数-例1已知某小学一年级学生的平均体重为25千克,体重的标准差是3.7千克,平均身高110厘米,标准差为6.2厘米,问体重与身高的离散程度哪个大?答:通过比较差异系数可知,体重的分散程度比身高的分散程度大。14.8%%100253.7体重CV5.64%%1001106.2身高CV解:53差异系数-例2通过同一测验,一年级(7岁)学生的平均分数为60分,标准差为4.02分,五年级(11岁)学生的平均分数为80分,标准差为6.04分,问这两个年级的测验分数中哪一个分散程度大?答:五年级的测验分数分散程度大。解:6.7%%100604.02一年级CV7.55%%100806.04五年级CV54小练习一组数据的平均数是100,标准差是25,这组数据的变异系数是()。A.4%B.25%C.4D.25某初一、初二学生接受同一个测验,初一学生平均分为65分,标准差为5;初二学生平均分为80分,标准差为6。正确的结论是()。A.初一分数比初二分数离散程度大B.初二分数比初一分数离散程度大C.两个年级的分数离散程度无法比较D.两个年级的分数离散程度一样大

1 / 54
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功