统测:3

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第三章集中量2最常用的统计量有三类:一类是代表一组数据典型水平或集中趋势的量,即集中量;另一类是反映一组数据的变异程度或离散程度的量,即差异量;第三类是反映数据的相关程度的量,即相关量。本章介绍第一类统计量,即集中量。3集中量:代表一组数据典型水平或集中趋势的量称为集中量。用途有二:一是可以作为一组数据的代表值;二是可以进行组与组之间的比较。常用的集中量有算术平均数、中位数、众数等。4第一节算术平均数一、算术平均数的概念及特性1.算术平均数是所有观察值的总和除以总频数所得之商,简称平均数或均数、均值。NXXXXN21NX求和二、算术平均数的计算方法1.原始数据计算法某师大教育学院2000级学生学了“教育统计学”这门课,为了了解教育学专业学生学习这门课的平均水平,考试结束后可以对他们的考试分数进行统计分析。首先,将该专业学生的分数列出来:97,93,71,86,88,78,91,86,90,47,88,74,78,75,85,98,98,100,75,85,93,91,81,91,93,96,88,75,100,98,94,97,97,97,77,98,95根据定义公式计算平均数NXXXXN213795939768.8772.频数分布表计算法。当原始数据的数量特别大时,可采用此方法。NfXfffXfXfXfXNNN212211如,某研究者对100名小学生进行智商测试,数据经过整理,结果如下,现要计算这100名学生的平均智商。分数XffX80-85-90-95-100-105-110-115—120-125-82.587.592.597.5102.5107.5112.5117.5122.5127.538122124149432247.5700.01110.02047.52460.01505.01012.5470.0367.5255.0总和10010175.0NNNfffXfXfXfX212211解:1000.1017575.101第二节加权平均数、几何平均数、调和平均数一、加权平均数:是不同比重数据(或平均数)的平均数。nnn212211=WWX例:某门课程期中考试成绩与期末考试成绩的权数分别为3和7。已知某个考生期中考了92分,期末考了85分。若不考虑其他因素,问该生在这门课上的成绩是多少?解:nnn212211=73785392=87.10答:该生在这门课上的成绩是87.10。例:经计算得教育学院某年级各专业在教育测量学课程上的平均分和人数为:1X=85,n1=30,2X=83,n2=36,3X=82,n3=25,4X=86,n4=26,问全年级的平均分是多少?nnn212211=262536302686258236833085=83.966解:答:全年级的平均分是83.966。二、几何平均数。当一个数列的后一个数据以前一个数据为基础成比率(即等比级数)增长时,要用几何平均数求其平均增长率(即等比级数中的比率)。常用作速率的集中量。例如:某大学连续四年的毕业人数为:980、1100、1200、1300,问毕业生平均增长率是多少?NNgXXXX21解:980基数11001.122412001.090913001.0833根据几何平均数公式计算得,30833.10909.12222.1gX=1.0987所以,该校毕业生平均年增长率为9.87%。三、调和平均数:是一组数据倒数的算术平均数的倒数,亦称倒数平均数。用公式表示为:)111(1121NHXXXNX=)1(XN如:在一项问题解决的实验中,有5个被试,让他们在2小时内解题,统计他们解题的量。第一被试作了20题,第二被试作了18题,第三个被试12题,第四个被试16题,第五个被试18题。问他们的平均解题速度是多少。)111(1121NHXXXNX)21812161212121812201(51114.8解:答:这5个学生的平均解题速度是每小时8.14道题。第三节中位数一、中位数的概念中位数是位于以一定顺序(排列的一组数据中央位置的数值,在这一数值上、下各有一半频数分布着。用Md表示。二、中位数的计算方法1.原始数据计算法总频数为奇数某项研究调查了25名大学教师的月经济收入,结果如下(单位:元):2275,3300,3326,3358,3363,3394,3402,3455,3467,3485,3500,3565,3587,3592,3618,3633,3646,3674,3720,3734,3756,3775,3820,5695,7100现要确定他们月经济收入的一般水平。解:因为n=25为奇数,n+1/2=26/2=13,所以中位数为位于第13号的那个,数值即3587(元)。答:这25名大学教师的月经济收入一般为3587元。某研究者对实验班用计算机辅助教学,而对照班仍用传统的讲授方式进行教学,期末进行统一测试,两班学生的成绩如下,试比较两种授课方式产生的效果有何不同?实验班对照班83868778727576928778908876898487829579778684838191908987868588878579789189849279858276748081758487837883796874837769768784788790838588767873878084767579848987757172768588858382786665实验班72747576767677787878797979808181828283838484848585858686868787878787888889898990909191929295对照班656668697172737475757576767676777878787879798082838383838384848484858585878787878788888990对照班的中位数802Md70,72,72,73,74,78,80,81,82,86,88,88,88,88,88,89,90,90,90,91,92,92,93,94,94,94,96,96,98,98那么,中位数为第15号和16号数值的平均,即(88+89)2=88.5。总频数为偶数例:教育学院教育学专业99级学生人数=30,为偶数,他们的教育测量学成绩依从小到大的顺序排列结果如下:2.频数分布表计算法在这里,Lmd表示中位数所在组的下限;N表示总频数;n1表示中位数所在组下限的频数总和;i表示频数分布表上的组距;fmd表示中位数所在组的频数。第一,求二分之一总频数。第二,确定中位数所在组。由小到大累积频数,直至略大于N/2为止;第三,确定中位数在这个组的什么位置上。最后,计算中位数的值。mdmdfinNLMd)2(1如:某研究者对100名小学生进行智商测试,数据经过整理,结果如下,现要计算这100名学生智商的中位数。分数Xf累积频数80-85-90-95-100-105-110-115—120-125-82.587.592.597.5102.5107.5112.5117.5122.5127.53812212414943231123446882919598100总和100解:因为在100—这一组里累积频数刚刚大于N/2,所以,这一组就是中位数所在组。又由于这一组的下限为100,频数为24,低于这组的各组频数之和=44,组距为5。因此,中位数=100+(50-44)524=101.25三、百分位数的概念及其计算方法1.概念百份位数是位于以一定顺序(一般是由小到大)排列的一组数据中某一百分位置的数值。2.计算方法pppfinNpLP)(例如:研究者对100名小学生进行了智商测验。数据经过整理结果如下。求第75百分位数。分数Xf累积频数80-85-90-95-100-105-110-115—120-125-82.587.592.597.5102.5107.5112.5117.5122.5127.53812212414943231123446882919598100总和100解:根据表中的数据,得p=0.75,第75百分位数所在组为累积频数刚刚大于pN的这一组,即105—这一组。该组的下限为105,频数为14,组距为5,低于这一组的各组频数之和为68,所以,第75百分位数=105+(0.75100—68)5/14=107.5。求中位数即第50百分位数时,p=0.50,这时,百分位数的公式和中位数的公式完全相同。第三节众数一、众数的概念对众数有理论众数及粗略众数两种定义方法。理论众数是指与频数分布曲线最高点相对应的横坐标上的一点(积分)。粗略众数是指一组数据中频数出现最多的那个数。表示用OM二、众数的求法1.观察法。先把数据列出来,然后找出现频数最大的数,即为众数。例如:有人想了解大学二年级一个半学生的年龄大概是多少。就可以把学生的年龄抄下来。发现18岁有3个人,19岁8人,20岁4人,21岁2人,还有22岁1人。这时就可知这个班的年龄众数是19岁。2.公式计算法(近似计算法)(1)皮尔逊的经验法使用条件:频数呈正态分布或者接近正态分布。XMdMO23(2)金氏插补法当频数呈正态分布或偏态分布时,都可使用此公式。ifffLMbaamoO三、算术平均数、中位数和众数的评价及关系(一)评价与应用1.算术平均数:最常用,优点也最多。优点:(1)感应灵敏(2)严密确定(3)简明易懂,计算简便(4)适合代数运算(5)受抽样变动的影响较小缺点:(1)易受两极端数值的影响(2)有一两个数据模糊不请时,无法计算。这时通常选择中位数。2.中位数优点有严密确定、容易理解、计算简便、受抽样变动影响较小主要优点,即区别于别的集中量的优点在于适用于以下几种情况:(1)一组数据中有特大或特小两极端数值时;(2)一组数据中有个别数据不确切、不清楚时;(3)资料属于等级性质时。缺点:(1)反应不灵敏,所以代表性不如算术平均数;(2)不稳定可靠(3)不适合代数运算。所以,中位数一般情况下不用,除非别无选择。3.众数优点少:可以很快捷地知道变化的趋势;知道一组数据的代表值。如了解一个年级的代表年龄。缺点多:(1)不准确,受分组的影响比较大;受波动的影响比较大;受抽样的影响比较大。(2)不适合作进一步的代数运算。所以只有当我们想了解数据的大概水平时,才使用。一般不做考虑使用。(二)三者的关系当频数分布呈正态时,oMXdMoMdMXXdMoM当频数分布为正偏态和负偏态时,正偏态负偏态偏态中,如果把总距看作1,那么,平均数至中数的距离约占1/3

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功