教育统计学5

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第五章相关分析集中量数和差异量数主要用于描述单变量数据资料的分布特征,相关系数则用于描述双变量数据相互之间的关系。本章内容第一节相关相关系数散点图第二节积差相关第三节等级相关第四节质与量相关第五节品质相关第一节相关相关系数散点图1.相关因果关系事物之间的相互关系共变关系相关关系两个变量之间不精确、不稳定的变化关系为相关关系。相关类别:正相关身高与体重负相关练习次数与错误率零相关身高与学业成绩2.相关系数用来描述两个变量相互之间变化方向及密切程度的数字特征量,一般用r表示,作为总体参数,常用ρ表示。相关系数的数值范围是-1≤r≤1r的绝对值越接近1,表示两个变量之间关系越密切;越接近0,表示两个变量之间关系越不密切。|r|=1---完全相关r=0---零相关思考:r1=-0.8,r2=0.24,哪个相关程度高?相关系数的性质(取值及其意义的图解)-1.0+1.00-0.5+0.5完全负相关无线性相关完全正相关负相关程度增加r正相关程度增加图5.1相关系数示意图散点呈椭圆形分布,X、Y同时增减---正相关X、Y此增彼减---负相关散点在一条直线上,X、Y变化趋势相同--完全正相关反向变化----完全负相关X、Y变化互不影响----零相关图5.2相关系数示意图3.散点图(散布图)在相关研究中,常用散点图表示两个变量之间的关系。150160170180190404550556065707580体重(kg)身高(cm)图5.310个学生身高与体重散布图020406080051015结婚年数信件数图5.410名远洋人员结婚年数与妻子通信数散布图第二节积差相关1.概念:当两个变量都是连续变量,而且两者之间呈线性关系时,表示这两个变量之间的相关为积差相关。英国统计学家F·Galton(1822——1911年)和他的学生、现代统计学的奠基者之一K·Pearson(1856——1936年)在研究父母身高与其子女身高的遗传问题时,观察了1078对夫妇,把父亲的身高和儿子的身高绘成了散点图。最后由皮尔逊于20世纪初提出的一种计算相关的方法,又称皮尔逊相关。2.使用条件:①两个变量均是连续变量;②变量的总体呈正态分布或接近正态分布;③是成对数据;④两个变量呈线性关系。Galton数据散点图7570656075706560heightoffatherheightofson某地160名20岁男子身高与体重散点图3.积差相关公式21211)(1)(1))((1yynxxnyyxxnrniiniiniiiniiixyyyxxns1))((1相关系数=相关系数的分母,恰好是X、Y变量的标准差,分子是所有的矩()与的矩()乘积的平均,即Sxy为协方差。它表示两个变量线性变化程度的指标。xxiiyyyiixyxxySSS例1计算10名学生体重和身高的相关系数学号体重X身高Y1611662631723691824571635591746491527511708621739601601058165学号体重X身高Y1611662-2-426317244163691821014140457163-2-510559174060649152-10-16160751170-82-1686217335159601601-8-81058165-1-33和5891677平方和299平方和635316平均5916829.963.531.6xxiyyi))((yyxxiir==yxxySSS72.097.747.56.315.639.296.314.相关系数大小的评价相关系数r的数值范围相关程度0.0≤|r|≤0.2几乎没有什么相关0.2|r|≤0.4低相关04|r|≤0.7中等相关0.7|r|≤1.0高相关结论:10名学生身高与体重的相关系数为0.72,属于高相关。第三节等级相关是指以等级次序排列或以等级次序表示的变量之间的相关。包括斯皮尔曼(Spearman)二列等级相关和肯德尔和谐系数Kandall多列等级相关。用rR表示。1.斯皮尔曼(Spearman)等级相关使用条件:①当两个变量的值以等级次序排列或以等级次序表示时;②当变量数目少于30或虽为连续变量但不呈正态分布时。等级相关系数公式:其中n是样本容量,D表示两个变量对数据等级之差。)16122nnDrR例2.10名高三学生学习潜在能力测验与自学能力测验成绩如下,求二者的相关。学生潜在能力自学能力等级差DD2分数X等级分数Y等级0190132-110284221110376353000471575.5-0.50.250571587.5-2.56.250671564110769787.50.50.250868875.52.56.25096691010-111064109911(和=18)891.0)1100(101861)16122nnDrR结论:10名学生学习潜在能力与自学能力的相关系数为0.891,属于高相关。请用斯皮尔曼(Spearman)等级相关计算10名学生身高与体重的相关系数。661.0)1100(105661)16122nnDrR结论:10名学生身高与体重的相关系数为0.661。思考:积差相关与斯皮尔曼等级相关,所得的相关系数哪个更大?若按照从小到大的次序,两变量的等级相关系数会有变化吗?2.肯德尔等级相关肯德尔W系数,又称肯德尔和谐系数。K个被试(或评价者)对N件事物或N种作品进行等级评定,并排出一个等级顺序。最小等级为1,最大等级为N。)(12132NNKSWNRRSii22)(R代表评价对象获得的K个等级之和例:6位教师各自评阅相同的5篇作文,下表为每位教师给每篇作文评分的等级,其评分者标准是否一致?评分者K=6作文12345613333332554555322112244454445112211评分者K=6作文123456RR21333333183242554555298413221122101004445444256255112211864和90195493.0)55(61215901954)(12132232NNKSW第四节质与量相关是指一个变量为质,另一个变量为量的相关。种类:二列相关、点二列相关1.二列相关:一列变量为等距或等比的测量数据,另一列变量为人为划分的二分变量,如及格与不及格、通过与未通过等。使用条件:正态分布的连续测量数据;二分变量是人为划分的;样本容量应大于80。二列相关计算公式二列相关系数p类的平均数q类的平均数p类别的频数比率q类别的频数比率所有分数的标准差正态曲线下与p值所对应的高度(查表)YpqSXXrtqPbYSqpXqXrpb例3.15名初三毕业生,其中重点中学有5人,非重点中学有10人,其高中入学考试英语分数如下,求中学的类别与英语考试成绩的相关。学生分数重点中学非重点中学016800282103540047310561006751077200863009801107401170012761137101473015710P为重点学校;q为非重点学校重点学校的频数=5/15=0.333非重点学校的频数=10/15=0.667重点学校英语平均分=(82+~+76)/5=77.2非重点学校平均分=(68+~+71)/10=67.715名学生的平均分=(68+82+~+71)/15=70.8715名学生的方差=[(68-70.87)2+~+(71-70.87)2]/15=48.2515名学生的标准差=6.946查正态曲线表p值所对应的Y=0.363783.03637.067.033.0946.67.672.77br2.点二列相关两个变量中一个是正态连续性变量,另一个是真正的二分名义变量(如男、女)。计算公式:pqSXXrtqppb第五节品质相关用于表示RxC(行x列)表的两个变量之间的关联程度。种类:四分相关φ相关φ相关的概念:两个变量都是二分变量的相关。适用条件:计数数据计算公式:a、b、c、d表示四格表中频数))()()((dcdbcababcadraba+bcdc+d总和a+cb+da+b+c+d例4从研究生入学考试的学生中,随机抽取60人,其大学应届与历届毕业生录取情况如下表,问应届和历届大学毕业生同研究生录取与否的相关情况?大学毕业生录取未录取应届2012历届1117应届和历届大学毕业生与研究生是否被录取呈正相关,相关系数为0.232。大学毕业生录取未录取应届a=20b=12a+b=32历届c=11d=17c+d=28总和a+c=31b+d=29a+b+c+d=60232.02829313211121720r作业1:为研究某能力测验的预测效度,在被录取的高考考生中随机抽取10人,测得他们的能力测验分数为X,对他们进行跟踪研究,求得他们大学一、二年级有关科目平均分数为Y,请计算能力测验分数与某科目平均分数的相关系数7482717580818589768277897788688474807487和756837ixiyxxiyyi))((yyxxii答案:10名学生能力测验分数与某科目平均分数的相关系数为r=0.48作业2.在某地花卉展览会上关于参观者“你所喜欢的花”的调查结果如下:按喜欢程度顺序排列牡丹梅花玫瑰菊花百合莲花康乃馨郁金香男性12345678女性31254768求上述花类的喜欢顺序的等级相关。88.0)164(81061)16122nnDrR作业3:有研究者调查了358名不同性别的学生对某项教育措施的评价态度,见下表。根据这些结果能否说性别与评价态度有关?相关程度如何?性别拥护反对和男66106172女28158186和94264358265.0186264941722810615866158,28,106,66rdcba结论:性别与评价态度的相关系数为0.265,属于低相关。作业4:有10人对7种颜色按照喜好程度进行等级评价。其中最喜欢的等级为1,最不喜欢的等级为7,见下表,问这10人对颜色的喜爱是否一致?评价者颜色12345678910红3523443243橙6676757766黄5457664454绿1112222112青4344335635蓝2231111321紫7765576577和评价者颜色12345678910RR2红3523443243331089橙6676757766633969黄5457664454502500绿111222211215225青4344335635401600蓝223111132117289紫7765576577623844和827.0)77(10121728013516)(12132232NNKSWCafétime•十月金秋,是诺贝尔奖的颁奖季节。1990年诺贝尔经济奖主是HarryMarkowitz.。他是学者但还经营一家证券公司。他将统计分析如平均、方差、相关系数等方法导入对有价证券如股票等的分析,促进了经营现代化。他在1952年提出:1.收益率越高越好(收益性)2.收益率的标准差越小越好(安全性)。•这是当然的事,难的是如何(1)(2)同时实现。他得出“分散投资”的理念,即让(2)的标准差以极限的程度达到最小值。用统计专业词说选择股票的原则是尽量选择那些相互关系(相关系数)低的品种。他又提出“所有的鸡蛋放在一个篮子里最危险,聪明人是将鸡蛋分开放。”---portfolio---•Portfolio—转变成有价证券的组合包的意思,已成为管理危机的常识。补充资料有人曾作过这样的实验发现,在美国人中,鞋子的大小与人的言语能力存在中等程度的正相关,即穿鞋子越大的人言语能力水平越高。显然二者不存在因果关系。为什么会导致上述结论?年幼的儿童脚比较小,言语能力也较弱,随着年龄的增长,他

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功