1第十章前面几章所讲的总体平均数、方差的统计推断等内容,均是针对连续性数据的。但在教育和心理研究中,有时需研究的问题是按一定的性质划分为不同的类别,然后统计各类别中的人数或个数,即需要用到计数资料。例如,将人按照性别划分为“男”、“女”;将学生按照学习成绩的优劣划分为“优”、“良”、“中”、“差”等,然后对各类别分别有多少,占多大的比例等。对于这些计数资料的统计分析,不能用前几章的统计方法,则需要使用本章所介绍的。应用分析计数数据时,对计数数据总体的分布形态不作任何假设,因此被视为是非参数检验方法的一种。检验2检验2检验2检验22第一节检验概述一、和检验的意义方法能处理一个因素两项或多项分类的实际观察频数与理论频数分布是否相一致问题,或者说有无显著差异问题。所谓实际频数简称实计数或实际数,是指在实验或调查中得到的计数资料,又称为观察频数。理论次数是指根据概率原理、某种理论、某种理论次数分布或经验次数分布计算出来的次数,又称为期望次数。222eefff2022:.其基本公式为偏离程度的指标是实计数据与理论数据检验23第一节检验概述2检验。避免使用近似的个精确的多项检验来的四个表中,应运用一在理论次数较小的特殊准确性。,这样才能保证检验的不应低于的期望次数至少检验时,每一个单元格时,在进行当自由度等于个以上。的期望次数应该至少在,每一个单元格中值合理准确的近似估计分布成为为了努力使(三)期望次数的大小互独立最安全的做法。值,这是确保观测值相每个被试只有一个观测同被试的总数,要求值的总数等于实验中不在实验研究中,让观测(二)观测值相互独立互不包容(一)分类相互排斥,检验的假设二、2222210154第一节检验概述2可使用麦内玛检验。(如前后测设计),则牵涉到重复测量设计时检验法。当单元格内容则应使用费舍精确概率时,时,或样本总人数低于于以校正。若期望次数小,可用耶茨校正公式加于但高元格的期望次数低于的列联表检验中,若单在第四,使用校正公式。。这些被去除的母总体中研究的结论不能推论到可将该类被试去除,但研究价值时,的类别又不具有分析与本无法增加,次数偏低第三,去除样本法。样。方法是直接增加样本数想获得有效样本,最佳如无法改变分类方式又第二,增加样本数。分单元格予以合并。整变量分类方式,将部配合研究目的,适当调第一,单元格合并法。,处理的方法有四种:当单元格的人数过少时显。检验的结果偏差非常明则,否大于以上的单元格理论值要形出现。通常需要有导致统计检验高估的情时可能违反基本假设,,小于的理论次数不得小于检验时,要求各单元格运用性校正三、小期望次数的连续20551022580%55225第三节检验概述2母总体是异质的。个质的,反之,则说这两可以说两个母总体是同果两样本没有差异,就如单一变量的分布情形,质性检验检测双样本在具有显著差异。当用同否在某一个变量的反应是于鉴定不同人群母总体同质性检验主要目的在的态度是否有关系。例如性别与对某个问题物。所要研究的两个不同事。所谓的两个因素是指是否具有独立性的问题或种分类之间是否有关联两个或两个以上因素各独立性检验是用来检验合性检验。种检验又可称为正态吻正态性进行检验时,这数据的差假说检验。当对连续检验方法有时也称为无是否接近,这种数实际观察数与某理论次验一个因素多项分类的配合度检验主要用来检等。性检验、同质性检验等,如配合度检验、独立,可以细分为多种类型检验因研究的问题不同检验的类别三、2226第二节配合度检验一、配合度检验的意义配合度检验是应用检验方法的一种,主要用于检验实际观测次数与某理论次数是否有差别的情况。它适用一个因素多项分类的计数资料,所以又称做单因素分类检验或单向表的检验。进行配合度检验,应当注意自由度的确定和理论次数的计算。1.配合度检验自由度确定与下列两个因素有关:一是实验或调查中分类的项数;二是计算理论次数时,用到的统计量的个数。自由度=资料分类的数目-计算理论次数时所用的统计量的个数。2.理论次数的计算,一般是根据某种理论,按一定的概率通过样本即观测次数计算。通常用到无差假说、正态分布、二项分布等理论模型。2227二、无差假说的检验•无差假说是指各项分类的次数没有差异,即假设各项分类之间的机会均等,或概率相等。因此,理论次数完全按概率相等的条件计算,其公式为:分类项数总数1ef8例8随机抽取60名学生,问他们高中要不要文理分科,回答赞成的39人,反对的21人,问对分科的意见有无显著差异?解:.05.001.0,63.64.584.363.6,84.3:;112:34.5303021303039:2:;30::1305.060201.1205.12220220100度有差异故对高中文理分科的态查表得统计决断值计算建立假设PdffffffHffHfeeeee9例9大学某系54位老年教师中,健康状况属于好的有15人,中等的有23人,差的有16人,问该校老年教师中三种健康状况的人数是否一样?解:.,,,05.0,99.511.299.5,,213:311.218181618182318181518354:,:2,,:,,::1205.022222210差三种人数无显著差异中健康状况好故该校老教师中查表得统计决断其理论频数为根据零假设值计算差三种人数不相同中健康状况好差三种人数相同中健康状况好建立假设PdffHHe10三、频数分布是否符合正态性的检验•检验还可以检验某些实得次数是否合乎正态分布。不过,在计算时,要注意把常态分布的概率,转换为理论次数的数值。即要用常态分布的概率乘以总次数得出理论次数的分配。•例10对50名学生进行操行评定,分优、良、中、差四等,评定的结果是:优7人,良22人,中18人,差3人,试检验其分布的形式是否合乎正态分布?211例10的计算:解:正态分布的基线上四等份,每等份=(3σ+3σ)/4=1.5σ概率P优73.53.53.5良2221.50.50.01中0.431821.5-3.50.57差0.0733.5-0.50.07合计50504.15eefff20eff00fef07.00655.04332.04987.043.04332.012例10的计算(续)由上表得:.,5005.0,81.715.481.7:,31415.4205.032其人数接近正态分布名学生的操行评定故查表得Pdf13四、连续变量分布的吻合性检验•理论次数:•自由度:例11表12-5所列资料是552名中学生的身高次数分。问这些学生的身高是否符合正态分布?Npfie计量的数计算理论次数时所用统组数df14例11解:表12-5理论曲线的配合度检验身高分组组中值XC实际次数离差Z分数查表Y169-166-163-160-157-154-151-148-145-142-139-17016716416115815515214914614314027225711012411280258415.3812.389.386.383.380.38-2.62-5.62-8.62-11.62-14.623.032.441.851.260.67.07-0.52-1.11-1.70-2.29-2.880.004.00203.0720.1840.3187.3979.3484.2154.0940.0289.0067.00237.01201.04260.10888.18858.23544.20615.12746.05562.01710.00396172460104130114703192.167.150.471.277.0351.4291.161SiYpNpfeeefff20125.090.07.5,62.154,552SXN552ef905.3215例11解(续)•如果两端的组中的理论次数均有小于5的,则需要将相邻的理论次数合并至大于5。本题共分11组,两端均有理论次数小于5,上端二组合并为一组,下端二组合并为一组,然后将实际次数也相应合并之后,再求值,本题由上面解得:。•df=9-3=6,查值表得:因为3.90312.6,所以P0.05,差异不显著。故这552名中学生的身高分布符合正态分布。905.32226.12205.616五、两项分类且某类理论次数小于5的连续性校正•当只有两项分类(自由度为1)并且某项的理论次数小于5时,比率的检验不能用正态近似,而应用二项分布概率计算。若用检验,就要运用耶茨(yetes)连续性校正法,即在每一组实际频数与理论频数差数的绝对值平方之前,各减去0.5,用公式表示:2eefff2025.017例12有一学校共评出10名优秀学生班干部,其中男生3名,女生7名,问优秀学生班干部是否存在男女性别差异?解:假设无性别差异,则p=q=0.5,那么男女应各有5人,这时需要使用亚茨校正公式。.,05.0,84.39.084.3:19.055.05755.053205.01222不存在男女性别差异故优秀学生班干部中查表得Pdf18第三节独立性检验•独立性检验也是检验的又一重要应用,它主要用于两个或两个以上因素多项分类的计数资料分析。如果想研究两个(或两个以上因素)之间是否具有独立性或有无关联,就要用检验独立性检验。•如果两个因素是独立的,即无关联,就意味着当其中一个因素变化时,另一个因素的变化是在取样误差的范围之内;反之,如果两个因素是非独立,即有关联或称有交互作用存在,当其中的一个自变量(因素)变化时,另一个因素的变化就超过了取样误差的范围。2219一、独立性检验的一般问题•检验主要研究两个因素或两个以上因素多项分类的计数资料的独立性问题。如果两个因素中的一个因素有R类,另一个因素有C类,这种表称之为R×C表,即二维列联表。特殊的列联表是2×2表。因素若是多于两个,这种表称为多维表,多维列联表的分析较为复杂,本节从略,这里仅介绍二维列联表的检验。2220一、独立性检验的一般问题•二维列联表的独立性检验的一般步骤:1.建立假设:H0:二因素之间是独立的或无关联;H1:二因素之间是有关联的或者说差异显著。(一般多用文字表述而很少用统计符号)2.计算理论次数:3.确定自由度:4.计算统计量:具体方法下面逐一介绍之。5.统计决断1312NfffjiijCRe11CRdf21二、2×2列联表(四格表)独立性检验㈠独立样本四格表的检验:四格表独立样本,即从总体中随机取样,然后按两个因素对个体进行分类,将观测结果分别填入四个格内,便得到独立样本四格表,当各格的理论次数时,可用基本公式(12-11),即:5ef1412b:22202dcadcbabcadNfffee算或可用下面简便公式计222例14今随机抽取90人,按男女不同性别和学生学习水平两个因素进行分类,结果如下表所示,问男女学生学业水平有无显著差异?或问性别与学业之间有无关联?中等以上中等以下合计男23(a)17(b)40(a+b)女28(c)22(d)50(c+d)合计51(a+c)39(b+d)90(a+b+c+d=N)23例14的计算解:略故差异不显著查表得统计决断即若用简便公式值计算异男女生学业水平显著差差异男女生学业水平无显著建立假设.,05.0,84.302.084.3:,1:302036.0395150402817222390:,141202.067.2167.212233.2833.282833.1733.171767.2267.2223:2:::1205.1222222202210