统计假设检验(1)12统计假设检验统计假设检验是依据一定的原理,利用样本信息,根据一定概率,对总体参数或分布的某一假设做出拒绝或保留的决断。Z检验,t检验,F检验,x2检验一、统计假设检验的一般原理(一)统计假设检验的逻辑思想一般科学研究的逻辑思想提出假设检验假设(根据已知进行运算,看运算结果与提出的假设的符合程度而做出推断)3统计假设检验的逻辑思想提出假设检验假设(根据已知在概率和抽样分布理论下进行运算,看运算结果与提出的假设的符合程度而做出推断)1、假设假设检验一般提出两个相互对立的假设虚无假设(原假设或零假设)指当前样本所属的总体与假设总体无区别的假设,往往是研究着根据样本信息希望拒绝的假设。用H0表示。备择假设(研究假设)指当前样本所属的总体与假设总体相反的假设,往往是研究着根据样本信息希望证实的假设。用H1表示。举例:42、小概率事件样本统计量的值在抽样分布上出现的概率小于或等于事先规定的水平(一般取0.05或0.01),这时,就认为小概率事件发生。样本统计量的值和总体参数值之间总会有差异,那么差异的原因是什么?总体下一切样本统计量的值,应当以总体参数值为中心形成该种统计量的一个抽样分布,如果样本统计量的值在其抽样分布上出现的概率较大,我们认为这个样本来自于这个总体,样本统计量的值和总体参数值之间的差异是由抽样误差所致;如果这个样本统计量的值在其抽样分布上出现的概率极小,根据小概率事件在一次随机抽样中几乎不可能发生这一理论,我们否认这个样本来自于这个总体。5例:某县抽样检查小学五年级数学学科教学质量,每个学校按照1:10的比例从本校的五年级学生考试成绩中随机抽取一部分学生的成绩。某校按比例从本校五年级学生中随机抽取36名,这36名学生的平均成绩为86分,而全校五年级学生本次考试的平均成绩为82分,标准差为10分,问抽出的36名学生成绩与全校五年级学生成绩是否一致。H0:;H1:为36名学生所在的真正水平总体的平均数,是它的代表值;是目前该校五年级学生所在总体的平均数学成绩。6如果检验结果成立,则说明这两个总体是一个水平的总体,4分差距是由随机因素造成的;如果检验结果拒绝,则说明这36名学生成绩与全校五年级学生成绩不一致,不属于同一水平的总体。H0成立与否,也就是要看一下这36名学生组成的这个样本的平均成绩在其抽样分布上是否属于小概率事件。当取时,故36名学生组成的这个样本的平均成绩在其抽样分布上属于小概率事件,36名学生成绩与全校五年级学生成绩不一致。7显著性水平的确定,根据实际情况或问题需要确定,一般取(二)统计假设检验的两种方式双尾检验对两总体参数间差异的方向无法确定或根本不关心其差异方向时,用双尾检验。H0:;H1:单尾检验如果在检验前根据某些理论或经验已知其中一总体参数大于另一总体参数时,用单尾检验。或8(三)统计假设检验中的两类错误统计假设检验的四种可能:其中四种可能中有两种判断正确,两种判断错误。如下表控制两类错误常采用的三种方法:选取适当的显著性水平;合理安排单尾或双尾检验;适当增加样本容量。真实情形所作判断接受H0拒绝H0H0为真正确概率等于第一类错误概率等于H0为伪第二类错误概率等于正确概率等于9(四)统计假设检验的一般步骤1、建立假设在确定单尾检验还是双尾检验的基础上建立虚无假设H0和备择假设H1。2、选择和计算统计量在虚无假设成立的前提下选择合适的抽样分布和统计量,并计算统计量的值。常用的抽样分布及相对应的检验方法3、确定显著性水平及显著性水平下抽样分布的临界值。4、进行统计决断,判断结果并解释。二、单总体假设检验单总体假设检验是指对样本统计量与已知总体参数之间差异的显著性检验。10(一)总体平均数的显著性检验总体平均数的显著性检验是指对样本平均数与已知总体平均数之间的差异进行的显著性检验。差异原因:①②检验目的:确定差异由哪种原因造成。1、总体正态分布,总体标准差已知无论样本大小,均采用Z检验。例:某小学历届毕业生汉语拼音测验平均分数为66分,标准差为11.7分。现以同样试题测验应届毕业生(假定两届毕业生条件基本相同),并从中抽取18份试卷,算得的平均分为69分,问该校应届与历届毕业生的汉语拼音测验成绩是否一致。11练习:某小学三年级学生期末语文考试平均成绩为77分,标准差为9分。甲班参加该考试的有25人,平均成绩为80分。问该班学生成绩是否与全校成绩一致。例:某市高中入学考试数学平均分数为68分,标准差为8.6分,其中某所中学参加此次考试的46名学生的平均分数为63,过去的资料表明,该校数学成绩低于全市平均水平,问此次考试该校数学平均分数是否仍显著低于全市平均分数。2、总体正态分布,总体标准差未知A、大样本时可用Z检验12例:某年高考某市数学平均分为60分,现从此次参加考试的文科学生中,随机抽取94份试卷,算得平均分为58分,标准差为9.2分,问文科考生数学成绩与全市考生的成绩是否一致。练习:某市调查表明,一年级儿童的平均身高为116.5厘米,某调查组从该市的一所小学一年级中随机抽取49名儿童,测得他们的身高如下。问该校一年级学生的平均身高是否与全市儿童的平均身高一致。113,109,112,107,109,120,117,100,119,122,108,135,111,125,108,110,170,130,120,131,119,99,122,115,98,106,118,105,119,120,118,129,134,94,123,125,99,114,116,121,110,115,120,99,127,100,124,128,11813B、小样本时抽样分布服从自由度为n-1的t分布,用t检验例:某区初三英语统一测验平均分为65分,该区某校随机抽取20分试卷的分数为:72、76、68、78、62、59、64、85、70、75、61、74、87、83、54、76、56、66、68、62。问该校初三英语平均分数与全区是否一致。练习:某地区五年级英语统一考试平均成绩为68分,该区某小学五年级22份试卷的分数分别为:72、74、65、80、83、60、78、59、63、76、81、67、54、70、75、55、88、73、69、66、50、68。问该校五年级英语平均成绩是否与全区一致。14例:某校上一届初一学生自学能力测验平均分数为38,这一届初一24名学生自学能力测验的平均分数为42,标准差为5.7分,假定两届学生学习条件相同,问这一届初一学生的自学能力是否高于上一届。练习:某小学上届四年级学生自学能力测验平均分为30分,这一届四年级20名学生自学能力测验的平均分为38分,标准差为6分,假定两届学生学习条件相同,问这一届四年级学生的自学能力是否高于上一届学生。3、总体非正态分布的大样本可以近似的看作正态分布,用Z检验15例:某小学三年级一班有学生49人,语文教师在该班进行语文教法改革试验,通过语文教学培养学生的阅读能力。期末全校三年级学生阅读能力测验的平均成绩为68分,而一班学生的平均成绩为71分。标准差为12分,问该班阅读成绩是否高于该年级的平均成绩。(二)总体比率的显著性检验总体比率的显著性检验就是检验样本比率与总体比率之间的差异是否显著。当时,(的较小者)二项分布近似服从正态分布,故可用Z检验来检验比率之间的差异是否显著。16例:某市中学教师中大学本科毕业的比率为0.60,现从某区随机抽取50名中学教师,其中大学本科毕业的有32人,问该区中学教师大学本科毕业的比率与全市中学教师大学本科毕业的比率是否有显著差异。练习:某市幼儿患龋齿的比率为0.62,现从该市某幼儿园随机抽取40名幼儿进行检查,结果发现其中29名幼儿患有龋齿。问该幼儿园幼儿患龋齿的比率与全市幼儿患龋齿的比率是否一致。17(三)总体相关系数的显著性检验总体相关系数的显著性检验就是检验所求得的相关系数r与总体相关系数之间是否有显著性差异。18相关系数抽样分布的形态随总体相关系数和样本容量的大小而变化。相关系数检验的基本原理因为样本相关系数r的抽样分布随总体相关系数和样本容量n的大小而变化。当时,样本相关系数的抽样分布是对称的——大样本时服从正态分布,小样本时服从t分布;当时,样本相关系数的分布一般为偏态。因此,实际推断时,常根据原假设两种情况分布采取不同的检验方法。1、原假设为H0:(1)直接查表通过查相关系数临界值表找到(df=n-2),然后比较计算出的r值与查表得到的临界值的大小。19如果,则拒绝原假设,说明样本相关系数与零相关有显著差异;如果,则保留原假设,说明样本相关系数与零相关无显著差异。(2)利用公式标准误故当原假设为H0:时,检验样本相关系数与总体相关系数之间的差异,可以用t检验,其公式为(df=n-2)20然后通过查t值表找到,然后比较计算出的t值与查表得到的的大小。如果,则拒绝原假设,说明样本相关系数与零相关有显著差异;如果,则保留原假设,说明样本相关系数与零相关无显著差异。以上两种方法主要适用于积差相关系数检验和斯皮尔曼等级相关系数检验。例:10名学生初一数学分数与初二数学分数的相关系数r=0.78,问从总体上来说,初一与初二数学分数是否存在相关?练习:某数学老师从自己班中随机抽取38名学生的期中、期末数学成绩,其相关系数为0.7。从总体上来说,学生的期中与期末数学成绩是否存在相关?2110名高三学生学习潜在能力与自学能力测验成绩等级相关计算表学生序号(1)学习潜在能力自学能力等级差数D(6)差数平方D2(7)X(2)等级(3)Y(4)等级(5)123456789109084767171716968666412355578910325786871092135.57.547.55.5109-110-0.5-2.51-0.52.5-111100.256.2510.256.2511总和1822例:10名高三学生学习潜在能力测验与自学能力测验成绩如上表,问从总体上说,两者是否存在相关?练习:某小学两名领导对本校10名教师的工作情况进行综合评定,每人的评定结果以等级记录。问这两位领导对这10名教师的评定结果是否一致?2、原假设为H0:此时,r的抽样分布呈偏态,不过我们可以对其进行转换,将r值转换成Zr值,由于Zr服从正态分布,故可以采用Z检验,公式为:23例:29名学生期中与期末考试成绩的相关系数r=0.30,问这一相关系数是否来自于全年级期中与期末考试成绩的相关系数为0.64的总体?练习:某小学三年级语文测试,随机抽取该年级39名学生的期中与期末考试成绩的相关系数为r=0.25。问这一相关系数是否来自全年级学生期中与期末语文考试成绩的相关系数为0.34的总体?3、其他相关系数的显著性检验A、肯德尔和谐系数的显著性检验肯德尔和谐系数的检验主要是检验相关系数是否来自零相关的总体。可分为两种情况:24(1)当3≤N≤7时,可直接查肯德尔和谐系数临界值表,判断R的离散性方法:求R的离差平方和,即然后查表,根据一定的显著性水平及K和N的数目,查对应的值,并与SSR比较做出决断。例:某小学进行作文比赛,下面是6位教师对7名参赛学生的评定成绩。6位教师对7名学生作文的评定是否一致,并检验。(2)当N>7时,用。公式为:若计算的值达到一定的显著性水平临界值,则肯德尔和谐系数不是来自于零相关总体,肯德尔和谐系数有意义。例:同一位教师对8份语文试卷先后评定3次的肯德尔和谐系数rW=0.75,请检验这名教师对试卷评定的一致性程度。256位教师对7名小学生作文的评定等级教师作文123456RR21234567312276547767233111121432456353675625764544213611132631304411296121169676961900∑168456426学生12345678910111213141516总分68979075927493899578776080648988第4题得分0110110110101010B、点二列相关系数的显著性检验点二列相关系数的检验主要是检验相关系数是否来自零相关