第五章-1常用的显著性检验方法1.1可疑值和异常值可疑值:当对同一样品进行重复测定时,一组数据中有一、两个测定值明显地偏大或偏小,称之为可疑值;eg.酸碱滴定检测中,获得下列数据:5.38,5.38,5.39,5.40,5.41,5.51可疑值的处理:1.经分析,是属于技术上的失误,不论是否属于可疑值,均应舍弃;2.若不能确定是技术上的失误,则应进行统计假设检验.§1.可疑值的检验1.2几种常用可疑值的检出方法1.利用算术平均误差δ检查•除去可疑值后,求出δ•计算可疑值与平均值之差d=|-|•若d≥2.5δ时,可疑值舍去;反之,保留.x可疑xx可疑2拉衣达准则对于实验数据x1,x2,…xn,先计算出平均值和标准差s,若某个可疑值的离均差满足|di|=|xi-|>3s(或2s),3s(或2s)作为极限误差,则认为xi是异常数据,予以剔除。选择3s还是2s作为极限误差,取决于检验的显著性水平α,或者可信度1-α.3s相当于显著性水平α=0.01,2s相当于显著性水平α=0.05.注:计算平均值和标准差时可疑值包括在内.xx3.t-检测准则实验数据按大小顺序排列:异常值可能出现在极端值Xmin=x1或Xmax=xn,若有则可以判断Xmin或Xmax为异常值,予以剔除.注:计算平均值和标准偏差时可疑值不包括在内.K(n,α)为t检验系数,可从下表中查得例1:某一酿造厂新引进一种酿醋曲种,以原曲种为对照进行试验。已知原曲种酿出的食醋醋酸含量平均为μ0=9.75%,其标准差为σ=5.30%。现采用新曲种酿醋,得到30个醋样,测得其醋酸含量平均为=11.99%。试问,能否由这30个醋样的平均数判断新曲种好于原曲种?§2统计假设检验x2.1统计假设检验的意义x食醋醋酸含量的差异是由于采用新曲种引起的还是由于试验误差引起的?例2:A,B两种肥料,在相同条件下各施用于5个小区的水稻上,水稻产量平均分别为,二者相差20kg.那么20kg差异究竟是由于两种肥料的不同而造成的还是由试验的随机误差造成的?kg520xkg500xBA=,=以上这几种问题的判断均是由样本去推断总体的,属于统计假设检验问题,均是来判断数据差异、分布差异是由处理引起,还是仅仅由于随机误差引起的。样本虽然来自于总体,但样本平均数并非是总体平均数。由于抽样误差的影响(随机误差总是存在),样本平均数与总体平均数之间往往有偏差,并把该偏差称为表面效应。0x通过试验测定得到的每个观测值,既由被测个体所属总体的特征决定,又受其它诸多无法控制的随机因素的影响。所以观测值由两部分组成,即=+总体平均数反映了总体特征,表示试验误差。若样本含量为n,则样本平均数:ixixiixinnxxii/)(可以看出,样本平均数并非总体平均数,它还包含试验误差的成分。试验表面效应为:如果处理效应不存在(即),则表面效应仅由误差造成,此时可以说两总体平均数无显著差异;如果处理效应存在,则表面效应不仅由误差造成,更主要由处理效应影响。所以,判断处理效应是否存在是假设检验的关健。00)=()=(=000x试验的处理效应试验误差小概率事件实际不可能性原理2.2统计假设检验的基本思想小概率事件在一次试验中被认为是不可能发生的。小概率事件实际不可能性原理是统计学上进行假设检验(显著性检验)的基本依据。α=0.050.010.001称之为小概率事件。小概率事件不是不可能事件,但在一次试验中出现的可能性很小,不出现的可能性很大,以至于实际上可以看成是不可能发生的。2.3统计假设检验的基本原理1.对研究总体提出假设H0:无效假设、原假设、零假设(nullhypothesis)是被检验的假设,通过检验可能被接受,也可能被否定。与H0对应的假设,只有是在无效假设被否定后才可接受的假设。无充分理由是不能轻率接受的。HA:备择假设(alternativehypothesis)无效假设:假设总体参数(μ)与某一定值(μ0)相等,记作H0:μ=μ0或两个总体参数(μ1,μ2)相等,记作H0:μ1=μ2,或H0:μ1-μ2=0,即假设处理间没有效应,无显著差异。备择假设:与无效假设相对应的另一种统计假设,记作HA:μ≠μ0或HA:μ1≠μ2;如果测验结果接受了无效假设,说明无显著差异,当然备择假设被否定;反之,否定了无效假设,说明差异显著,也就是接受了备择假设。如前例,原假设H0:,即假设由新曲种酿造出的食醋的醋酸含量与原菌种酿造的食醋醋酸含量相等,这个假设表明:采用新曲种酿造食醋对提高醋酸含量是无效的,试验的表面效应是随机误差引起的。%==75.90对应的备择假设为,即表明:采用新曲种酿造食醋能够改变醋酸含量,试验的处理效应存在。%=75.90对前例分析,无效假设H0:成立,试验的表面效应是随机误差引起的。那么,可以把试验中所获得的看成是从总体中抽取的一个样本平均数,由样本平均数的抽样分布理论可知,%==75.90nxnxu/020x~N(μ0,σ2/n)。x0构造统计量:~N(0,1)(4-1)由样本值计算统计量u值,315.230/053.00975.0119.0/020==nxnxu由正态分布双侧分位数(uа)可知01.058.2uP05.096.1uP==本例计算出的统计量u=2.315,1.962.58,所以可推知其概率315.2uPu0.010.05结果表明:本试验的表面效应=0.0224完全由试验误差造成的概率在0.01-0.05之间,属于小概率事件。0x•当试验的表面效应是试验误差的概率大于0.05时,即P0.05,则说明无效假设成立的可能性大,不能被否定,因而接受无效假设。•当试验的表面效应是试验误差的概率小于0.05时,即P《0.05,可以认为在一次试验中试验表面效应是试验误差实际上是不可能的,因而否定原先所作的无效假设H0,接受备择假设HA,即认为试验的处理效应是存在的。2.根据“小概率事件实际不可能性原理”否定或接受无效假设在统计假设检验中,否定或接受无效假设的依据是“小概率事件实际不可能性原理”。用来确定否定或接受无效假设的概率标准叫显著性水平(significancelevel),记作α。在试验研究中常取α=0.05或α=0.01。2.4统计假设检验的显著性水平差异测验显著水平的确定当0.01≤α≤0.05时,认为差异显著,标记“*”号,否定H0;当α≤0.01时,便认为差异非常显著,标记“**”号;当α>0.05时,则认为其差异不显著,其真差为零,差数来自抽样误差。因而接受H0。究竟选用那个显著性水平呢?应根据试验要求或试验结论的重要性而定。一般试验材料的变异系数大,难以控制的因素较多,试验误差大,选定α=0.05即可。对试验精度要求较高,不允许反复或试验结论应用事关重大,一般α≤0.01,甚至选用α≤0.001。统计假设检验的步骤建立假设。对样本所属总体提出假设,包括无效假设H0和备择假设HA;确定显著水平α。常用的显著水平α=0.05和α=0.01;从无效假设H0出发,根据样本提供信息构造适宜统计量,并计算统计量值或概率;由附表查出相应的统计量临界值,比较样本统计量值与临界值大小,根据小概率原理做出统计推断。在上述显著性检验中,对应于无效假设的备择假设为。它包含了或两种可能。因而有两个否定域,分别位于分布曲线的两尾。对两尾进行检验的方法称为双尾检验.00:H0:AH002.5双尾检验与单尾检验双尾检验这个假设检验的目的在于判断μ与μ0有无差异,而不考虑谁大谁小。这样,在α水平上否定域有两个和,对称地分配在u分布曲线的两侧尾部,每侧的概率为α/2,如下图所示。这种利用两尾概率进行的检验叫双侧检验(two-sidedtest),也叫双尾检验(two-tailedtest),为双侧检验的临界u值。u,,uu单尾测验例:某酿醋厂曲种酿造醋的醋酸含量保证在12%以上,则其假设H0:μ12%,HA:μ≤12%。如果选择的新曲种酿造醋的醋酸含量小于12%,H0被否定,μ只能大于12%,若小于12%,便不符合规定的企业标准,没有推广价值。因此,只是在正态曲线的右尾一个否定域。又如:国家规定酿造白酒中的甲醇含量不得大于0.1%,因此,其否定域只是在正态曲线的左侧才有意义。这类测验称为单尾测验。§3样本平均数的假设检验在实际工作中我们往往需要检验一个样本平均数与已知的总体平均数是否有显著差异,即检验该样本是否来自某一总体。3.1单个样本平均数的假设检验常用的检验方法有u检验和t检验。3.1.1单个样本平均数的u检验u检验(u-test):在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。u检验的应用范围:1.样本资料服从正态分布N(μ,σ2),并且总体方差σ2已知;2.总体方差虽然未知,但样本平均数来自于大样本(n≥30)。【例1】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?符合u检验条件:样本服从正态分布,总体方差σ2=64。需作两尾检验:每罐平均净重可能高于或低于正常工作状态下的标准净重。(1)提出假设。无效假设H0:μ=μ0=500g,即当日装罐机每罐平均净重与正常工作状态下的标准净重一样。备择假设HA:μ≠μ0,即罐装机工作不正常。(2)确定显著水平:α=0.05(3)构造统计量,并计算样本统计量值。70.50210510512505nxxi===均数标准误:530.2108nx===样本平均数:统计量u值:067.110/850070.502/0==nxu(4)统计推断。由显著水平α=0.05,查附表,得临界值u0.05=1.96。实际计算出的表明:试验表面效应仅由误差引起的概率P0.05,故H0成立,即当日装罐机工作正常。96.1u067.1u05.0==xSxt0t统计量3.1.2单个样本平均数的t检验t检验(t-test):利用t分布来进行统计量的概率计算的假设检验方法。应用范围:主要应用于总体方差未知的小样本资料(n30).nSSx=均数标准误例4-2用山楂加工果冻,传统工艺平均每100g加工500g果冻,采用新工艺后,测定了16次,得知每100g山楂可出果冻平均为=520g,标准差S=12g。问新工艺与老工艺在每100g加工果冻的量上有无显著差异?采用双侧t检验:本例总体方差未知,又是小样本。(1)提出无效假设与备择假设,即新老工艺没有差异。,新老工艺有差异。00:H0:AHx(2)确定显著水平α=0.01(3)计算t值x**667.635005200==xSuxt151611ndf自由度=520g,S=12g31612===均数标准误nSSx(4)查临界t值,作出统计推断由=15,查t值表,得t0.01(15)=2.947,因为|t|t0.01,P0.01,故应否定H0,接受HA,表明新老工艺的每100g加工出的果冻量差异极显著。df在实际工作中还经常会遇到推断两个样本平均数差异是否显著的问题,以了解两样本所属总体的平均数是否相同。对于两样本平均数差异显著性检验,因试验设计或调查取样不同,一般可分为两种情况。3.2两个样本平均数的差异显著性检验3.2.1成组资料平均数的假设检验成组设计:当一个试验只有两个处理的时,可将试验单元完全随机地分成两组,然后对两组试验单元各自独立地随机施加一个处理。在这种设计中两组的试验单元相互独立,所得的两个样本相互独立,其含量不一定相等。这种试验设计为处理数k=2的完全随机化设计。这样得到的试验资料为成组资料。成组设计数据资料的一般形式见下表。表1成组设计(非配对设计)资料的一般形