一、单个样本平均数的u检验1.u检验u检验(u-test),就是在假设检验中利用标准正态分布来进行统计量的概率计算的检验方法。Excel中统计函数(Ztest)。有两种情况的资料可以用u检验方法进行分析:样本资料服从正态分布N(μ,σ2),并且总体方差σ2已知;总体方差虽然未知,但样本平均数来自于大样本(n≥30)。【例4-1】某罐头厂生产肉类罐头,其自动装罐机在正常工作时每罐净重服从正态分布N(500,64)(单位,g)。某日随机抽查10瓶罐头,得净重为:505,512,497,493,508,515,502,495,490,510。问装罐机当日工作是否正常?(1)提出假设无效假设H0:μ=μ0=500g,即当日装罐机每罐平均净重与正常工作状态下的标准净重一样。备择假设HA:μ≠μ0,即罐装机工作不正常。(2)确定显著水平α=0.05(两尾概率)(3)构造统计量,并计算样本统计量值样本平均数:均数标准误:统计量u值:(4)统计推断由显著水平α=0.05,查附表,得临界值u0.05=1.96。实际计算出的表明,试验表面效应仅由误差引起的概率P0.05,故不能否定H0,所以,当日装罐机工作正常。2.t检验t检验(t-test)是利用t分布来进行统计量的概率计算的假设检验方法。它主要应用于总体方差未知时的小样本资料(n30)。其中,为样本平均数,S为样本标准差,n为样本容量。[例4-2]用山楂加工果冻,传统工艺平均每100g加工500g果冻,采用新工艺后,测定了16次,得知每100g山楂可出果冻平均为520g,标准差12g。问新工艺与老工艺在每100g加工果冻的量上有无显著差异?(1)提出无效假设与备择假设,即新老工艺没有差异。,即新老工艺有差异。(2)确定显著水平α=0.01(3)计算t值=520g,S=12g所以(4)查临界t值,作出统计推断由df=15,查t值表(附表3)得t0.01(15)=2.947,因为|t|t0.01,P0.01,故应否定H0,接受HA,表明新老工艺的每100g加工出的果冻量差异极显著。(在统计量t上标记**)70.50210510512505nxxi===530.2108nx===067.110/850070.502/0==nxu96.1u067.1u05.0==nSSx=均数标准误xSxt0t统计量00:H0:AHx31612===均数标准误nSSx**667.635005200==xSxt151611ndf自由度x二、成组资料平均数的假设检验成组设计:当一个试验只有两个处理时,可将试验单元完全随机地分成两组,然后对两组试验单元各自独立地随机施加一个处理。在这种设计中两组的试验单元相互独立,所得的两个样本相互独立,其含量不一定相等。这种试验设计为处理数k=2的完全随机化设计。这样得到的试验资料为成组资料。成组设计数据资料的一般形式见表4-1。表4-1成组设计(非配对设计)资料的一般形式成组资料的特点:两组数据相互独立,各组数据的个数可等,也可不等1.u检验(1)如果两个样本所在总体为正态分布,且总体方差和已知;(2)总体方差未知,但两个样本都是大样本(n1,n2≥30),由样本方差S12、S22分别估计总体方差σ12、σ22。在H0:μ1=μ2下,统计量为其中:即可对两样本均数的差异做出检验[例4-4]在食品厂的甲乙两条生产线上各测定了30个日产量如表所示,试检验两条生产线的平均日产量有无显著差异。表4-2甲乙两条生产线日产量记录甲生产线(x1)乙生产线(x2)747156547178655354605669625762697363584951536662617262707874585866715356776554586362607065585669596278536770687052555557(1)建立假设。即两条生产线的平均日产量无差异。(2)确定显著水平α=0.01(3)计算故:(4)统计推断。由α=0.01查附表2,得u0.01=2.58实际|u|=3.28u0.01=2.58,故P0.01,应否定H0,接受HA。说明两个生产线的日平均产量有极显著差异,甲生产线日平均产量高于乙生产线日平均产量。)21()(u21xxxx222121)21(nnxx21:AH210:H83.651=x7299.5921=S77.592=x8747.4222=S8494.1S22112122=nnSSxx**28.3S)()(u)21()21(2121==xxxxxxxx[例4-5]海关抽检出口罐头质量,发现有胀听现象,随机抽取了6个样品,同时随机抽取6个正常罐头样品测定其SO2含量,测定结果见表4-3。试分析两种罐头的SO2含量有无差异。表4-3正常罐头与异常罐头SO2含量测定结果正常罐头(x1)100.094.298.599.296.4102.5异常罐头(x2)130.2131.3130.5135.2135.2133.5(1)提出无效假设与备择假设两种罐头SO2含量没有差异;(2)确定显著水平α=0.01(两尾概率)(3)计算(4)统计推断由df=10,α=0.01查附表3得t0.01(10)=3.169。实得|t|=22.735t0.01(10)=3.169,P0.01,故应否定无效假设H0,即两种罐头的SO2含量有高度显著差异,该批罐头质量不合格。[例4-6]现有两种茶多糖提取工艺,分别从两种工艺中各取1个随机样本来测定其粗提物中的茶多糖含量,结果见表4-4。问两种工艺的粗提物中茶多糖含量有无差异?表4-4两种工艺粗提物中茶多糖含量测定结果醇沉淀法(x1)27.5227.7828.0328.8828.7527.94超滤法(x2)29.3228.1528.0028.5829.00(1)建立假设,提出无效假设与备择假设(2)确定显著水平α=0.05(两尾概率)(3)计算因两个样本的容量不等,所以(4)查临界t值,作出统计推断210:H21:AH47.981=x3267.821=S65.1322=x2350.522=S5034.1S222121=nSSxx735.225034.165.13247.982121==xxSxxt10)1(2=ndf210:H21:AH15.281=x61.282=x)11()1()1()()(221121222211nnnnxxxxSxx2121222221212111)1()1(nnnnnxxnxx332.02121xxSxxt381.13332.061.2815.2891516)1()1(21)=()=(nndf当df=9时,查临界值得:t0.05(9)=2.262,|t|=1.381t0.05(9),所以P0.05,接受,表明两种工艺的粗提物中茶多糖含量无显著差异。在成组设计两样本平均数的差异显著性检验中,若总的试验单位数()不变,则两样本含量相等比两样本含量不等有较高检验效率,因为此时使最小,从而使t的绝对值最大。所以在进行成组设计时,两样本含量以相等为好。三、成对资料平均数的假设检验非配对设计要求试验单元尽可能一致。如果试验单元变异较大,如试验动物的年龄、体重相差较大,若采用上述方法就有可能使处理效应受到系统误差的影响而降低试验的准确性与精确性。为了消除试验单元不一致对试验结果的影响,正确地估计处理效应,减少系统误差,降低试验误差,提高试验的准确性与精确性,可以利用局部控制的原则,采用配对设计。配对设计是指先根据配对的要求将试验单元两两配对,然后将配成对子的两个试验单元随机地分配到两个处理组中。配对的要求是,配成对子的两个试验单元的初始条件尽量一致,不同对子间试验单元的初始条件允许有差异,每一个对子就是试验处理的一个重复。配对的方式有两种:自身配对与同源配对。自身配对:指在同一试验单元进行处理前与处理后的对比,用其前后两次的观测值进行自身对照比较;或同一试验单位的不同部位的观测值或不同方法的观测值进行自身对照比较。如观测用两种不同方法对农产品中毒物或药物残留量的测定结果变化,同一食品在贮藏前后的变化。同源配对:指将非处理条件相近的两个试验单元组成对子,然后对配对的两个试验单元随机地实施不同处理或同一食品对分成两部分来接受不同处理。配对试验加强了配对处理间的试验控制(非处理条件高度一致),使处理间可比性增强,试验误差降低,因而,试验精度较高。成对资料与成组资料相比,成对资料中的两个处理间的数据不是相互独立的,而是存在某种联系。配对设计试验资料的一般形式见表4-5。【例4-8】为研究电渗处理对草莓果实中的钙离子含量的影响,选用10个草莓品种进行电渗处理与对照处理对比试验,结果见表4-5。问电渗处理对草莓钙离子含量是否有影响?表4-5电渗处理对草莓钙离子含量的影响品种编号12345678910电渗处理X1/mg22.2323.4223.2521.3824.4522.4224.3721.7519.8222.56对照X2/mg18.0420.3219.6416.3821.3720.4318.4520.0417.3818.42差数(d=X1-X2)4.193.103.615.003.081.995.921.712.444.14(1)建立假设,即电渗处理后草莓钙离子含量与对照钙离子含量无差异(2)确定显著水平α=0.01(3)计算(4)查临界t值,作出统计推断根据df=n-1=9,查临界t值:t0.01(9)=3.250210:H21nn21xxS00dH:0dAH:518.31018.35i==ndd4209.0)110(1010/18.357084.139)1(n/)()1(2222==nnddnnddnSSdd**358.84209.0518.3==dSdt91101==ndf将计算所得t值的绝对值与临界值比较,因为|t|=8.358t0.01(9),P0.01,否定H0,接受HA,表明电渗处理后草莓钙离子含量与对照钙离子含量差异极显著,即电渗处理极显著提高了草莓钙离子含量。一般说来,相对于成组设计,配对设计能够提高试验的精确性。配对内的误差是相同的且是随机的;配对间的误差不同,但它们是独立的,可分离出来,为系统误差。在进行两样本平均数差异显著性检验时,亦有双侧与单侧检验之分。关于单侧检验,只要注意问题的性质、备择假设HA的建立和临界值的查取就行了,具体计算与双侧检验相同。四、二项百分率的假设检验1.单个样本百分率的假设检验一个样本百分率与已知总体百分率的差异显著性检验需要检验一个服从二项分布的样本百分率与已知的二项总体百分率差异是否显著,其目的在于检验一个样本百分率所在二项总体百分率p是否与已知二项总体百分率p0相同。【例4-9】某微生物制品的企业标准规定有害微生物超标产品不准超过1%(p0),现从一批产品中抽取500件(n),发现有害微生物超标的产品有7件(x)。问该批产品是否合格?(1)提出假设即该批产品合格;(2)计算所以(3)作出统计推断由一尾概率α=0.05查附表,得一尾临界值u0.05=1.64,实际计算,p0.05,表明该批产品达到了企业标准,为合格产品。%1:00=ppH0:ppHA014.05007nxˆ===pnpp)1(00p00445.0500)01.01(01.0p0ˆppu899.000445.001.0014.005.0u899.0u=