非参数统计讲义三--两样本检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

设X~N(112),Y~N(222)两总体X,Y相互独立,样本(X1,X2,…,Xn),(Y1,Y2,…,Ym)样本值(x1,x2,…,xn),(y1,y2,…,ym)显著性水平两个正态总体的假设检验1–2=(12,22已知))1,0(~2221NmnYXU2UuUu关于均值差1–2的检验Uu1–21–21–21–21–2原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域1–2=2tT1–21–21–21–21–2tTtT)2(~11mnTSmnYXTw2)1()1(2221mnSmSnSw其中12,22未知12=22原假设H0备择假设H1检验统计量及其在H0为真时的分布拒绝域假定甲、乙两机床截下的长度方差相等,问长度的期望值是否一样?例8-8从两台切断机所截下的坯料(长度按正态分布)中,分别抽取8个和9个产品,测得长度如下(单位:mm):甲:150,145,152,155,148,151,152,148乙:152,150,148,152,150,150,148,151,148设甲床截下的长度为X;乙床截下的长度为Y,由假定知21=22=2012112..HvsH检验假设1(150145148)150.125150.18x9.149889.149)148150152(91Y822221()(150150.1)(145150.1)(148150.1)66.88iiXX解91222289.20)9.149148()9.149150()9.149152()(iiYY150.1149.9(892)0.210800.17021/81/987.771766.8820.89T~(2)11wXYTtnmSnm2)1()1(2221mnSmSnSw05.02120.025(2)(15)2.1315tnnt0.1702TW0.H对查表得拒绝域为/2{||(15)}{||2.1315}WTtT所以应接受两样本位置和尺度检验样本之间相互独立,为位置参数,称为尺度参数。12,12,假设样本:(X1,X2,…,Xn)~i.i.d.F111x(Y1,Y2,…,Yn)~i.i.d.F222xBrown-Mood中位数检验Moses方法Mood检验Mann-Whitney秩和检验。211210211210::::HHHH两个样本检验两个独立样本两个成对相关样本MINITAB非参数统计界面与功能两个独立样本检验Brown-Mood中位数检验统计思想:用于检验两个总体抽取的样本的中位数是否相同。Brown-Mood中位数检验0xy1xyH:medmedH:medmed原理:在零假设成立时,如果数据有相同中位数,那么混合样本的中位数应该和混合前的项等。假设(X1,X2,…,Xn)~i.i.d.F(x),(Y1,Y2,…,Yn)~i.i.d.F(x-)样本来自两个相互独立总体。首先将两个样本混合,找出混合样本中位数,将X和Y按照在两侧分类计数,即:xyMxyM在给定m,n和t的时候,在零假设成立时,A的分布服从超几何分布:mn()()ktkP(Ak),kmmn()t当A值太大时,考虑拒绝零假设。计算和例子XYMxyABtMxyCD(mn)(AB)mnmnABCD总和总和HYPGEOMDIST(a,m,a+b,m+n)X样本Y样本总和观测值大于MEA=11B=4A+B=15观测值大于ME11415总和M=12N=18M+N=30从M+N=30个中抽出A+B=15个,成功A=11个,M=12,N=18PA1141141218121815153030CCCC(1)==CC例:全国30个省人均GDP,中位数4690,检验沿海省X与非沿海省Y的中位数是否有差异?P(A=11)=0.000236724拒绝H0,认为沿海省与非沿海省的中位数有显著差异。检验基本内容P-值检验统计量0H1HxyMMxyMMAAAxyMMxyMMxyMMxyMM0HP(Aa)0HP(Aa)00HH2min(P(Aa),P(Aa))对于水平,如果p-值小于,那么拒绝零假设HYPGEOMDIST(2,9,8,16)=0.01958HYPGEOMDIST(1,9,8,16)=0.00699-1---2+PA1828291699169881616CCCC()=CC=0.02028拒绝H0,认为两品牌的价格有显著差异大样本检验对于大样本情况下,可以使用超几何分布的正态近似进行检验:3Amt/(mn)ZN(0,1)mnt(mnt)/(mn)另外可求得置信区间:xyMMtc'1c'tcc1[XY,XY]其中c和c’满足:hyperhyperP(Ac)P(Ac')大样本卡方分布近似22(2)(),1ammndfmn22()(1),1()()adcbmndfmnabcd省市人均GDP沿海与否北京630291天津554731辽宁312591上海731241江苏396221浙江422141福建301231山东330831广东375891广西149661海南171751贵州88241河北232390山西203980内蒙古322140吉林235140黑龙江217270安徽144850江西147810河南195930湖北198600湖南175210重庆180250四川153780云南125870西藏138610陕西182460甘肃121100青海173890宁夏178920新疆198930中位数ME=198602008年全国经济数据Frequencies69133Median=MedianX.001.00GTestStatisticsa3119860.005.5521.0183.9501.047NMedianChi-SquaredfAsymp.Sig.Chi-SquaredfAsymp.Sig.Yates'ContinuityCorrectionXGroupingVariable:Ga.例:比较两个企业的收入X1group111110711001991102110611091108110419911011961971102110711131116111311101981X1group10721082106298210521032110210521042100296210821032104211421142113210821062992Frequencies10101010Median=MedianX1.002.00GTestStatisticsa40105.5000.00011.000.1001.752NMedianChi-SquaredfAsymp.Sig.Chi-SquaredfAsymp.Sig.Yates'ContinuityCorrectionXGroupingVariable:Ga.Datamoodtest;Dog=1,2;Inputn;Doi=1ton;Inputx@@;Output;End;End;Datalines;19111107100991021061091081049910196971071131161131109820107108106981051031101051041009610810310411411411310810699;procnpar1waymediandata=moodtest;classg;varx;run;TheNPAR1WAYProcedureMedianScores(NumberofPointsAboveMedian)forVariablexClassifiedbyVariablegSumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------1199.6666679.2564101.5255870.5087722209.3333339.7435901.5255870.466667Averagescoreswereusedforties.MedianTwo-SampleTestStatistic9.6667Z0.2689One-SidedPrZ0.3940Two-SidedPr|Z|0.7880MedianOne-WayAnalysisChi-Square0.0723DF1PrChi-Square0.7880MoodScoresforVariablexClassifiedbyVariablegSumofExpectedStdDevMeangNScoresUnderH0UnderH0Score-----------------------------------------------------------------1192789.833332406.66667355.433586146.8333332202150.166672533.33333355.433586107.508333Averagescoreswereusedforties.MoodTwo-SampleTestStatistic2789.8333Z1.0780One-SidedPrZ0.1405Two-SidedPr|Z|0.2810MoodOne-WayAnalysisChi-Square1.1621DF1PrChi-Square0.2810Wilcoxon(或称Mann-Whitney)秩和检验。是一种比较两个独立总体的均值的非参数检验方法。与参数统计的T检验相对应。由Henry.B.Mann和D.R.Whitney1947年提出。(Mann,Whitney和Wilcoxon三人共同设计的一种检验,有时也称为Wilcoxon秩和检验)如果总体服从正态分布的假设不成立,或是定序数据,不能用T检验,要用Mann-Whitney检验wethinkitisnotgaussian(tocheckot,lookataquantile-quantileplotorperformaShapiro–Wilktest)–otherwise,wewoulduseStudent’sTtest,thatismorepowerful.Mann-Whitney检验的假设条件1、样本独立2、数据至少为定序尺度检验假设:H0:两总体相同H1:两总体不同两独立样本非参数检验含义:由样本数据推断两独立总体的分布是否存在显著差异(或两样本是否来自同一总体)基本假设:H0:两总体分布无显著差异(两样本来自同一总体)将两样本混合并按升序排序分别计算两个样本秩的累计频数和累计频率两个累计频率相减.如果差距较小,则认为两总体分布无显著差异应保证有较大的样本数(大于40)应用举例–不同工艺产品寿命分布一致吗?–城镇和农村的存(取)款分布一致吗?Wilcoxon(Mann-Whitney)秩和检验它的原理:假定第一个样本有m个观测值,第二个有n个观测值。把两个样本混合之后把这m+n个观测值升幂排序,记下每个观测值在混合排序下面的秩。之后分别把两个样本所得到的秩相加。记第一个样本观测值的秩的和为WX而第二个样本秩的和为WY。这两个值可以互相推算,称为Wilcoxon统计量。该统计量的分布和两个总体分布无关。由此分布可以得到p-值。直观上看,如果WX与WY之中有一个显著地大,则可以选择拒绝零假

1 / 128
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功