SAS备课重点笔记非参数检验

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

非参数检查非参数记录分析办法(Non-parametricstatistics)是相对参数记录分析办法而言,又称为不拘分布(distribution-freestatistics)记录分析办法或无分布形式假定(assumptionfreestatistics)记录分析办法。其中涉及Wilcoxon秩和检查、Kruskal-Wallis秩和检查、friedman秩和检查等,它们分别相应不同设计类型资料。SAS中对于非参数分析办法功能实现重要由npar1way过程来完毕,从过程名字就可以看出,在此过程解决进程中,只能一次指定一种因素进行分析。下面咱们先来理解一下npar1way过程语句格式以及各语句和选项基本功能。一、npar1way过程语句格式简介npar1way过程属于SASSTAT模块,对于记录学教科书上所涉及非参数记录办法几乎都可以通过此过程来完毕。Npar1way过程基本语句格式如下。PROCNPAR1WAY选项;BY变量名;CLASS变量名;EXACT记录量选项/运算选项;FREQ变量名;OUTPUTOUT=数据集名选项;VAR变量名;RUN;QUIT;Procnpar1way语句标志npar1way过程开始,默认状况下(不列举任何选项):npar1way过程对最新创立数据集进行分析,将缺失数据排除在分析过程之外;执行方差分析过程(等同于ANOVA选项),对样本分布位置差别进行检查(与选项WILCOXON,MEDIAN,SAVAGE以及VW等效),并进行经验分布函数检查(等同于EDF选项)。此语句后可用选项见下表。Procnpar1way语句选项及其含义选项名称ABDATA=数据集名MEDIANNOPRINTSTANOVA选项功能或含义运用Ansari-Bradley评分进行分析指定要进行分析数据集运用中位数评分进行分析,即进行中位数检查禁止所有输出,用在仅需要创立输出数据集时运用Siegel-Tukey评分进行分析对原始数据进行方差分析EDFMISSINGSAVAGEVWCORRECT=NOKLOTZMOODSCORES=DATAWILCOXON1.exact语句规定计算基于经验分布记录量指定分组变量缺失值为一有效分组水平运用Savage评分进行分析运用VanderWaerden评分进行分析计算在两样本时,禁止Wilcoxon和Siegel-Tukey检查持续性校正过程运用Klotz评分进行分析运用Mood评分进行分析以原始数据为评分值进行分析对两样本进行Wilcoxon秩和检查,对多样本进行Kruskal-Wallis检查exact语句规定SAS对指定记录量(选项)进行精准概率计算。其后记录量选项可为如下项目,分别相应相应记录计算方式(可参见上表)。AB,KLOTZ,KS,MEDIAN,MOOD,SAVAGE,SCORES=DATA,ST,WILCOXON,VW等。运算选项为精准概率计算过程指定某些控制项目,如选项“mc”规定以MonteCarlo办法计算精准概率。2.output语句output语句与其他过程中相应语句大同小异,不同之处在于语句最后选项。此处选项绝大多数涉及在上表中,指定在输出数据集中包括所指定项目所相应记录量。3.var语句var语句用以指定要进行分析变量,变量必要为数值型。若省略此语句,SAS将对除by语句、class语句以及freq语句中指定变量之外所有数值型变量进行分析。二、不同类型资料非参数检查办法1.两独立样本差别秩和检查两独立样本非参数检查是在对总体分布不理解状况下,通过度析样本数据,推断样本来自两个独立总体分布与否存在明显差别,普通来说是推断两个独立总体均值或中位数与否存在明显差别。关于样本与否为独立,重要看在一种总体中抽取样本对在另一种总体中抽取样本有无影响。如果没有影响,则可以以为这两个总体是独立。零假设H:样本来自两独立总体分布没有明显差别0检查办法有各种:(1)两独立样本威克逊级别和检查(Wilcoxon秩和检查),也被称为Mann-WhitneyU检查。曼-惠特尼U检查(Mann-WhitneyU),该检查重要是通过对平均秩研究来实现推断。其基本思路是:一方面,将两组样本数据(X,X1,......X2)和(Y,Ym12,.....Yn)混合并按升序排序(m和n分别为两组样本样本容量,求出每个数据各自秩Ri;然后,分别对(X,X1,......X2)和(Y,Ym12,.....Yn)秩求平均,得到两个平均秩W/m和W/n,如果这两个平均秩相差甚远,则倾向于回绝零假设。xy(2)两独立样本K-S检查(Kolmogorov—SmirnovZ),该检查一方面将两组样本混合并按升序排序;然后,分别计算两组样本秩合计频数和每个点上合计频率;最后,将两个合计频率相减,得到差值序列数据。(3)沃尔德—沃尔福威茨游程检查(Wlad-Wolfwitzruns),该检查将两组样本混合并按升序排序,在数据排序同步,两组样本每个观测值相应样本组标志值序列也随之重新排列;然后,对这个标志值序列求游程。如果样本所属两总体分布形态存在较大差距,那么计算出游程数会相对比较小。如果游程数比较大,则应当是由于两样本数据充分混合成果,那么它们分布应当不存在明显差别。语句后选项“Wilcoxon”指定SAS进行Wilcoxon秩和检查。【例1】下表为来自两个样本A、B测量数据,经检查知两样本方差不齐,试做非参数检查比较两组数据差别。两独立样本A、B测量数据A组714223640486398B组3561017182039【程序】对该资料,应选用Wilcoxon秩和检查(ranksumtest)办法,编制SAS程序如下:datasasuser.data10_01;dog=1to2;inputx@@;output;end;datalines;7314522636104017481863209839;procnpar1waywilcoxon;classg;varx;run;程序中因素“g”分组因素,“1”代表A组,“2”代表B组,“x”为待分析变量。Procnpar1way【成果】望值(ExpectedUnderH0项)及原则差(StdDevUnderH0项),最后还给出以近似z检查以及近似t检查所得记录量和所相应单、双侧概率值。秩和较大者作为对象记录量进行概率值计算,而非医学记录学教材上所说以较小秩和为对象记录量。在两样本量不同步,SAS以样本量较小组秩和为对象记录量,这一点则与教材上相似。datasasuser.data10_01;dog=1to2;inputx@@;output;end;datalines;7314522636104017481863209839此外,默认状态下,SAS同步给出Kruskal-Wallis检查成果。所不同是,在两样本量相似时,SAS以如果去掉“wilcoxon”:;SAS给出两组数据基本信息(样本量、秩和等);给出在零假设下各组记录量(Sumofscores项)盼classg;varx;run;则SAS给出因此办法执行成果:procnpar1way;procnpar1waydata=sasuser.data10_02wilcoxom;classg;varx;run;【例2】为了鉴别新旧两种生产办法对生产效率影响,随机抽取了22人用旧生产办法生产,25人用新生产办法生产,每人平均日产量(件)资料如下:旧办法:20312718102639454124222314113237404649555419新办法:36393125262820212421585556413749444012161524232811问两种办法对日产量影响有无明显差别(0.05)?【数据摆放】【程序】【运营成果】【程序】对于此例,将疗效当作待分析变量x,从“控制”到“近控”分别对其赋值1、2、3、4,病情则作为分组因素,同步需引入一种频度因素f,以代表不同取值状态下x频数。编制程序如下:【例3】用某药治疗不同病情老年慢性支气管炎病人,疗效见下表,比较该药对两种病情疗效。某药对两种不同病情支气管炎疗效疗效单纯型单纯型合并肺气肿控制6542显效186有效3023近控1311datasasuser.data10_03;dox=1to4;dog=1to2;inputf@@;output;end;end;datalines;654218630231311;procnpar1waywilcoxon;classg;varx;2.配对设计资料秩检查freqf;run;配对设计资料普通采用配对t检查办法进行分析,但若配对数据差数分布非正态分布,但其总体分布基本对称,则可采用Wilcoxon符号秩检查(signedranktest)作为配对t检查代替办法。Wilcoxon符号秩检查功能很高,在数据满足配对t检查规定期,符号秩检查功能可达配对t检查功能95%。SAS中符号检查(signtest)和符号秩检查功能不是在npar1way过程中实现,而是通过univariate过程来实现。也许由于这两项功能涉及是关于单变量分析缘故。【例4】采用配对设计,用某种放射线A,B两种方式分别局部照射家兔两个部位,观测放射性急性皮肤损伤限度,成果见下表。试用符号秩检查比较A,B损伤限度与否不同。家兔皮肤损伤限度编号方式A方式B139552425435155【成果】程序和前例基本相似,只依照资料特点增长了freq语句。提交程序,运营成果如下。443475555364563722528484494048104555114032124957【程序】datasasuser.data10_4;inputx1x2;d=x1-x2;datalines;395542545155434755534563225248444048455540324957;procunivariateloccount;vard;run;此例中,咱们须对两次测得数据差值进行单变量分析,因此数据步中用到赋值语句“d=x1-x2;”。Univariate过程在默认状态下即给出关于待分析变量符号检查以及符号秩检查成果,“procunivariate”语句后“loccount”选项指定SAS给出样本数据在系统指定位置参数(默认值为0)两侧分布状况,即相称于对符号检查成果进一步描述。提交执行以上程序,成果如下。此成果人们应当比较熟悉(删去了别的关于参数检查某些),注意标有“TestsforLocation:Mu0=0”某些,即为咱们所要成果,其中第一行为参数检查t检查成果,后两行则分别为符号检查以及符号秩检查分析成果。标有“LocationCounts:Mu0=0.00”某些是关于样本分布状况描述,本例为3个受试对象差值不不大于零,9个不大于零。人们需要注意,这里符号秩检查计算所得秩和与咱们在教科书上看到成果不同(教科书上计算记录量即秩和T=10),应是所根据算法不同所致,但所得P值是相似,不会影响分析成果。【例5】有两家公司设计了她们自已智商测验办法,一位心理学家随机地选用13个人同步接受这两种测验办法,成果如下表所示。试在0.05明显水平下,检查与否可宣称这两种办法无明显差别。序号12345678910111213办法一989411110210810592881009912511792办法二10510311398112109979510710310410693【数据摆放】【程序】【成果】检查办法简介:1.符号检查(Sign),该办法运用正、负符号个数多少来进行检查。一方面,将第二组样本各个观测值减去第一组样本相应观测值,如果得到差值是一种正数,则记为正号;差值为负数,则记为负号;然后计算正号个数和负号个数,通过比较正号个数和负号个数来判断两组样本分布。如果正号个数和负号个数大体相称,则可以以为两有关样本数据分布差距较小;正号个数和负号个数相差较多,可以分为两有关样本数据分布差距较大。符号检查得名于其资料是用加减号而不是用定量度量。它对于那些不能或不适当用定量测量而

1 / 22
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功