几种描述性统计分分析的SAS过程

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

几种描述性统计分析的SAS过程简介1.PROCMEANS过程计算SAS数据集中各变量值的位置、分散性、分布形状等数字特征。基本语句:PROCMEANSoptions;VARvariables;OUTPUTOUT=datasetnamekeyword=name…;RUN;说明:(a)“options”一般选项为:(i)以DATA=SASdatasetname指定所分析的SAS数据集名称;(ii)指定欲计算的特征数字名称(关键词,由SAS系统规定),包括N,MEAN,STD,VAR,MIN,MAX,RANGE,SUM,USS,CSS,SKEWNESS,KURTOSIS等。(b):“variables”指定要计算前面所列数字特征的SAS数据集中的变量名称(须是数值型变量)。(c):第三句建立一个包含指定分析结果的SAS数据集,其中“datasetname”为用户指定数据集名称;“keyword”可以是前面关键词的任一个,等号后的“name”为用户赋予的相应关键词的新名称(若省略,则系统以原变量的名称作为相应结果的名称)。例如:若“variables”部分为:X1X2X3,若用OUTPUTOUT=resultsMEAN=VAR=;则这三个变量的均值和方差仍用X1,X2,X3命名。若用OUTPUTOUT=resultsMEAN=MX1MX2MX3VAR=VX1VX2VX3;则这三个变量的均值以此命名为:MX1MX2MX3;方差依次命名为:VX1VX2VX3。2.PROCUNIVARIATE过程此过程除可完成PROCMEANS过程类似的一些分析外,还具有计算数据的分位数、绘制茎叶图和QQ图、对数据进行正态性检验等功能。基本语句:PROCUNIVARIATEoptions;VARvariables;OUTPUTOUT=datasetnamekeyword=name…;RUN;说明:(a)“options”部分的选项包括:(i)DATA=SASdatasetname:指定欲分析的SAS数据集名称;(ii)PLOT:要求对所分析的各变量的观测值产生一个茎叶图和一个正态QQ图;(iii)NORMAL:要求对各变量的观测值作做正态性检验并输出检验统计量的观测值及检验p-值(n=2000,W检验;n2000,Kolmogorov-Smirnov检验)。(b)该过程第二句和第三句的用法与PROCMEANS过程基本相同,只是在“keyword=name”中的“name”不可省略,必须由用户给相应关键词赋予具体名称。(c)PROCUNIVARIATE过程的默认输出结果除包括PROCMEANS中全部关键词所对应的特征数字以及中位数等外,还有如下关键词选项:Q1:下四分位数;Q3:上四分位数;QRANG:四分位极差;P1:1%分位数;P5:5%分位数;P10:10%分位数;P90:90%分位数;P95:95%分位数;P99:99%分位数。3.PROCCAPABILITY过程该过程除具有PROCUNIVARIATE过程同样的分析功能外,还可以画QQ图、直方图、经验分布函数曲线、拟合参数分布函数以及概率密度函数并进行相应的假设检验等。(1)画直方图基本语句为:PROCCAPABILITYoptions;HISTOGRAMvariables/options;RUN;说明:(a)第一句中的“options”可包括下列选项:(i)以DATA=SASdatasetname指出欲分析的数据集名称;(ii)GRAPHICS:要求作高分辨率图(只适用低版本);(iii)NOPRINT:阻止输出有关变量的描述性分析结果。(b)第二句中的“variables”用以指定作直方图的变量(一个或多个)名称,“options”部分可以包括下列选项:(i)MIDPOINT=variables:设置分组区间的中点值(等间隔,其值依次列出)。或用MIDPOINT=aTObBYc指定区组。省略时系统自动分组;(ii)VSCALE=COUNT(或PERNT或PROPOTION):指定纵轴为频数(或分数或频率);(iiI)NORMAL(或LOGNORMAL,GAMMA,WEIBULL,BETA,EXPONETIAL):要求在相应直方图上拟合制定分布的概率密度函数,其中的参数系统直接用极大似然估计代替,也可在其后加括弧有用户指定(具体见教材P266)。此外,还对所拟合的分布输出分布拟合检验(包括:卡方,Kolmogonov-Smirnov,Anderson-Darling,Cramer-vonMises)统计量的值及其检验p-值。(2)作经验分布函数曲线及拟合的分布函数曲线基本语句为:PROCCAPABILITYoptions;CDFPLOTvariables/options;RUN;(3)作QQ图基本语句为:PROCCAPABILITYoptions;QQPLOTvariables/options;RUN;说明:上述两个过程中的选项与作直方图的过程的用法基本相同。更详细的解释见教材P266。4.PROCCORR过程该过程主要用于计算SAS数据集中各数值变量间的协方差矩阵和相关系数(包括Pearson相关系数阵和Spearman相关系数阵)矩阵,并且在各对变量的相关系数下的括号中给出检验响应相关系数是否为零的检验p-值。此外,此过程还自动输出一些描述性统计量(如各变量的均值、标准差等等)。基本语句为:PROCCORRoptions;VARvariables;WITHvaribles;RUN;说明:(a)第一句中“options”可包括如下选项:(i)DATA=SASdatasetname指定所分析的SAS数据集;(ii)PEARSON:要求输出Pearson相关系数矩阵;(iii)SPEARMAN:要求输出Spearman相关系数矩阵;(iv)COV:要求输出协方差矩阵;(v)NOSIMPLE:不输出各变量描述性统计量的值。(b)第二句中的“variables”即指定计算相关系数(或协方差)矩阵的(数值)变量名称。(c)第三句中与第二句合用,即要求输出以VAR中的变量“variables”和WITH中的变量“variables”两两组合的相关系数矩阵。

1 / 9
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功