SAS过程及常用统计分析

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

3SAS过程步及简单统计分析3.1SAS过程步简介SAS过程步的一般形式为:PROC过程名[DATA=输入数据集][选项];过程语句1[/选项];过程语句2[/选项];……RUN;Data选项–用于指明所需处理的数据集名,在这里它是一个可选项参数。常用过程步的名称及功能程序步名功能SORT将指定的数据集按指定变量排序PRINT将数据集中的数据列表输出GCHART绘出高分辨率的统计图UNIVARIATE对指定的数值变量进行详细的统计描述MEANS对指定的数值变量进行简单的统计描述FREQ对指定的分类变量进行统计描述和检验TTEST进行两样本t测验ANOVA进行多变量方差分析GLM拟合一般线性模型REG拟合多重线性回归模型CORR进行指定变量的相关分析1.VAR语句语法格式为:VAR变量名1变量名2…变量名n;变量名列表可以使用省略的形式,如x1-x3等。功能:用于指定分析变量。应用实例:varmathchinese;2.MODEL语句语法格式为:MODEL因变量=自变量列表/选项;功能:统计建模过程中用来指定模型的形式。应用实例:modely=x1x2x3;3.BY语句语句格式:BYdescending变量…功能:在过程步中用来指定一个或几个分组变量,根据这些分组变量值可以把观测记录分组,然后对每一组观测分别进行指定的分析。BY语句总是与SORT过程一起使用,以便定义数据排列次序。例如:假设我们已经把class1数据集按性别排序,则下面PRINT过程可以把男、女生分别列出:procprintdata=class1;bysex;run;4.OUTPUT语句语法格式为:OUTPUTOUT=输出数据集名关键字=变量名关键字=变量名…;功能:将过程指定结果输出到一个新的SAS数据集,以便作为下步处理的输入。不同过程中把输出结果存入数据集的方法各有不同,OUTPUT语句是使用频繁的语句之一。OUT=给出了存放结果数据集的名字,关键字用于定义输出变量名,用“关键字=变量名”的方式指定了系统自动输出变量与存储变量之间的对应关系。等号后面的变量名指定了输出数据集中的存储变量名称。(程序示例)5.FREQ语句语法格式为:FREQ变量;功能:规定一个数值变量,表示数据集中观测出现的频数。6.WEIGHT语句语法格式WEIGHT变量;功能:规定一个权重变量,反映该变量在总体中的相对重要性7.ID语句语法格式为:ID变量表;功能:用来规定一个变量,以便在输出或由该过程产生的SAS数据集中,不再使用Obs,而用这些变量来识别观测。8.CLASS语句语法格式CLASS变量表;功能:定义分类变量。9.WHERE语句语法格式为:where逻辑表达式;功能:用来选择输入数据集的子集进行分析。示例:Wheremath=90chinese=60;10.LABEL语句语法格式Label变量=‘新标签’…;功能:为变量指定一个标签。(示例)11FORMAT语句语法格式:Format变量名格式描述符…;示例:FormatindayMMDDYY8.math5.1;3.2PRINT过程3.2.1PRINT过程简介在SASWindows版以前,PRINT过程是最常用的SAS过程之一。PRINT过程步列出数据集的内容,以检查变量对应输入的数据值是否正确。现在我们可能通过Viewtable表打开生成的数据集查看数据。为了输出显示一个指定的数据集,在PROCPRINT语句中使用DATA=指定数据集,语法结构如下:PROCPRINTDATA=数据集label;procprintdata=class1;varnamechinesesex;run;3.2.3全程语句1.TITLE标题语句SAS系统有一默认的输出标题,使输出的每页有一行标题,内容为“TheSASSystem”。我们可以指定自己的标题来取代SAS缺省的标题。指定标题TITLE语句格式为:TITLE'标题内容';例如,在前一例的程序前面加上一行title'2001级1班成绩表';则输出结果的标题以“2001级1班成绩表”替代了“TheSasSystem”。3.2.3全程语句2.FOOTNOTE脚注语句全程语句FOOTNOTE用于为输出添加脚注,语句格式为:FOOTNOTE'注脚内容字符串';例如:FOOTNOTE'第三章例子';则其后的输出每页底端会有脚注“第三章例子”显示,直到用另一个FOOTNOTE语句指定新的脚注,或用空FOOTNOTE语句取消脚注为止。使用方法同TITLE语句。3.2.3全程语句3.输出格式选项OPTIONS语句OPTIONS语句可以规定系统运行的一些通用选择项,比如输出是否每页有页号,是否有日期,输出的行宽,输出每一页的高度(行数),等等。其使用例如:optionsnonumbernodatelinesize=78pagesize=60;其中NONUMBER表示输出不显示页号(改用NUMBER则规定显示页号),NODATE表示不在每页显示运行日期和时间(改用DATE则显示),LINESIZE=78规定输出每行最宽不超过78个字符,PAGESIZE=60规定输出每页为60行,不足时用空行补齐。3.3简单描述统计分析3.3.1简单描述统计量的基本概念总体(Population):一个统计问题所研究对象的全体。样体(Sample):从总体中抽取一定数量的个体进行研究,这部分个体称做样本。随机抽样(RandomSample):从总体中随机抽取样本,使每个个体都有同等的机会进入样本的抽样方法称为随机抽样。3.3.2MEANS过程输出结果中统计量的命名方法:MEAN=X1-X3;MEAN=MEANX1MEANX2MEANX3;MEAN(X2)=MEANX2;说明:关键词后的变量名在输出文件中代表VAR变量的统计量值,所以他们与变量的顺序是一一对应的。MEANS过程应用Datanew;*建立数据集Inputy@@;*输入变量,变量名为yCards;*数据块开始数据块;*数据块结束Procmeansnmeanstdvarcv;*调用means过程并计算相应的统计数Vary;*对变量y进行分析Run;*程序运行3.3.3UNIVARIATE过程1.UNIVARIATE过程简介UNIVARIATE过程除了可以完成与MEANS过程相同的基本统计量外,还可以计算变量的极端值、分位数,生成频率表,并支持对数据进行正态性检验。UNIVARIATE与MEANS过程不同的功能包括:描述变量极端值的情况。计算分位数,如中位数,1/4和3/4分位数。生成若干个描述变量分布的图。生成频率表。对数据进行正态性检验。UNIVARIATE过程PROCUNIVARIATE[DATA=数据集名[选项]];指定要分析的数据集名及选项[VAR变量表;指定要分析的变量名列BY变量表;指定分组变量CLASS变量表;指定分类变量FREQ变量;指定频数变量WEIGHT变量;指定加权变量OUTPUTOUT=数据集名指定统计量的输出数据集名关键字=新变量名列...];指定统计量对应的新变量名UNIVARIATE过程常用的选项Procunivariate语句的选项–NOPRINT禁止统计报告在OUTPUT视窗中输出–PLOT绘出茎叶图、箱式图和正态概率图–FREQ产生频数和累积频数分布表–NORMAL对变量进行正态性检验UNIVARIATE过程SAS中用关键字来指定所需要的统计量,事实上结果输出中用的就是各种关键字,常用的关键字有:–基本统计量NMEANSTD(标准误)CVSUMVAR(方差)RANGE–百分位数描述MINP1P5P10Q1MEDIANQ3P90P95P99MAX–与假设检验有关的统计量STDERR(标准误)T3.3.4FREQ过程(频数过程)5.WEIGHT语句统计计算中我们统称假设每条观测记录对频数计算的贡献为1,使用WEIGHT语句可以定义每个观测值出现的频数为这个观测对应的权重(权重不能为负)。6.BY语句对由BY变量定义的几组观测分别进行分析。但要求先按BY变量排序。3.3.5应用实例频数表的编制(习题)FREQ过程步例某地随机抽取正常成年男子120名,其红细胞数如下,试作该批样本的频数表。5.125.134.584.314.094.414.334.584.245.454.324.844.915.145.254.894.794.905.094.045.145.464.664.204.213.735.175.795.464.494.855.284.784.324.945.214.685.094.684.915.135.263.844.174.563.526.004.054.924.874.284.465.035.695.254.565.534.584.864.974.704.284.375.334.784.755.395.274.896.184.135.224.444.134.434.025.865.125.363.864.685.485.314.534.834.113.294.184.134.063.424.684.525.193.705.514.644.924.934.903.925.044.704.543.954.404.313.774.164.585.353.715.274.525.214.374.804.753.865.693.4菜单操作进行简单统计分析3.4.1利用SAS/INSIGHT进行简单分析我们仍以GPA数据集为例进行窗口操作分析。具体操作步骤如下:3.4.2利用SAS/ASSIST进行简单分析SummaryStatistics(与MEANS过程相同)FrequencyTables(与FREQ过程相同)

1 / 49
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功