1菜单系统“分析家”的数据管理功能(AnalystApplication)计算机统计分析软件(SAS系统9.1.3)2“分析家”的数据管理功能目录1.Analyst入门2.数据操作3.数据变换4.合并数据表5.数据的转置及堆叠和折分6.*生成图形和统计分析功能3“分析家”简介分析家(Analyst)是为了完成基本统计分析而设计的一个菜单系统;它是用图形界面来调用SAS功能的一个模块.用户通过选择菜单系统的不同菜单项可完成数据管理,各种基本的分析功能和绘图功能.在所选择的菜单项完成每项任务后,立即显示相应的结果;因分析家是通过数据步编程和调用SAS过程联合完成的,故所用的SAS程序可以显示在一个单独窗口供我们学习使用;每项任务完成后所保留的SAS程序,有关的图形和结果,在分析的过程中随时可以调出显示.4“分析家”简介分析家(ANALYST)的功能1.从菜单栏目的文件(File),编辑(Edit),查看(View)和数据(Data)下可完成数据管理功能;包括数据的筛选,数据的变换和转置等.2.图形(Graphs)栏目下是图形功能,包括直方图,盒须图,饼图,等高线图,二维或三维散点图和曲面图等.3.报表(Report)栏目支持PRINT过程的列表和TABULATE过程的汇总报表.5“分析家”简介分析家(ANALYST)的功能4.统计(Statistics)栏目下是主要的统计分析功能,包括描述统计,列联表分析,假设检验,方差分析(含线性模型和混合模型等),回归分析,多变量分析(主成分和典型相关),生存分析及功效与样本量大小.5.工具(Tools)栏目可对图形查看器等的设置进行修改.6.窗口(Wondows)栏目可切换窗口,改变窗口的显示方式等.6Analyst入门启动Analyst(分析家)的方法(1)键入命令ANALYST(2)用下拉菜单解决方案(Solutions)分析(Analysis)分析家(Analyst)(3)启动SAS系统时(从“开始”“运行”打开)加上选项(-initcmdanalyst):“d:\sas82\sas.exe”-initcmdanalyst9Analyst入门启动分析家(Analyst)后的界面10Analyst入门进入分析家窗口后,系统自动生成一个新的分析项目。分析家窗口分为左右两部分:左边为项目管理,用树状目录显示打开的数据及其对其所进行的分析;右边显示数据。该项分析所生成的输出结果的名字将列在项目管理的树状目录中,而输出的结果或图形将在单独的窗口里显示。11Analyst入门Analyst的主菜单(Menus)(1)文件(File)–-新建,打开和存贮文件,项目和数(2)据集,及打印报表.(2)编辑(Edit)--转换浏览和编辑的模式,并可添加,拷贝和删除列和行.(3)查看(View)--可以移动、隐藏列,还可修改数据表的属性.(4)工具(Tools)--定制输出标题,画图选项等(5)数据(Data)--对用户的数据筛选子集,排序,概括,串接和合并及进行计算,数据变换和转置.12Analyst入门Analyst的主菜单(Menus)(6)报表(Reports)--产生报告,列出观测等(7)图形(Graphs)--生成图表,图形和直方图等.(8)统计(Statistics)--选择统计分析及使用索引搜寻任务和统计量.(9)窗口(Window)--切换到其他窗口.(10)帮助(Help)--显示Analyst和SAS系统的帮助信息.13Analyst入门Analyst的工具条(Toolbar)Analyst的工具条包括16个图标(如产生新表,打开文件,存贮当前的表,打印数据表,预浏览,对数据表排序,取子集,计算新列,生成汇总报表,生成直方图,生成二维散点图,计算汇总统计量,计算相关系数,进行单因子方差分析,进行回归分析,帮助).用户还可以定义其它工具条图标:选菜单项工具(Tools)从下拉菜单选定制(Customize)=进入定制工具对话窗口=建立图标.14Analyst入门Analyst的工具条(Toolbar)新建一个新表产生汇总报表打开一个SAS文件产生一个直方图保存当前表格产生一个散点图打印数据表计算汇总统计量打印预览计算相关系数对表格进行排序执行单向方差分析对数据取子集执行线性回归由计算得到新列分析家帮助15Analyst入门Analyst的索引(Index)使用索引来访问经常使用的一些统计任务和绘图任务.例如以下任务:Brown-Forsythetest,Barcharthorizontal,One-WayANOVA,N-WayANOVA,Piechart等等从按字母顺序的任务列表中选择某项任务后=OK,则进入完成该任务的窗口.(在你不记得在哪个菜单中可以找到你想要的过程的时候,可以到Index中来寻找)16Analyst入门Analyst的项目(Project)一个项目就是在一个或几个数据集上分析的一些结果.一个项目用项目树显示,该树包含不同的数据表,报表,程序码,以及同该项目有联系的其它结果的目录.这些结果在项目树里呈现为一些分枝.通过点击加号(+)或减号(-)来打开或关闭一个目录.通过点击某个分枝可以浏览目录中的这个分枝.如果分枝是一张数据表,可以浏览这张表,也可以打开这张表并进行分析.还可以从下拉菜单选择InteractiveAnalysis来启动SAS/INSIGHT并进行探索数据分析.从File菜单选择Projects,用户可以创建,打开,存贮或删除这个分析项目(V8).17Analyst入门浏览和存贮程序码功能用户在Analyst里对数据进行任何统计分析和绘图任务后,都可以浏览和存贮程序码.这些源程序可以拷贝到编辑窗进行编辑,然后再提交系统执行.18Analyst入门在多个窗口浏览结果可以对一个或几个数据表进行分析,并在多个窗口同时浏览结果.若双击在项目树的某项结果上,则在单个窗口浏览这个结果.在相同的结果上还可以打开一个新的窗口来浏览这个结果.19Analyst入门存贮任务选项功能通过在任务对话窗里双击SaveOptions来存贮同这项任务有关的选项.以后当用户点击Reset纽时,这些选项将用来作为用户的缺省选项.20Analyst入门存贮文本和绘图结果可把程序码及分析和绘图的结果存为文件.选中项目树中的某个分枝,并从下拉菜单选择另存为(Saveas)来存贮程序码和结果.然后指定文件名并选择一种文件类型.对于绘图结果,可用GIF,JPEG等格式来存贮.21Analyst入门定制用户的会话功能通过从工具(Tools)菜单项=选择查看器设置(ViewerSettings),=并设置浏览器的特性来定制用户的分析会话.选择图形设置(GraphSettings),并设置绘图的特性.全局选项,用户在某项任务中规定的设置,这时都将被覆盖.22数据操作打开数据集Analyst的数据表显示来自SAS数据集,SAS视窗和其它数据源(如文本文件,Excel电子表,SPSS文件)的数据.从文件(Files)菜单可以创建新数据表,打开SAS数据集及浏览,打开非SAS文件(V8).23数据操作打开数据集从文件(Files)打开将进入以下窗口:用户可以选择将要打开的数据文件的类型24数据操作打开数据集如果打开的数据为SAS数据集,则常通过从文件(Files)用SAS名称打开在弹出的选择成员窗口中从某个逻辑库中选择将被打开的SAS数据集名字(比如从SASUSER库中选择数据集CLASS).25数据操作数据集的浏览与编辑模式在分析时当打开一个文件或SAS库的成员时,数据被转换为数据表.在此可浏览,编辑及整理数据表的行和列.数据表被打开的模式可以是浏览,编辑和共享编辑三种模式之一(类似于VT界面).由编辑(Edit)=模式(Model)=可以从浏览,编辑和共享编辑三种模式中任选一种.26数据操作对列的操作在数据表中可以对列或行进行操作.如移动列,插入列,拷贝列或删除列,隐藏列,固定列;添加行或删除行,按变量的值对行排序;以及浏览变量名或列标签.27数据操作对列的操作--在浏览(或编辑)模式下1.改变列的显示顺序由查看(View)=列(Columns)=移动(Move…)在出现的MoveColumns(移动列)对话窗口选中想移动的变量按箭头方向上下随意移动来改变列的显示次序.也可以先选中某列(该列加亮),然后点鼠标右键,在弹出的菜单项中选Move…来改变列的显示顺序。以下介绍的其它列操作也可用类似的方法。28数据操作对列的操作--在浏览(或编辑)模式下2.隐藏一些列不显示由查看(View)=列(Columns)=隐藏(Hide…)在出现的HideColumns(隐藏列)对话窗口选中想隐藏起来不显示的变量放到Hide框里,然后按OK可以让所选中的几列不显示。若由查看(View)=列(Columns)=取消隐藏(Hide…)又可以把已被隐藏不显示的列重新显示在数据表中。29数据操作对列的操作--在浏览(或编辑)模式下3.固定几列在表的前面不随游标而左右移动由查看(View)=列(Columns)=保持(Hold…)可以固定选中的几列总保持在表的左边位置显示.4.用列标签显示由查看(View)=列(Columns)=标签(Lables)要求用变量(列)的标签显示数据表。30数据操作对列的操作--在编辑模式下编辑数据1.插入新变量(列):由编辑(Edit)=插入列(InsertColumn)=选字符型(Character)或数值型(Numeric),即可在数据表的最右边或选中变量(列)的左边插入新变量.2.拷贝选中的一列或几列首先选中数据表中要复制的几个列,然后由编辑(Edit)=复制(Duplicate)把它们复制到所选中列的面前.31数据操作对列的操作--在编辑模式下编辑数据3.删除选中的一列或几列首先选中数据表中要删除的某个列或几个列,然后由编辑(Edit)=删除(Delete)可删除选中的列.32数据操作对行的操作--在编辑模式下编辑数据在分析家窗口将光标置于打开数据表的某一行序号上并点击右键,就表示选中该行,同时在弹出菜单中也显示了可对这一行进行的操作:Add—在数据表的最后加入一新行;Duplicate—将该行复制到数据表的最后一行;Delete--删除选中的行.33数据操作对行的操作--在编辑模式下编辑数据或者先选中某行,然后由编辑(Edit)=删除(Delete)则系统在询问对话框得到肯定后立即将把这一行从数据表中删除;或由编辑(Edit)=复制(Duplicate)则将选中的行复制到数据表的最后一行.由编辑(Edit)=添加行(Addrow)则在数据表的最后加入一新行.34数据操作存贮数据可以存贮数据表中的数据为SAS支持的任何格式,包括SAS数据集,文本文件,Excel和Lotus文件.由文件(File)=保存(Save),可存贮修改后的数据集;由文件(File)=另存为(Saveas),可存贮当前数据表为非SAS格式或存为其它SAS数据集.由文件(File)=用SAS名称另存为(SaveasSASname),可存贮当前数据表为所选择的SAS库中的SAS数据集.35数据操作筛选数据由数据(Data)=过滤(Filter),然后选择取数据子集(Subsetdata),并对数据集应用Where条件(如SEX=‘M’)来浏览数据集的子集.若要保存,可选文件=另存为SAS.(比如找出所有男生的观测)36数据操作排序对话窗(编辑模式)由数据(Data)=排序(Sort),可对数据表里的行进行排序.先从候选的变量列表中选择用于排序的变量;如选中的变量不只一个,对Sortby列表可用向上或向下的箭头规定排序变量的顺序;选中一变量后,还可规定按上升或下降的次序排序.37数据操作产生某些分布的随机变量(编辑模式)由数据(Data)=随机变量(RandomVariates),可生成基于某个分布的随机变量.分布包括正态分