1第1章:SAS软件初步随着计算机技术、数据库技术和网络技术的快速发展和广泛应用,各个行业所积累数据越来越多,金融行业尤其如此。对当今的金融机构来说,能否有效地利用业务高度自动化所产生的大量宝贵数据、并从中挖掘出决策有用的信息,已经成为衡量一个金融企业是否具有核心竞争力的重要标志。欲从海量数据中挖掘出决策有用的信息,需要有先进的软件来支持。SAS系统是一款大型集成应用软件,在数据处理和统计分析领域,SAS是国际上最有声誉的标准软件系统之一。目前,SAS已被许多国家所采用,已被广泛地应用于金融、医疗卫生、通讯、科研和教育等领域。本章是对SAS系统的一个初步介绍。通过本章学习,读者可以了解:①SAS系统中与本教材有关的四个模块的基本功能;②SAS系统的启动与SAS操作界面;③SAS语句与SAS程序;④SAS数据集的创建与编辑;⑤重要的SAS函数;⑥本章有关的SAS基础知识。1.1SAS系统简介1.1.1SAS系统概况SAS系统是美国SAS软件研究所开发的大型集成软件系统,全称为StatisticalAnalysisSystem,即统计分析系统。该系统最早由美国北卡罗来纳大学的两位生物统计学研究生编制,1972年研制出第一版。自那时起,SAS系统经过几十年的发展,现已成为在数据处理和统计分析领域中国际上最有知名度的软件之一。SAS系统具有完备的数据访问、数据管理、数据分析、数据展现、以及应用开发等功能,已被广泛地应用于社会科学和自然科学的各个领域。国际学术界有条不成文的规定:凡是用SAS软件统计分析的结果,在国际学术交流中可以不必说明算法,由此可见其权威性与信誉度。自1972年研制出第一版起,几十年来,SAS软件研究所不断地把用户需要的、以及学术研究中得到的一些有效的实用分析方法加入到SAS系统的各个模块中,因此SAS系统的软件版本更新较快,功能不断得到拓展。如自SAS软件研究所于1989年推出SAS/PC(6.04)版本后,1997年下半年推出了适用于多种操作系统的6.12版本,2000年推出了8.0版本,接着又推出了9.0版本、9.1版本、9.2版本等。其中SAS9.2版本可以支持多种语言,提供了中文操作环境,便于国内用户使用。本教材将以9.2版本的SAS为例,介绍SAS系统在金融领域的应用。1.1.2SAS系统相关模块的功能简介SAS系统是一个大型集成软件系统,系统中包括了几十个各具特色的功能模块,如统计分析模块(SAS/STAT)、计量经济学和时间序列分析模块(SAS/ETS)、绘图模块(SAS/GRAPH)、质量控制模块(SAS/QC)、电子表格模块(SAS/CALC)、企业级数据挖掘模块(SAS/EM)等。这里只介绍与本教材内容相关的四个功能模块。1.1.2.1BASESAS模块BASESAS模块是SAS系统的核心模块,这个模块的主要功能是数据管理和数据加工处理,并有报表生成和描述统计的功能。BASESAS模块可以单独使用,也可与其它模块一起组成一个用户化的SAS系统。BASESAS模块可以提供以下几个方面的功能。数据管理功能。BASESAS模块具有强大的数据管理功能,它可以用多种形式读入数据,然后将读入数据组成SAS数据集。它具有与外部文件交换信息的功能,可以采用文件管理2操作方式把不同数据集的数据组合在一起,供SAS系统分析处理,生成报表。它还为用户提供完备的SAS语句和函数用于数据的加工处理,如建立新变量、累加求和,以及修正错误等。BASESAS模块还可以对数据集进行编辑,如从几个数据集中抽取一些变量和观测进行组合,拼接、合并几个数据集,以及对数据集进行更新等。基础统计计算功能。BASESAS模块中有一些基本过程和SAS函数能够完成基本统计计算,其中包括:①计算简单的描述统计量,如均值、标准差、偏度、峰度、分位数和相关关系等;②对数据进行标准化、求序、以及有关统计量等;③利用SAS函数可以计算概率分布函数、样本统计量,以及产生随机数等。报表生成与图形显示功能。BASESAS模块在输出数据和读入数据时,可以采用多种形式。除了SAS过程产生的固定格式的报表外,用户可以根据自身需求来设计报表的输出格式。BASESAS模块的一些基本过程可以绘制水平的或垂直的直方图、饼图、块图和星型图,还可以画散布图、曲线图、层次图、时间序列图等。1.1.2.2SAS/GRAPH模块SAS/GRAPH模块是SAS系统中一个强有力的图形软件包,具有多种绘图功能,如生成等值线图、二维和三维曲线图、直方图、圆饼图、区块图、星型图、地理图、以及各种映像图。这些图形可以非常形象、直观地表现各个变量之间的关系、以及数据的分布状态,对于解决各种实际问题可以起到重要的辅助作用。SAS/GRAPH模块还有一个全屏幕图形编辑器,用户可以在幅面上自由地绘制文字及图形元素,也可以对图形进行修改。1.1.2.3SAS/STAT模块SAS系统中的统计分析模块(SAS/STAT)是一个完整的统计分析软件包,它覆盖了所有的实用统计分析方法,是国际统计分析领域的标准软件。SAS/STAT模块包括了各种回归分析、方差分析、属性数据分析、判别与聚类分析、非参数分析等几十个过程,每个过程还提供了多种不同的算法和模型选择。它还包括处理广义线性模型的专门过程,从而组成了一个庞大而完整的统计分析方法集。1.1.2.4SAS/ETS模块SAS系统中的计量经济学和时间序列分析模块(SAS/ETS)提供了丰富的计量经济学和时间序列分析方法,是研究复杂系统和进行预测的有力工具。用户利用该模块可以建立各种统计分析模型、进行所关心系统的模拟与预测。SAS/ETS模块中包含了全面的时间序列时域分析和谱域分析,如实用预测(逐步自回归、指数平滑、Winters方法)、序列相关校正回归、分布滞后回归、ARIMA模型、状态空间方法等。SAS/ETS模块还提供了许多处理时间序列数据的实用程序,如时间频率转换与插值、X11季节调整等。1.1.3SAS系统的启动与SAS操作界面1.1.3.1SAS系统的启动正常安装9.2版本的SAS系统软件后,在Windows开始菜单的程序组中将包含一项“SAS9.2(简体中文)”。启动9.2版本的SAS系统和启动一般软件一样,可以通过以下两种方法来进行:①单击“开始菜单”|“所有程序”|SAS9.2(简体中文),启动SAS软件;②双击系统桌面上SAS9.2软件的快捷方式,启动SAS软件。31.1.3.2SAS操作界面在启动SAS软件后,系统将打开如图1-1所示的SAS操作主界面,其中包括菜单栏、工具栏、编辑器窗口、运行日志窗口、结果输出窗口、资源管理器窗口等。用户执行的所有SAS操作都需要在SAS操作界面中完成。因而熟悉SAS操作界面是学习SAS软件的第一步。下面将对SAS操作界面进行介绍。图1-1:SAS9.2的主界面1.1.3.2.1主界面SAS主界面的默认状态包括菜单栏、工具栏、命令窗口、状态栏、窗体条、窗体。1.菜单栏SAS主窗口上部的第一行菜单栏,菜单栏中包括“文件”、“编辑”、“视图”、“工具”、“解决方案”、“窗口”和“帮助”菜单。①“文件”菜单菜单栏中的“文件”菜单主要用于文件管理,包括文件的新建、打开、保存和另存功能;数据的导入和导出功能;页面设置、打印设置和打印、发送邮件等功能。②“编辑”菜单菜单栏中的“编辑”菜单主要用于对各窗口的编辑操作,包括撤销、剪切、复制、粘贴、恢复、清除、查找、替换等操作。③“视图”菜单菜单栏中的“视图”菜单主要用于切换当前的窗体,可用于切换增强型编辑器、程序编辑器、日志、输出、图形、结果、SAS资源管理器、收藏夹等为当前活动窗口,单击“视图”菜单中各窗口的子菜单,就可以激活对应的窗口为活动窗口。④“工具”菜单菜单栏中的“工具”菜单提供了对SAS结果的编辑工具,包括表编辑器、图形编辑器、报表编辑器、图像编辑器、文本编辑器等;“工具”菜单同时还提供了新建逻辑库、新建文件快捷方式、宏操作等功能。⑤“解决方案”菜单菜单栏中的“解决方案”菜单为用户提供了进行一些统计分析模块的入口,包括4“分析”子菜单:提供了分析家、企业数据挖掘、投资分析、市场研究、交互式数据分析、时间序列预测系统等10多个统计分析模块的入口。“开发和编程”子菜单:提供了SAS用于开发和编程的工具,包括ETS/OLAP应用程序生成器、框架生成器、类浏览器、源控件管理器、数据仓库管理员和OLAP服务管理器。“报表”子菜单:主要用于报表和报表库的生成,同时还提供了报表设计和操作菜单。“附件”子菜单:可以提供SAS系统的一些附件功能,包括图形测试图案、注册表编辑器、元数据浏览器、DDE三元组和游戏等功能。“ASSIST”菜单项:提供了用户进入SASASSIT模块的入口。“桌面”菜单项:提供了SAS类似于Windoews操作的桌面环境的入口。“ETS/OLAP应用程序生成器”:可以打开ETS桌面操作的窗口。⑥“窗口”菜单菜单栏中的“窗口”菜单可以提供对主界面窗口的一些编辑操作,包括最小化、层叠、垂直平铺、水平平铺、调整大小等基本的窗口操作。同时,用户还可以通过选择窗口菜单下半部分的对应菜单项来设置当前的活动窗口。⑦“帮助”菜单菜单栏中的“帮助”菜单向用户提供学习SAS的一些途径,包括SAS帮助文档、SAS软件入门、学习SAS程序、SAS网站、关于SAS系统的基本信息。2.工具栏在SAS主界面中,菜单栏的下方是系统提供的可用于执行SAS的一些常规操作的工具栏。在图1-1中,从左到右,这些常规工具可以分别执行这样的功能:编辑窗口的新建(新建)、打开文件(打开)、编辑窗口内文件的保存(保存)、编辑窗口内文件的打印(打印)、当前窗口内容的打印预览(打印预览)、选定内容的剪切(剪切)、选定内容的复制(复制)、选定内容的粘贴(粘贴)、撤销操作(撤销)、新建逻辑库(增加新逻辑库)、编程窗口、资源管理器的打开(SAS资源管理器)、程序提交(提交)、程序的中断(中断)、快速打开帮助文档(帮助)。3.命令窗口在SAS主界面中,工具栏左侧的小窗口是SAS系统的命令窗口,在这个窗口中直接输入相应的SAS命令再单击窗口左方的按钮,就可以使系统执行对应的操作。命令窗口的操作方式对于熟悉SAS命令的用户来说是十分方便的。对于使用过的命令,用户还可以在命令窗口的下拉列表框中进行选择。4.状态栏在SAS主界面的最下方为软件的状态栏,状态栏显示当前系统的状况、默认的路径和光标位置等。5.窗体条SAS9.2版本提供了窗体条,位于图1-1中状态栏的上面。借助于窗体条,用户可以进行当前窗口的快速切换。单击窗体条上相应窗口的标签,就可以恢复原先最小化的窗口,激活对应的窗口为当前窗口。6.窗体5在SAS9.2的主界面中包含了几个常用的窗口,可以执行SAS的相关功能。在默认状况下,打开的主界面中包括了程序编辑窗口、资源管理器窗口、运行日志窗口。此外,当系统运行用户提供的SAS程序并获得计算结果后,SAS将打开结果窗口。对于这些窗体在SAS主界面中的位置,用户可以按照个人需要进行设置。在操作过程中,系统具有当前窗口的概念,用户的操作只能在当前窗口中进行。当前窗口的激活方式有三种:单击窗口条、桌面菜单选择、直接单击窗体。1.1.3.2.2SAS主界面中的常用窗口1.程序编辑窗口程序编辑窗口是用户编辑SAS源程序,存储或调入文件,提交SAS程序给SAS系统执行的场所,它是用户使用SAS系统的主要窗口,用户可以通过这个窗口编写各种SAS程序,或通过这个窗口调入事先编写的SAS程序递交系统运行。程序编辑窗口的主要功能包括:①程序书写时常用的复制、粘贴、剪切、清除、选定等文本编辑功能;②程序中不同内容的颜色区分,例如用蓝色表示程序中的SAS关键词;③程序输入时4的自动缩进;④程序块的收缩和扩展;⑤程序文件的保存、打开、打印等基本操作。2.运行日志窗口运行日志窗口用于显示在SAS程序运行过程中所记录的基本情况,SAS系统通过这个窗口与用户进行信息交流,并用不同的颜色来区分不同的内容:①黑色语句:显示程序的执行情况,在日志文件