统计分析与SAS软件课件01

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计分析与SAS软件第一章sas概述与统计基本知识我们要学什么?为什么我们要学SAS为什么大家都用电脑软体算统计为什么我们要用SAS这个软体SAS的应用有哪些,前景如何?我适合学SAS吗?学习SAS需要懂高等数学和统计学吗?这是标准差的公式10个同学的成绩,算标准差(可以用计算器).10000个同学的成绩,算标准差(一样可以用计算器,可是很累)为什么大家都用电脑软体算统计为什么我们要用SAS这个软体为什么不用ExcelExcel不能作进阶的统计运算Excel不好操弄资料(但可参考Excel资料分析工具箱、VBA)其他可做统计的软体SPSS,Stata,Statistica,MatlabR-Language(freesoftware)我们要学什么SAS基本介绍视窗介绍资料输入介绍(data)资料操弄介绍(procedure)◎以指令为主,涉及较少的程式语言的部分SAS的应用有哪些,前景如何?能够在第一时间内获得或者找到最有价值的信息和资源,对各大企业至关重要。而SAS则是目前能够实现这一目标最流行的工具!由于SAS广泛应用于金融,保险,临床研究,医药开发,市场调查,政府监管和教育研究部门,所以,在北美的需求居全球之最。三万家机构所采用,直接用户则超过三百万人,遍及金融、医药卫生、生产、运输、通讯、政府和教育科研等领域。在英美等国,能熟练使用SAS进行统计分析是许多公司和科研机构选材的条件之一。在数据处理和统计分析领域,SAS系统被誉为国际上的标准软件系统,并在96~97年度被评选为建立数据库的首选产品。堪称统计软件界的巨无霸。在此仅举一例如下:在以苛刻严格著称于世的美国FDA新药审批程序中,新药试验结果的统计分析规定只能用SAS进行,其他软件的计算结果一律无效!哪怕只是简单的均数和标准差也不行!由此可见SAS的权威地位。我适合学SAS吗?学习SAS要懂高等数学和统计学吗?SAS在创办起,其宗旨是着重于80%工作量的统计分析前的数据处理,至于统计分析一旦数据就绪,通过相应的分析模块,几乎象傻瓜相机一样,谁都可以操作运行只是需要有一般逻辑思维训练基础即可。只要遵循正确的学习道路并且获得有效的指导,就可以掌握扎实的SAS编程技能和技巧。主要内容概述IntroductionSAS编程基础BasicProgrammingofSAS建立数据集MaketheDataSet数据步程序设计ProgramDesignofDataStepSAS文件操作FileOperationofSASSAS过程步语句ProgramSentencesofProcStepSAS服务过程ServiceProcedureofSAS基础统计过程BasicStatisticProcedureT检验和方差分析TTestandVarianceAnalysis相关与回归CorrelationandRegression非参数检验NonparametricTests一、sas概述SAS系统介绍什么是SASSAS系统发展概况SAS软件系统的使用SAS系统的启动和退出编写运行调试保存SAS程序的过程SAS常用功能键SAS系统介绍什么是SAS:SAS(StatisticalAnalysisSystem)是世界上最著名的统计分析系统之一,具有完备的数据访问、管理、分析和呈现功能,被誉为国际标准统计分析系统。SAS的特点1、功能非常强大2、界面不太友好3、模块化设计4、编程功能强大,对话框功能较弱5、多种数据接口SAS的模块化结构SAS有30多个模块组成SAS/BASE:数据管理基本模块SAS/STAT:统计功能模块SAS/GRAPH:高分辨率图形模块SAS/ACCESS:数据库接口模块SAS/OR:规划与决策分析模块……SAS系统是一个组合软件系统,它由多个功能模块组合而成,其基本部分是BASESAS模块。BASESAS模块是SAS系统的核心,承担着主要的数据管理任务,并管理用户使用环境,进行用户语言的处理,调用其他SAS模块和产品。也就是说,SAS系统的运行,首先必须启动BASESAS模块,它除了本身所具有数据管理、程序设计及描述统计计算功能以外,还是SAS系统的中央调度室。它除可单独存在外,也可与其他产品或模块共同构成一个完整的系统。各模块的安装及更新都可通过其安装程序非常方便地进行。SAS系统具有灵活的功能扩展接口和强大的功能模块,在BASESAS的基础上,还可以增加如下不同的模块而增加不同的功能。SAS有一个智能型绘图系统,不仅能绘各种统计图,还能绘出地图。SAS提供多个统计过程,每个过程均含有极丰富的任选项。用户还可以通过对数据集的一连串加工,实现更为复杂的统计分析。此外,SAS还提供了各类概率分析函数、分位数函数、样本统计函数和随机数生成函数,使用户能方便地实现特殊统计要求。SAS系统发展概况1966年,美国NorthCarolina州立大学开发。1976年,SAS研究所成立。1985年,推出小型机版、微机版。常用的微机版本:6.12版,8.0版,9.0版目前,SAS已发展成为用于决策支持及科学研究的大型信息系统,并且每年都在改进。SAS网址:我们能用SAS做什么?进行数据管理数据输入、建库、保存……进行统计分析t检验方差分析卡方检验相关、回归秩和检验……二、初识SAS安装SAS哪位要是连软件的安装和打开都要我啰嗦的话,我劝您还是买一套洪恩的《开天辟地》好好热热身吧。安装SAS8.1时,应首先将系统时间改到2000年以前,安装完以后,再crack,然后将时间修改还原!SAS基本界面介绍SAS象其它Windows应用程序一样,在一个主窗口内,包含若干个子窗口,并有菜单条、工具栏、状态栏等。SAS有三个最重要的子窗口:1、Editor窗口又称增强的编辑窗口2、运行记录窗口(LOG)3、输出窗口(OUTPUT)SAS基本界面介绍除上述3个外还有:4、程序窗口(PROGRAMEDITOR简写PGM)5、Explorer窗口6、Results窗口注:演示如何打开各窗口程序编辑窗口运行记录窗口结果输出窗口命令窗口Results窗口SAS语句以一个关键词开始,以分号(;)结束;dataa;inputx;cards;323544565;procprint;run;简单运行样例一:(SAS程序的基本结构)数据步:创建数据过程步:调用数据分析过程或Lines或Datalines运行编辑窗内程序点击图标按功能键“F8”在命令行(窗)键入“submit”在Run下拉菜单中选“submit”所激活窗口(Editor、Log、Output)内容的保存在命令行(窗)键入file“路径\文件名”点击图标在file下拉菜单中选“save”或“saveas”只有编辑窗口(edit窗)才能打开文件常用的快捷键-F9,激活Keys窗口,可查看功能键的定义F4recall命令,用于editor窗,将前面提交的程序调回,可多次使用F5切换到editor窗;F6切换到log窗;F7切换到output窗F8submit命令Ctrl-E清除当前窗口的内容。editor窗被清除的内容不能用F4调回简单运行样例二:假设我们有一个班学生的数学成绩和语文成绩,数学满分为100,语文满分为120,希望计算学生的平均分数(按百分制)并按此排名,可以在程序窗口输入此程序:title'0401班学生成绩排名';datac0401;inputname$1-10sex$mathchinese;avg=math*0.5+chinese/120*100*0.5;cards;李明男9298张红艺女89106王思明男8690张聪男98109刘颍女80110;run;procprint;run;procsortdata=c0401;bydescendingavg;run;procprint;run;实际上,上述程序是文本,完全可以在任何文本编辑工具中输入,比如Windows中的记事本,甚至Word也可用来输入这样包含中文的程序。输入后使用复制复制、粘贴命令将输入的程序粘贴到SAS系统程序窗口。(即在记事本中复制输入的程序,然后在SAS系统程序窗口中使用粘贴命令,把程序复制到SAS中)。要运行此程序,只要用鼠标单击工具栏的提交(Submit)图标,或用Run菜单下的Submit命令,或者直接按下F8键,就可运行程序。如果选中某一段程序,然后进行调用,则系统只执行被选中的部分。查看结果激活OUTPUT窗口(F7)注意:没有正确结果,可能是:程序语法错误:→查看日志窗口错误信息程序逻辑错误:→分析源程序没有调用能输出结果的过程运行后,输出窗口出现如下结果:0401班学生成绩排名111:40Saturday,November10,2004Obsnamesexmathchineseavg1李明男929886.83332张红艺女8910688.66673王思明男869080.50004张聪男9810994.41675刘颍女8011085.8333运行记录窗口则记录每段程序的运行情况、所用时间、生成数据保存情况。如果有错误还会用红色指示错误。查看运行过程及出错信息激活LOG窗口(F6)黑色文字:源程序及运行情况蓝色文字:程序运行情况的说明信息红色文字:出错信息绿色文字:警告信息调试SAS程序回到程序编辑窗口,修改源程序,再执行如果程序编辑窗口没有显示刚刚执行的程序,可通过SAS的调回命令将刚刚执行的程序调回。调回方式:按功能键“F4”菜单【Run】→【RecallLastSubmit】保存SAS程序及其他窗口内容激活相应窗口,然后选择:方式一:鼠标点击“存盘”工具按钮方式二:执行菜单命令【File】→【Save】/【Saveas】可保存程序、数据文件、运行结果、日志等。SAS保存成纯文本格式文件。打开已保存的文件只能在ProgramEdit窗口打开文件,选择:方式一:鼠标点击“打开”工具按钮方式二:执行菜单命令【File】→【Open】可打开以前保存的程序、数据文件、运行结果、日志等文件及其他文本格式的文件。统计学中的几个主要术语1.总体(Population)所关心的所有元素的集合2.样本(Sample)总体的一部分3.参数(Parameter)总体的数字特征4.统计量(Statistic)样本的概括性测度值1.算术平均数、众数、中位数2.极差和分位差、平均差3.方差和标准差4.离散系数是标准差系数,它是标准差与算术平均数的比值,一般用%表示5.偏度和峰度主要用于检查样本的分布是否正态,以便判断总体的分布是否接近于正态分布。iiiiniiiPxExxDXPxxE1221)()()(1.置信度:是指全及指标落在某一区间内的概率保证程度2.置信区间:是指在一定的概率保证程度下,某全及指标所在的区间范围3.假设检验是利用样本的实际统计量,去检验事先对总体某些数量特征所作的假设是否可信,进而为决策取舍提供依据的一种统计分析方法。nxU/1.相关系数是用来说明变量之间在直线相关条件下相关关系密切程度和方向的统计分析指标。个变量之间的相关程度和方向,取决于两变量离差乘积之和,当它为0时,r为0;当它为正时,r为正;当它为负时,r为负。2.回归分析,就是对具有相关关系的变量之间的关系进行测定与描述,确立一个数学表达式,以便进行估计与预测的方法。N-观测个数SumWgts-加权和Mean-均值Sum-总和StdDev-标准差Variance-方差Skewness-偏度Kurtosis-峰度USS-加权平方和VSS-加权离差平方和CV-变异系数StdMean-均值的标准误差

1 / 38
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功