实习七生存分析-67-SPSS统计软件使用指导(第三版)主编贾红泸州医学院实习七生存分析-68-SPSS统计软件使用指导(第三版)主编贾红副主编刘军祥叶运莉张俊辉刘娅杨超编委刘军祥叶运莉张俊辉刘娅杨超陈冬富夏英华李爱玲李丽刘杰秘书李丽刘杰泸州医学院实习七生存分析-69-目录实习一SPSS统计软件概述………………………………………………………1实习二计量资料的统计分析……………………………………………………7实习三分类资料的统计分析……………………………………………………18实习四方差分析………………………………………………………………26实习五回归与相关分析…………………………………………………………46实习六非参数统计分析…………………………………………………………56实习七生存分析…………………………………………………………………67实习八Logistic回归分析………………………………………………………75实习七生存分析-70-使用说明随着科学技术的发展和计算机技术的普及,使对数据处理的技术要求也越来越高,相应的一些数据处理的软件发展也非常迅速。目前,世界上通用的数据分析软件主要有SAS(StatisticsAnalysisSystem)、SPSS(StatisticalProductandServiceSolutions)、Stata等,其中SPSS软件以其统计分析方法齐全,用户界面极其友好,操作易学易懂而被各行各业广泛使用。作为医学生至少应该掌握一种统计软件的使用方法。鉴于医学科研数据分析的需求和可操作性,故选用SPSS软件作为医学统计学的计算工具。目前,随着医学研究结果报道对数据统计处理要求的提高,如对P值的报道必须有具体的数值,因此数据分析必须使用统计软件进行。有些医学研究,如新药临床试验还对数据的管理提出了更高的要求,SPSS软件都能满足这些分析的要求。但是,统计软件必须在掌握了统计学的基本理论和基本方法的基础上来使用,否则会导致方法的错用和结果的不合理解释。因此,建议同学们.....在学习统计学理论和方法的基础上来学习统计软件的使用。根据作者的经验,对数据分析的策略,应该遵从以下基本思路:在进行数据统计分析之前,首先需要考虑如下几个方面的问题:1、变量的类型,是数值变量还是分类变量,是有序变量还是无序变量。2、所分析的变量是单变量、双变量还是多变量。3、资料设计类型,是完全随机设计、配伍(对)设计、析因设计还是其他设计,是否需要分析交互作用。4、主要分析的目的:是分析数据间的关系,还是比较指标的大小,或建立某种数学诊断模型。5、考察数据是否满足相应统计分析方法的前提条件。综合以上情况,选择统计分析方法。本实习指导主要供研究生和公共卫生学院本科生统计学上机操作练习使用,也可为教师和其他专业学生进行科研数据分析提供参考。2011年8月实习七生存分析-71-修订说明为了方便医学统计学的教学与实验课上机操作练习,我们于2004年8月根据高等教育出版社出版的《医学统计学》(第一版)教材的内容与例题,编写了第一版《SPSS统计软件使用指导》,供预防医学专业本科生和研究生使用,内容主要包括各种常用医学统计分析方法及数据管理。随着现代生物统计方法的不断发展和完善,多元统计分析方法在医学数据信息分析中的使用越来越多,2006年8月我们在第一版的基础上,增加了重复测量资料的方差分析和多元Logistic回归分析两个内容,并添加了部分案例,编写了《SPSS统计软件使用指导》第二版。实习指导经过8年多的使用,学生普遍反映良好,对培养学生数据分析处理能力起到了很大的作用,并成为研究生毕业课题数据分析的参考用书。近年来,数据管理和数据分析已日益成为医学科研的重要组成部分。我们根据目前国内医学统计学实验教学的改革趋势,并考虑到SPSS统计版本不断更新,功能模块增加的情况,根据高等教育出版社出版的《医学统计学》(第二版)的例题,对案例进行了全部更新,并完善了菜单中数据管理功能部分内容,从而完成了第三版本的修订,以满足学生医学统计学实验课教学的需要。本教材编写简洁明了,提供了案例的分析路径和方法。不仅可以作为研究生和公共卫生学院的本科生实验课教学使用,并可为掌握了医学统计学基本原理和方法的教师和学生自己进行数据管理分析提供参考。由于时间仓促,错误难免,敬请批评指正。编者2011年8月实习七生存分析-72-实习一SPSS统计软件概述主要内容:1、SPSSforWindows简介2、SPSS软件的使用特点3、软件的安装、运行及窗口功能4、SPSS软件的数据管理功能一、SPSSforWindows简介SPSS是软件英文名称的首字母缩写,原意为StatisticalPackagefortheSocialSciences,即“社会科学统计软件包”。但是随着SPSS产品服务领域的扩大和服务深度的增加,SPSS公司已于2000年正式将英文全称更改为StatisticalProductandServiceSolutions,意为“统计产品与服务解决方案”。其客户分布于通讯、医疗、银行、证券、保险、制造、商业、市场研究、科研教育等多个领域和行业,是世界上应用最广泛的专业统计软件。SPSS软件最早由美国斯坦福大学的三位研究生于20世纪60年代末研制,迄今已有30余年的成长历史。软件的1.0~5.0为DOS版本,6.0以后的版本为windows版本,目前已被IBM公司收购,最新版本为20.0,随着版本的升级,软件的统计分析功能也不断增强。本书内容以17.0版本进行介绍。二、SPSS软件的使用特点在操作使用上,SPSS软件尤其适合非专业统计人员使用,主要有以下特点:用户界面友好下拉式采单,操作简单,可以通过Paste将菜单功能转换为标准的SPSS源程序并进行保存,满足了某些重要技术资料档案保存的要求。数据的输入和管理方便除本身具有类似于Excel电子表格的数据输入和管理界面外,还可以很方便的与DBASE、FoxPro、Excel、MSAcess97、Lotus等数据库交换。结果输出精美除可以保存为专门的SPV格式外,也可以转换为文本文件和HTML的格式文件,以便编辑。并可以通过剪切、粘贴等方式将输出的表格复制到Word文档上,进行编辑。统计分析方法较为齐全几乎涵盖了各种成熟的统计分析方法,但对新实习七生存分析-73-方法的开发和使用不及SAS。更新及时近年来,SPSS软件的版本更新加快,融合了许多新的统计方法和技术,每次新出来的试用版及其特点都可以在SPSS公司的官方网站上()得到及时信息。完善的帮助功能在SPSS软件中,其Tutorial模块提供了用户自学的所有内容,用户如果想要学到原汁原味的统计学原理、方法和技术,均可在里面全部学到。三、SPSS17.0安装和启动SPSS17.0运行环境的基本要求是:Win98或以上的版本操作平台,32MB以上的内存,80MB以上的硬盘空间。其安装过程非常简单,一路按next即可完成,但其显示属性至少应在800×600像素,并在安装前设置好。安装以后,点击SPSSStatistics,即可进入SPSS。四、SPSS的主要窗口及功能SPSS主要有三大窗口,分别是数据编辑窗口(SPSSStatisticsDataEditor)、结果窗口(SPSSStatisticsViewer)、程序语句编辑窗口(SPSSStatisticsSyntaxEditor),以下将分别作介绍。(一)数据编辑窗口SPSSStatisticsDataEditor启动SPSS以后,程序将自动打开数据编辑窗口,在窗口的左上角上有SPSSStatisticsDataEditor的标示。如图1,在窗口下方的工具条有数据编辑窗口的两个子窗口DataView和VariableView,可分别定义变量的值(即数据)和变量(名称和类型等)。图1.1数据编辑窗口示图数据窗口变量窗口实习七生存分析-74-1.数据窗口DataViewSPSS启动后,首先停留在数据窗口,该窗口类似Excel表格,可以用来输入、修改、查看和保存数据。表格的左侧为记录号,表格的最上面为变量。统计数据的输入通常遵从以下原则:(1)Onecaseoneline即一条记录占一行,同一观察对象的数据在同一行上显示;(2)Onevariableonecolumn即一个变量或指标独占一列;(3)同一指标的不同次测量应录入为不同的变量列。SPSS的数据文件可以直接通过SPSS的数据编辑窗口建立,也可以由其他文件转换,其数据文件保存的默认文件名为*.sav。2.变量窗口VariableView用鼠标点击窗口下方的工具条的VariableView即可切换到变量窗口,该窗口主要用来对变量进行定义,见图1.2,该窗体的左侧编号表示变量序号,上方用以定义变量的属性,将在下面的变量定义中介绍。图1.2变量窗口示图(二)结果窗口SPSSStatisticsViewer结果窗口用于显示SPSS处理的结果信息和运行失败以及运行错误的信息,见图1.3,并可以在该窗口中对处理的结果进行编辑。在该窗口保存结果文件时,默认的文件名后缀为*.spv。实习七生存分析-75-图1.3结果窗口图示(三)程序语句编辑窗口SPSSStatisticsSyntaxEditor该窗口主要用于编辑SPSS程序,可以通过选择File—New—Syntax打开,或在SPSS过程对话框,点击Paste按钮打开,见图1.4。编辑以后的程序可以保存为*.sps文件。图1.4程序语句编辑窗口实习七生存分析-76-五、数据管理1.数据文件的建立SPSS的数据文件可以通过File—New—Data建立和输入,也可以通过其他Excel数据、Foxbase数据等转换而来。2.变量的定义通过SPSS建立的数据需要对输入的变量进行定义,变量的定义在VariableView窗口进行,需要定义的内容有:Name:变量名,SPSS的变量名最好用英文字母表示,系统不区分大小写,但不能使用SPSS的函数符号作变量名,如all、and、ge、ne、le、to等。Type:变量属性,用以定义数据的类型。SPSS的变量类型从Numeric(数值型)到String(字符型)共有8种,当进行数据统计分析时,通常定义成Numeric,便于分析;Width:变量宽度,宽度应包括小数点,定义方法同数据库;Decimals:小数点位数,顾名思义,用以定义变量的小数点位数;Label:变量标签,对变量名进行标示,如常将Group定义为分组变量;Values:变量值标签,用以对变量的取值进行定义,如当Group=1时,表示对照组,如当Group=2时,表示实验组;Missing:缺失值,用以对缺失数据的定义,常用9或99等表示缺失值;Columns:列的宽度,定义列的显示宽度;Align:定义数据显示的对齐方式,默认为右对齐方式;Measure:定义变量的测量尺度,有三种Scale、Ordinal、Nominal三种,是对变量进行精确的定义,在绘制统计图时非常有用,一般情况下少有。在以上的属性定义中,Name、Label、Measure三项常用,其他可忽略。3.数据的录入数据的录入在DataView窗口进行,录入方式基本同Excel电子表格类似。可以利用Editer菜单中的Cut、Copy、Past、Clear、Find等功能进行剪切、拷贝、粘贴、清除、查找等功能进行编辑。4.数据的编辑输入以后的数据可以利用Data菜单进行编辑。Data菜单见图1.5。主要功能有:DefineVariableProperties定义变量属性SortCases按指定的变量排序Transpose数据转置实习七生存分析-77-MergeFiles合并数据库SplitFile分割数据库SelectCases选择记录WeightCases指定为频数5.数据的转换Transform菜单见