spss统计软件使用教程

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

公共卫生与全科医学学院2020/1/102SPSS统计软件简介SPSS是社会科学统计软件包(StatisticsPackageForSocialScience)的缩写,经过几十年的改进,该产品发展成为集统计分析、数据挖掘、商业智能、顾客关系管理等多功能的统计产品和服务解决方案(StatisticsProductForServiceSolutions)的软件。适用于社会学、医学、心理学、经济学等领域。2020/1/1031.20世纪60年代末,美国斯坦福大学的三位研究生研制开发了最早的统计分析软件SPSS,同时成立了SPSS公司2.1975年在芝加哥组建了SPSS总部3.1984年开发了DOS操作系统下的PC+1.0版本4.1992年的DOS版升级为Windows版本,即最初的4.0版5.1999年升级到10.0版、2001年升级为11.0版、2003年Windows操作平台下的最新版本为12.0;目前已有17.0与著名统计软件SAS相比,更适用于统计初学者或非统计学专业人员SPSS统计软件简介2020/1/104SPSS的安装、启动和退出安装启动方法一:进入Windows→开始→程序→SPSSforwindows→单击方法二:直接双击桌面上的SPSS图标2020/1/105安装后启动的界面SPSS的安装、启动和退出2020/1/106SPSS常用的窗口SPSS的安装、启动和退出2020/1/107SPSS的安装、启动和退出退出方法:单击主菜单中的File→单击Exit注:退出前要保存新建立的或修改的文件内容。与SPSS相关文件的后缀名的意义:.SAVSPSS的数据文件.SPOSPSS在运行中产生的统计分析结果文件.SPSSPSS语法程序文件2020/1/108学习SPSS统计软件的目的学会应用SPSS统计软件进行数据库的建立和数据的正确录入能够正确地选择适当的统计方法对录入的数据进行分析能够对统计结果进行正确的解释2020/1/109一、分析数据库的建立指把科研或日常工作中采集的各种信息、数据,以某种方式存入到计算机磁盘中,建立可随时存取、修改、统计分析的数据文件的全过程。定义变量数据录入保存数据2020/1/1010变量格式设置窗口(VariableView)定义变量2020/1/1011例如在VariableView窗口中Name—更改变量名称Type—选择变量类型(如numeric、date、string)Decimals—设定小数显示的位数Label—分析输出结果中变量的显示名称Values—分析输出结果中变量内容的显示名称定义变量2020/1/1012数据录入数据编辑窗口(DataEditor)操作演示2020/1/1013保存数据操作单击FileSave(As)在文件名栏输入盘符:\路径\文件名单击保存SPSS数据转换功能较强:可存取和转换多种数据类型,Spss(*.sav),Excel(*.xls),Text(*.txt),dBase(*.dbf)文件等。2020/1/1014学生操作建立一个以自己名字为文件名的SPSS数据库调查变量包括:姓名、性别(1=男性,2=女性)、出生日期(美式)、身高(单位cm,保留2位小数)输入自己的数据并保存2020/1/1015二、数据的统计分析用统计指标、统计表、统计图等方法去对资料的数量特征及分布规律进行测定和描述统计分析统计描述指如何抽样以及如何用样本信息推断总体特征的问题统计判断2020/1/1016统计描述(descriptivestatistics过程)新建数据库或打开已有数据库(如:diameter_sub.sav数据库记录了216个人体脊柱椎体的矢状面管径,试对变量“trueap_mean”(矢状面管径)作描述性分析,并绘制直方图)Analyze→Descriptivestatistics→Frequencies→使左侧源变量栏进入右侧variable(s)栏→单击statistics选择统计指标→continue→chat选择要输出的图形→continue→format选择要输出的格式→continue→OK1.频数表分析(frequencies)2020/1/10172020/1/1018频数表分析(frequencies)Quartiles四分位数Mean均数Median中位数Mode众数Sum总和Std.devation标准差Variance方差Range极差S.E.mean标准误□displayfrequencytables显示频数分布表(是针对每一个数值,并非分组段)□percentile(s)显示分布分析:选择P2.5和P97.5或P5和P95(即95%和90%正常值范围)□distribution:选择skewness(偏度系数),kurtosis(峰度系数)2020/1/10192.描述性统计分析(descriptives)建立或打开已有的数据文件操作Analyze→DescriptiveStatistics→Descriptives→使左侧源变量栏进入右侧variable(s)栏→单击opions选择统计量→OK该模块的特殊功能:数据标准化2020/1/10203.探索性描述(explore)建立或打开已有的数据文件操作Analyze→DescriptiveStatistics→Explore→使左侧源变量栏进入右侧dependent栏,分组变量进入factor栏→单击statistics,plots选择统计量→OK该模块的特殊功能:数据的异常值分析以及资料特征分析:正态性以及方差齐性2020/1/1021统计推断3.配对样本均数比较t检验Paired-samplestTestt检验1.样本均数与总体均数比较t检验Onesamplettest2.两样本均数比较t检验Independent-samplestTest计量资料统计推断2020/1/1022统计推断计数资料统计推断双变量直线相关与回归4.2检验crosstable5.相关系数r的假设检验Correlation-bivariate6.回归系数b的假设检验Regression-linear多变量相关与回归……2020/1/1023统计推断1.单样本t检验数据文件“t-test_1.sav”,根据营养学要求,成年女性每日摄入食物的推荐平均热量为7725kcal。今随机抽取11名20至30岁成年女性每日摄入的热量如下:5260,5470,5640,6180,6390,6515,6805,7515,7515,8230,8770问:现今20至30岁成年女性每日摄入食物的平均热量是否足够?Analyze→CompareMeans→OnesampleTtest→使左侧源变量栏变量进入右侧Test栏→在右下方Test中输入总体均数→OK2020/1/1024结果解释One-SampleStatistics116753.641142.123344.363热量(千卡)NMeanStd.DeviationStd.ErrorMeanOne-SampleTest-2.82110.018-971.364-1738.65-204.07热量(千卡)tdfSig.(2-tailed)MeanDifferenceLowerUpper95%ConfidenceIntervaloftheDifferenceTestValue=7725双侧检验的P值标准差标准误自由度t值均数2020/1/1025Analyze→CompareMeans→IndependentSampleTtest→使左侧源变量中的分析变量进入右侧Test栏→左侧源变量中的分组变量进入Grouping栏→单击DefineGroups→输入组的变量值→Continue→OK统计推断2.两样本均数比较t检验以临床试验的数据文件“clinicaltrial.sav”为例,为了检验随机分组变量的均衡性,对治疗前两组的“age(年龄)、heigh(身高)、wt(体重)、SBP(收缩压)、DBP(舒张压)以及pulse(心率)”做两独立样本的t检验注:成组设计的两个变量必须一个是检验变量X,另一个是分组变量group。2020/1/1026结果解释GroupStatistics3047.5012.9052.3563041.5015.0852.754分组试验药安慰剂年龄NMeanStd.DeviationStd.ErrorMeanIndependentSamplesTest1.588.2131.65558.1036.0003.624-1.25513.2551.65556.641.1036.0003.624-1.25913.259EqualvariancesassumedEqualvariancesnotassumed年龄FSig.Levene'sTestforEqualityofVariancestdfSig.(2-tailed)MeanDifferenceStd.ErrorDifferenceLowerUpper95%ConfidenceIntervaloftheDifferencet-testforEqualityofMeans方差齐性检验如果方差齐如果方差不齐2020/1/1027统计推断3.配对样本t检验根据数据文件“clinicaltrial.sav”分别比较试验组和安慰剂组治疗前后4对血常规检查指标,即变量“hb1和hb2(血红蛋白含量)、rbc1和rbc2(红细胞记数)、wbc1和wbc2(白细胞记数)、plt1和plt2(血小板记数),变量名中“1”代表治疗前,“2”代表治疗后Analyze→CompareMeans→PairedSampleTtest→同时使左侧配对的两个变量进入右侧pairedvariables栏→OK注:配对资料必须成对输入,分别以X1和X2表示,无分组变量2020/1/1028结果解释PairedSamplesStatistics134.986022.3142.881129.626019.0342.457治疗前Hb(g/L)治疗后Hb(g/L)Pair1MeanNStd.DeviationStd.ErrorMeanPairedSamplesCorrelations60.625.000治疗前Hb(g/L)&治疗后Hb(g/L)Pair1NCorrelationSig.PairedSamplesTest5.36718.1422.342.68010.0532.29159.026治疗前Hb(g/L)-治疗后Hb(g/L)Pair1MeanStd.DeviationStd.ErrorMeanLowerUpper95%ConfidenceIntervaloftheDifferencePairedDifferencestdfSig.(2-tailed)差值均数ddSdS2020/1/1029统计推断4.2检验为比较紫外线和抗病毒药物治疗带状疱疹的疗效,将带状疱疹患者随机分为两组,临床观察结果见下表,问两组的总体有效率有无差别?(文件名为“chi2_2.sav)组别有效无效合计有效率抗病毒组31255655.36紫外线组5596485.94合计863412071.67紫外线和抗病毒药物治疗带状疱疹疗效比较2020/1/1030注:如果数据库为原始数据则不用加权Data→weightcases→weightcasesby→将频数调入变量栏→okAnalyze→Descriptivestatistics→Corsstabs→分别调入行变量Rows、列变量Columns→Statistics→Chi-square→Continue→Cells→选择结果要输出的内容→Continue→ok2020/1/1031结果解释组别*疗效Crosstabulation31255655.4%44.6%100.0%5596485.9%14.1%100.0%863412071.7%28.3%100.0%Coun

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功