第二讲定量资料的统计描述实习目的和要求•根据分析目的和资料特点选用适当的统计分析方法;•熟悉常用统计方法的SPSS操作步骤;•SPSS运行结果的表达和解释。本次实习的目的和要求•运用SPSS进行定量资料的统计描述(包括统计指标、统计图);•掌握结果的分析和解释(通过对资料的描述能判断其分布类型)。定量资料的统计描述•1、SPSS的操作过程•2、定量资料统计描述的四个常用过程•3、正态分布复习•资料的两种类型定量资料?定性资料统计分析的内容统计描述:统计图表,统计指标统计推断:包括参数估计和假设检验定量资料的统计描述•统计表格:频数分布表(连续型定量资料)•统计图:直方图(连续型定量资料)直条图(离散型定量资料)•统计指标集中趋势:均数、几何均数、中位数离散趋势:极差、方差、标准差、四分位间距等定量资料的统计描述---集中趋势算数均数(mean)适用条件:对称分布,特别是正态或者近似正态分布的资料。几何均数(geometricmean)适用条件:偏态分布,但是经过对数变换之后呈正态或近似正态分布的资料。中位数(median)适用条件:偏态分布资料及两端无确切值或分布不明确的资料。定量资料的统计描述---离散程度极差(range)适用条件:单峰小样本资料,初步描述。四分位间距(inter-quartilerange)适用条件:偏态分布资料及两端无确切值或分布不明确的资料。方差与标准差(variance,standarddeviation)适用条件:对称分布,特别是正态或者近似正态分布的资料。变异系数(CV)适用条件:比较度量单位不同或均数相差悬殊的资料描述定量变量指标的正确选择•正态或近似正态分布的资料均数和标准差•偏态分布的资料中位数和四分位数间距•等比级数或对数正态分布的资料几何均数和四分位数间距正态分布正态分布的判断1.均数与中位数的比较2.频数表3.直方图,P-P图,Q-Q图4.正态性检验:单峰对称操作步骤:Analyze-descriptive-explore-plotshistogramnormalityplotswithtest正态性检验-explore命令2、Q-Q图做法:•以样本的分位数作为横坐标,以按照正态分布计算的相应分位数作为纵坐标,把样本表现为直角坐标系的散点。结果•如果资料服从正态分布,则样本点应该呈一条围绕第一象限对角线的直线。3、其他直方图、W检验、D检验、矩法检验等矩法检验:分别对总体分布的偏度SKEW和峰度KURT进行检验。两者都不拒接零假设,则认为是正态分布。SPSS操作过程SPSS中实现定量资料统计描述的四个常用过程Frequencies过程Descriptives过程Explore过程Ratio过程Frequencies过程:•涉及的统计指标比Descriptives过程全面,并给出常用统计图。•还可以对分类资料以及不服从正态分布的资料进行描述1、Frequencies过程的对话框与选择项•(1)Frequencies过程的对话框①Statistics对话框:②charts对话框③format对话框•练习:•1、1985年某省农村120例6-7岁正常男童胸围测量结果。•Trunc(cc/1.5)*1.5•2、某市1974年为了了解该地居民发汞的基础水平,为汞污染的环境监测积累资料,调查了留住该市一年以上,无明显肝肾疾病,无汞作业接触史的居民238人的发汞含量(umol/kg),试做频数表分析。发汞值(x)1.5~3.5~5.5~7.5~9.5~11.5~13.5~15.5~17.5~19.5~21.5人数(f)2066604818166103表1238人的发汞含量(umol/kg)操作步骤:1、data→weightcases(加权过程)2、frequencise过程Descriptives过程进行一般性的统计描述(统计指标);适用于服从正态分布的定量资料;特殊功能:可对原变量进行标准正态变换。Options:选择按钮•例:一个医生观察了一组住院病人,共24名患者的资料,请对男性病人、全部病人的age、x1、x2进行描述性分析,•见excel表格(病人基本资料.xls)1、data→selectcases选择ifconditionissatisfied,激活if对话框•单击性别,放入输入栏,赋值=1,→continue制作频数分布表•以男童胸围为例:•DescriptiveStatistics•NRangeMinimumMaximum12012.749.161.8•ValidN(listwise)120•根据极差12.7,确定分为9个组,组距为1.5,各组分别为49-50.5,50.5-52…….•步骤:transform→computeExplore过程AnalyzeDescriptiveStatisticsExploreDependentList框:要分析变量PlotsNormalityplotswithtestContinueOK•请对男性和女性身高数据分别进行描述:Factorlist:用于选入分组变量,将对应变量的所有数据,按该因素的取值分组分析。本例为按性别分组。注意:plots按钮:数据转换、齐性检验和正态分布检验均在此对话框中设定(2)statistics对话框•Descriptives:给出描述性统计指标。包括均数、均数可信限,5%修整后均数、总和、中位数、标准差、方差、全距、最小值、最大值、标准误、四分位数范围,峰度系数、偏度系数及其标准误。系统默认值。•Confidenceintervalformean:均数可信限范围,选定Descriptives后才有效,默认为90%,可以修改•M-estimators:选定后,结果给出反应集中趋势的四种最大似然估计量,分别为Huver’s,•Andrew’s,Hampel’s,Tukey’s估计量。一般在数据中存在奇异值或数据呈长尾的对称性分布时选用。•Outliers:选定后,结果给出奇异值(数据中前五位最大值和最小值)。•Percentiles:选定后,结果给5,10,25,50,75,90,95百分位数,和Tukey’s折点(相当于四分位数)(3)plots对话框•Poweretimation:数据转换所得方差齐性的力度估计,并对每组的检验变量,中位数自然对数和四分位数间范围自然对数,做方差齐性检验和散点图。可以帮助决定是否需要做数据转换。•Transformed:对转换后数据做方差齐性检验和分布-水平散点图,选定后在右侧的power栏,选择数据转化方式。有五种可选:•naturallog(自然对数转换)•1/squareroot(平方根倒数转换)•Reciprocal(倒数转换)•Squareroot(平方根转换•Square(平方转换)•Cube(立方转换)•unTransformed:不做数据转换,给出原始数据的方差齐性检验及分布-水平散点图。(4)options对话框Excludecaseslistwise:所有变量中有任一个含缺失值的个体在所有分析中均被忽略,系统默认。Excludecasespairwise:分析中检验变量含缺失值的个体被忽略。Reportvalues:将缺失值作为分组之一。•练习:•请对不同性别的空腹血糖和igf-1进行描述