SPSS统计分析第二讲统计描述(4)第二讲第二讲统计描述(统计描述(44))主要内容2.5单个名义变量统计描述2.6多指标统计描述SPSS统计分析2.5单个名义变量的描述分析例2-6对数据文件data2-1中的性别和学校两个变量计算其构成比,并绘制直条图。1、操作提示:单击Analyze/DescriptiveStatistics/Frequencies打开频率分析对话框,选择分析。SPSS统计分析单击Statistics取消所有基本统计量。SPSS统计分析单击Charts设置选项。2、结果解释SPSS统计分析2.6多指标的描述分析例2-7对data2-1中的数据分别计算各学校参与调查学生的性别构成比。1、操作提示:单击Analyze/DescriptiveStatistics/Crosstabs打开相关分析对话框,选择分析。SPSS统计分析绘制分组直条图取消统计表输出相关分析对话框设置:选择行变量选择列变量层变量表内统计量输出格式前一层后一层SPSS统计分析百分比行百分比列百分比总百分比表内统计量对话框设置:频数实际频数理论频数残差实际值标准化残差调整标准化残差SPSS统计分析输出格式对话框设置:行变量输出格式行变量数据值升序排序行变量数据值降序排序2、结果解释SPSS统计分析练习2-9某药厂观察9只小鼠口服高山红景天醇提物(RSAE)后在乏氧条件下的生存时间(分钟)如下:49.1,60.8,63.3,63.6,63.6,65.6,65.8,68.6,69.0求其均值、中位数和众数。中位数(n为奇数,M=63.6)SPSS统计分析计算常用统计指标:极差、四分位数间距、方差、标准差和变异系数。练习2-10设甲、乙、丙三人,采每人的耳垂血,然后红细胞计数,每人数5个计数盘,得结果如下(万/mm3)盘编号甲乙丙14404804902460490495350050050045405105055560520510SPSS统计分析练习2-118名新生儿的身高(cm)为55,58,54,50,53,51,54,52,求中位数。解数据排序得50,51,52,53,54,54,55,5845()(1)2211()22nnMxxxx8n535453.52SPSS统计分析第三讲正态性检验第三讲第三讲正态性检验正态性检验主要内容3.1P-P图法3.2Q-Q图法3.3直方图、箱式图与茎叶图法3.4计算法SPSS统计分析3.1P-P图法正态P-P图是以样本的累计频率作为横坐标,以按照正态分布计算的相应累计概率作为纵坐标,把样本值表现为直角坐标系的散点,所描绘的图形。如果资料服从正态分布,则样本点应呈一条围绕第一象限对角线的直线。两种P-P图:正态P-P图和正态去势P-P图(累计概率残差图)SPSS统计分析正态去势P-P图(累计概率残差图)是以样本的实际累计频率作为横坐标,以样本的实际累计频率与按照正态分布计算的相应累计概率差(称为累计概率的残差)作为纵坐标,把样本表现为直角坐标系的散点,所描绘的图形。如果资料服从正态分布,残差散点基本在Y=0上下均匀分布。SPSS统计分析3.1P-P图法例3-1某地40名30-49岁健康成年男子血清胆固醇(mmol/l)的测定结果见数据文件data3-3,试对该资料进行正态性检验。1、运用P-P图法操作提示:单击Craphs/p-p…打开p-p作图对话框,选择作图。SPSS统计分析P-P作图对话框设置检验分布类型定义所检验的分布参数根据样本数据估计总体参数转换自然对数变换标准化值差分变换季节差分变换SPSS统计分析对数分布对数正态分布正态分布帕累托分布t分布威布尔分布均匀分布检验分布类型SPSS统计分析P-P作图对话框设置选择计算比例的计算公式数值相同编秩方法平均、最高、最低秩次相同值在秩次范围内任意分配SPSS统计分析例3-1某地40名30-49岁健康成年男子血清胆固醇(mmol/l)的测定结果见数据文件data3-3,试对该资料进行正态性检验。P-P作图操作提示:单击Craphs/p-p…打开p-p作图对话框;将血清胆固醇变量选入分析变量框;使用默认选项,单击确定,完成操作。SPSS统计分析2、结果解释NormalP-PPlotof血清总胆固醇ObservedCumProb1.00.75.50.250.00ExpectedCumProb1.00.75.50.250.00DetrendedNormalP-PPlotof血清总胆固醇ObservedCumProb1.0.8.6.4.20.0DeviationfromNormal.08.06.04.020.00-.02-.04SPSS统计分析练习3-1对数据文件data2-1,中的体重、身高和肺活量的资料利用P-P图法进行正态性检验。SPSS统计分析3.2Q-Q图法正态Q-Q概率图:是以样本的分位数(Px)为横坐标,以按照正态分布计算的相应理论分位数为纵坐标,把样本表现为直角坐标系的散点,所描绘的图形。如果资料服从正态分布,则样本点应呈一条围绕第一象限对角线的直线。SPSS统计分析3.2Q-Q图法正态去势Q-Q图(分位数的残差图):是以样本的实际分位数作为横坐标,以样本的实际分位数与按照正态分布计算的相应理论分布分位数的差(称为分位数的残差)作为纵坐标,把样本表现为直角坐标系的散点,所描绘的图形。如果资料服从正态分布,残差散点基本在Y=0上下均匀分布。SPSS统计分析1、运用Q-Q图法操作提示:单击Craphs/Q-Q…打开Q-Q作图对话框,选择作图。例3-2某地40名30-49岁健康成年男子血清胆固醇(mmol/l)的测定结果见数据文件data3-3,试对该资料进行正态性检验。SPSS统计分析Q-Q作图对话框设置检验分布类型定义所检验的分布参数根据样本数据估计总体参数转换自然对数变换标准化值差分变换季节差分变换SPSS统计分析2、结果解释NormalQ-QPlotof血清总胆固醇ObservedValue8765432ExpectedNormalValue765432DetrendedNormalQ-QPlotof血清总胆固醇ObservedValue876543DeviationfromNormal.6.5.4.3.2.10.0-.1-.2SPSS统计分析例3-2某地40名30-49岁健康成年男子血清胆固醇(mmol/l)的测定结果见数据文件data3-3,试对该资料进行正态性检验。单击Craphs/q-q…打开q-q作图对话框;将血清胆固醇变量选入分析变量框;使用默认选项,单击确定,完成操作。Q-Q图操作提示:SPSS统计分析3.3直方图、箱式图与茎叶图法例3-3某地40名30-49岁健康成年男子血清胆固醇(mmol/l)的测定结果见数据文件data3-3,试对该资料进行正态性检验。3.3.1直方图直方图:用于表示连续变量的频数分布,横轴表示被观察的指标,纵轴表示单位组段频数或频率,以直条的面积代表各组段的频数或频率。SPSS统计分析直方图法操作讲解:单击Craphs/Histogram打开直方图作图对话框,选择作图。图形模板文件图形模板文件路径在直方图上显示正态曲线给图形添加标题、副标题、脚注SPSS统计分析标题副标题脚注SPSS统计分析例3-3某地40名30-49岁健康成年男子血清胆固醇(mmol/l)的测定结果见数据文件data3-3,试对该资料进行正态性检验。直方图操作提示:单击Craphs/Histogram打开直方图作图对话框;将血清胆固醇变量选入分析变量框;使用默认选项(或选择添加正态曲线和标题等),单击确定,完成操作。SPSS统计分析结果解释血清总胆固醇7.257.006.756.506.256.005.755.505.255.004.754.504.254.003.753.503.256543210Std.Dev=.87Mean=4.80N=40.00SPSS统计分析3.3.2箱式图箱式图:用以描述定量变量5个百分位点,P2.5、P25、P50、P75、P97.5。5条线表示5个百分位点,由P25至P75构成“箱”,它代表中间50%的数据。由P2.5至P25及P75至P97.5构成两条“丝”,它代表两端45%的数据。SPSS统计分析3.3.2箱式图40N=血清总胆固醇1098765432154040N=血清总胆固醇1098765432154040N=血清总胆固醇10987654321540P2.5P25P50P75P97.5极端值:超出距箱上缘或下缘3倍四分位数间距的值。离群点:距箱上缘或下缘1.5倍至3倍四分位数间距的值为离群值。SPSS统计分析箱式图法操作讲解:单击Craphs/Boxplot打开箱式图作图对话框,选择作图。选择汇总方式以某个分类变量分组汇总分别对各变量进行汇总单式箱图复式箱图SPSS统计分析单击Define按钮,打开单式箱式图定义对话框,选择作图。观察单位标记(标记极端值、离群值)SPSS统计分析分类变量单击Define按钮,打开复式箱式图定义对话框,选择作图。观察单位标记(标记极端值、离群离)SPSS统计分析单击Opitions按钮,打开其它设置对话框,选择作图。显示含缺失值组含有任何缺失值个案均被剔除只剔除本次统计变量含缺省值个案显示标识的观察单位的图形SPSS统计分析例3-3某地40名30-49岁健康成年男子血清胆固醇(mmol/l)的测定结果见数据文件data3-4,试对该资料进行正态性检验。箱式图操作提示:单击Craphs/Boxplot打开箱式图作图对话框;将血清胆固醇变量选入分析变量框;使用默认选项,单击确定,完成操作。SPSS统计分析结果解释40N=血清总胆固醇87654315SPSS统计分析3.3.3茎叶图茎叶图:它是将频数表的组段用实际数值取代,数值用“茎”和“叶”组成。是将数据按基本不变或变化不大那一位的数值作为一个主杆(茎),将变化大的位的数值作为分支(叶),列在主杆后面。茎叶图有三列数,左边一列是频数,它是每个主杆上的叶子数;中间是茎;右边一列是叶。可以把茎叶图看作是用数字组成的直方图。SPSS统计分析SPSS统计分析茎叶图法操作讲解:操作提示单击Analyze/DescriptiveStatistics/Explore打开探索性统计分析主对话框,选择分析。SPSS统计分析统计图对话框描述图茎叶图直方图SPSS统计分析例3-3某地40名30-49岁健康成年男子血清胆固醇(mmol/l)的测定结果见数据文件data3-3,试对该资料进行正态性检验。茎叶图操作提示:将血清胆固醇变量选入分析变量框;单击Plots…,选择茎叶图,单击确定,完成操作。单击Analyze/DescriptiveStatistics/Explore打开探索性统计分析主对话框;SPSS统计分析结果解释SPSS统计分析3.4计算法3.4.1偏度系数与峰度系数的计算单击Analyze/DescriptiveStatistics/Descriptives打开描述统计主对话框,选择分析。单击其他统计量选择对话框,选择偏度与峰度系数,返回完成设置。SPSS统计分析例3-3某地40名30-49岁健康成年男子血清胆固醇(mmol/l)的测定结果见数据文件data3-3,试对该资料进行正态性检验。计算偏度、峰度系数操作提示:将血清胆固醇变量选入分析变量框;选择偏度、峰度选项,单击确定,完成操作。单击Analyze/DescriptiveStatistics/Descriptives打开描述统计主对话框,选择分析。SPSS统计分析结果解释DescriptiveStatistics40.476.374.275.73340血清总胆固醇ValidN(listwise)StatisticStatisticStd.ErrorStatisticStd.ErrorNSkewnessKurtosisSPSS统计分析3.4.2K-S检验与S-W检验K-S检验是一种非参数检验方法,可以对样本的拟合优度进行检验。S-