注意如何选择合适的做图方式变量的尺度–定类–定序–定距变量的个数–单变量–双变量及以上分类变量–饼图(PiesChart)–帕累托图(ParetoChart)连续变量–直方图(Histogram)–P-P图和Q-Q图(检验正态分布)一、描述单变量分布箱式图(Boxplot)散点图(Scatter)二、描述两个及以上变量的关系条图(BarChart)线图(LineChart)面积图(AreaChart)三、既适用于单变量,也适用于双变量一:(1)饼图PiesChart用途–主要用于描绘单个分类变量的频数(频率)分布。例1–对SPSS自带数据“1991U.S.General”中的“race”变量绘制饼图。步骤1:点击“Graphs”菜单下的“Pies”,弹出对话框步骤2:选择“Summariesforgroupsofcases”步骤3:点击“Define”,进入定义对话框步骤4:在“SlicesRepresent”中选择“%ofcases”步骤5:在“DefineSlicesby”中选择“race”变量步骤6:点击“OK”步骤7:双击图形,弹出“ChartsEditor”对话框步骤8:点击“Elements”菜单下的“ShowDataLabels”步骤9:关闭“ChartsEditor”对话框一:(2)帕累托图ParetoChart用途–以意大利经济学家V.Pareto的名字而命名。主要用于绘制单个分类变量的频数(频率)分布,并且按各类别出现的频数多少排序。例2–对SPSS自带数据“1991U.S.General”中的“race”变量绘制帕累托图。步骤1:点击“Graphs”菜单下的“Pareto”,弹出对话框步骤2:选择“Simple”图步骤3:点击“Define”,弹出对话框”步骤4:在“BarsRepresent”中选择“Counts”步骤5:点击“OK”一:(3)直方图Histogram用途–用于描绘单个连续变量的频数分布,实际应用中常用于考察变量的分布是否服从正态分布。例3–对SPSS自带数据“1991U.S.General”中的“age”变量绘制直方图,并考察其是否服从正态分布。步骤1:点击“Graphs”菜单下的“Histogram”,弹出对话框步骤2:将“age”变量拖入“Variable”空白框步骤3:选择“Displaynormalcurve”步骤4:点击“OK”一:(4)P-P图用途–根据变量的累积概率对应于所指定的理论分布累积概率绘制的散点图,可以直观地监测样本数据是否与某个概率分布的统计图形一致。例4–对SPSS自带数据“1991U.S.General”中的“edu”变量绘制P-P图,考察其是否服从正态分布。步骤1:点击“Graphs”菜单下的“P-P”,弹出对话框步骤2:将“edu”变量拖入“Variable”空白框步骤3:在“TestDistribution”中选择“Normal”步骤4:点击“OK”,出现图1-正态P-P图横轴表示数据的实际累积概率纵轴表示正态分布的理论累积概率如果数据呈正态分布,则图中数据点应和理论直线(对角线)基本重合。从图1,我们可以发现数据点基本和对角线重合,因此可以判断教育数据服从正态分布。对图1的结果说明图2-去势正态P-P图为了更详细的说明问题,我们需要进一步观察去势P-P图,即图2。该图反映的是按正态分布计算的理论值与实际值之差的分布情况,即分布的残差图。如果数据服从正态分布,则数据点应较均匀地分布在y=0这条直线上下。从图2,我们可以发现残差正态评分的绝对值都在0.08之内,说明数据基本服从正态分布。对图2的结果说明一:(5)Q-Q图用途–Q-Q图与P-P图的原理与用法基本一致,也可以用于分布的检验,所不同的是Q-Q图是根据变量数据分布的分位数对应于所指定分布的分位数绘图的统计图。例5–对SPSS自带数据“1991U.S.General”中的“edu”变量绘制Q-Q图,考察其是否服从正态分布。步骤1:点击“Graphs”菜单下的“Q-Q”,弹出对话框步骤2:将“edu”变量拖入“Variable”空白框步骤3:在“TestDistribution”中选择“Normal”步骤4:点击“OK”,出现图1-正态Q-Q图步骤5:图2-去势正态Q-Q图二:(1)箱式图(Boxplot)用途–主要用于描述一个或多个分类变量与一个连续变量之间的关系。例6–对SPSS自带数据“1991U.S.General”中的“edu”变量和“race”变量绘制箱式图,即比较各个种族的教育程度。步骤1:点击“Graphs”菜单下的“Boxplot”,弹出对话框步骤2:选择“Simple”图步骤3:选择“Summariesforgroupsofcases”步骤4:点击“Define”,进入定义框步骤5:将“edu”变量拖入“Variable”空白框步骤6:将“race”变量拖入“CategoryAxis”空白框步骤7:点击“OK”每个箱形都由最中间的粗线、一个方框、外延出来的两条细线和最外端可能有的单独散点组成。中间的粗线条表示当前变量的中位数。方框的两端分别表示上四分位数、下四分位数,二者之间的距离为四分位数间距。方框外的上、下两个细线分别表示除去异常值外的最大、最小值。对图的说明在箱图中,凡是与四分位数值的距离超过1.5倍四分位数间距的都视为异常值,其中离方框上、下界的距离超过四分位数间距1.5倍的为离群值,在图中以“0”表示;超过3倍的则为极值,用“*”表示。二:(2)散点图(Scatter)用途–常用于描绘两个连续变量或多个连续变量之间的关系。类型–简单散点图–矩阵散点图–重叠散点图–三维散点图例7–对SPSS自带数据“1991U.S.General”中的“edu”变量和“prestg80”变量绘制简单散点图。步骤1:点击“Graphs”菜单下的“Scatter”,弹出对话框步骤2:选择“SimpleScatter”步骤3:点击“Define”,弹出对话框步骤4:将“prestg80”拖入Y轴,将“edu”拖入X轴步骤4:点击“OK”例8–对SPSS自带数据“1991U.S.General”中的“edu”变量、“prestg80”变量和“age”变量绘制矩阵散点图。步骤1:点击“Graphs”菜单下的“Scatter”,弹出对话框步骤2:选择“MatrixScatter”步骤3:点击“Define”,弹出对话框步骤4:将三个变量拖入“MatrixVariable”空白框步骤5:点击“OK”例9–对SPSS自带数据“1991U.S.General”中的“edu”变量、“prestg80”变量和“age”变量绘制重叠散点图。步骤1:点击“Graphs”菜单下的“Scatter”,弹出对话框步骤2:选择“MatrixScatter”步骤3:点击“Define”,弹出对话框步骤4:将“age”和“prestg80”作为一对拖入“Y-X”空白框步骤5:将“edu”和“prestg80”作为一对拖入“Y-X”空白框步骤6:点击“OK”例10–对SPSS自带数据“1991U.S.General”中的“edu”变量、“prestg80”变量和“age”变量绘制三维散点图。步骤1:点击“Graphs”菜单下的“Scatter”,弹出对话框步骤2:选择“MatrixScatter”步骤3:点击“Define”,弹出对话框步骤4:将“age”、“edu”和“prestg80”分别拖入三个空白框步骤5:点击“OK”习题(2003数据)分别为以下三个变量绘制合适的统计图:marital、edu、incyear选择合适的统计图来表示教育程度(edu)与月收入(incmonth)的关系选择合适的统计图来表示每周工作时间(wkhrs)与月收入(incmonth)的关系选择合适的统计图来表示家庭年收入(hhyrinc)、家庭月生活费(basicexp)和住房建筑面积(floorsq)之间的两两关系。