1第四章SPSS基本统计分析§4.1频数分析§4.2计算基本描述统计量§4.3交叉分组下的频数分析§4.4多选项分析§4.5比率分析2统计分析内容统计描述相关与回归参数估计点估计区间估计假设检验:均值间的比较统计推断3知识回顾:统计描述的工具(一)统计指标1、集中趋势Centraltendency2、离散趋势Dispersiontendency3、偏度和峰度(二)统计表(分配数列)(三)统计图直方图(Histogram)条形图(BarChart)饼图(PieChart)4统计指标——集中趋势的描述算术平均数(Arithmeticmean)调和平均数数值平均数几何平均数(geometricmean)中位数(median)位置平均数众数(mode)iXnH1iXmmHnniiXG1niiFniFiXG11nXXiiiiFFXX5统计指标——离散趋势指标1、全距(Range,R)2、方差(variance)和标准差(standarddeviation)3、四分位差(quartileinterval)4、变异系数(coefficientofvariance,CV)iiiFF)XX(Var2iiiFF)XX(SD2%XSDCV100LUQQQ6描述对称程度的统计量——偏度偏度(skewness):描述某变量所有变量值分布形态的偏斜程度和方向偏度为0表示对称大于0表示右偏小于0表示左偏左偏分布右偏分布iniiiFFXXSkewness313=7描述陡峭程度的统计量——峰度峰度(kurtosis)描述某变量所有变量值分布形态陡峭程度峰度为0表示与正态分布陡峭程度相同大于0表示比正态分布陡,尖峰小于0表示比正态分布缓,平峰扁平分布尖峰分布3414-iniiiFFXXKurtosis8统计表——分配数列某班统计学考试成绩次数分配考分次数向上累计向下累计人数(人)比率(%)人数(人)比率(%)人数(人)比率(%)50~6025.025.040100.060~70717.5922.53895.070~801127.52050.03177.580~901230.03280.02050.090~100820.040100.0820.0合计40100.0————————9统计图之直方图1512直方图下的面积之和等于1963105110115120125130135140某车间工人日加工零件数的直方图10统计图之条形图3075604515类型1类型2类型3类型4类型5类型6类型7不同类型广告喜好程度条形图11其他广告1.0%房地产广告8.0%商品广告56.0%金融广告4.5%服务广告25.5%招生招聘广告5.8%某城市居民关注不同类型广告的人数构成统计图之饼图(圆形图)12§4.1频数分析(Frequencies)产生频数表,输出每个变量值对应的频数;输出基本描述统计量产生直方图、条图、饼图适用于定类及定序变量资料例:“住房状况调查.sav”1.分析户主从业情况、目前所住房屋产权情况;2.分析对比本市户口和外地户口人均住房面积的分布。如何输出组距式频数表?13Statistics子对话框PercentileValues复选框组定义输出的百分数四分位数(Quartiles)、每隔指定百分位输出当前百分位数(Cutpointsforequalgroups)、或直接指定某个百分位数(Percentiles)Centraltendency复选框组定义描述集中趋势均值(Mean)、中位数(Median)、众数(Mode)、总和(Sum)14Statistics子对话框Dispersion复选框组:定义描述离散趋势标准差(Std.deviation)、方差(Variance)、全距(Range)、最小值(Minimum)、最大值(Maximum)、标准误(S.E.mean)Distribution复选框组:定义描述分布特征偏度系数(Skewness)和峰度系数(Kurtosis)Valuesaregroupmidpoints复选框确定输出的数据是分组频数数据,具体数据为组中值15Charts子对话框ChartType统计图类型选项栏None:不生成图Barcharts:绘制条形图Piecharts:绘制饼图Histograms:绘制直方图Withnormalcurve(加上正态曲线)16Charts子对话框ChartValues作图数据选项栏如果选择了Barcharts或Piecharts,便激活了ChartValues选项栏Frequencies:按频数作图Percentage:按百分比作图17Format对话框Orderby频数表的排列次序选项栏Ascendingvalues按变量值的升序从小到大排列Descendingvalues按变量值的降序从大到小排列Ascendingcounts按频数的升序从小到大排列Descendingcounts按频数的降序从大到小排列Multiplevariables多变量选项栏:用两个以上变量作频数表Comparevariables两个变量的结果结合输出Organizeoutputbyvariables各变量单独输出Suppresstableswithmorethancategories分组变量大于10时禁止在结果窗口中输出,以免产生巨型表格18§4.2计算基本描述统计量(Descriptives)进行一般性的统计描述,适用于正态分布资料与频数分析的区别:用于连续性变量Z值的产生例:“住房状况调查.sav”1.对人均住房面积计算基本描述统计量,并分别对本市户口和外地户口家庭进行比较;2.分析人均住房面积是否有不均衡现象。19§4.3交叉分组下的频数分析(Crosstabs)对两个变量之间关系的统计描述适用于定类变量和定序变量统计检验:卡方检验(行列变量是否独立)H0:行列变量独立例1:“职工数据.sav”,要求:编制职称和文化程度交叉分组表;编制职称、文化程度和性别三维交叉分组表例2:“住房状况调查.sav”,分析本市户口和外地户口家庭对“未来三年是否打算买房”是否持相同的态度。20§4.4多选项分析(Multiple)定义多选变量Frequencies过程Crosstabs过程统计描述指标例:“保险市场调查.sav”1.分析老年人购买商业养老保险的原因;2.分析不同单位性质人员购买商业养老保险的原因。21§4.5比率分析(Ratio)用于两变量间变量值比率变化的描述分析,适用于定距数据比率变量集中或离散程度指标例:“各地区保险业务保费收入”,分析各类地区财产保险业务的保费收入占全部业务保费收入的比例情况22待续!