中央财经大学实验报告实验项目名称假设检验、方差分析、非参数检验所属课程名称统计学实验类型设计型、综合型实验实验日期2014年4月成绩实验报告1数据准备。从500个人中随机抽取大约30%。1、用SPSSStatistics软件进行参数估计和假设检验。(以下假设检验中限制性水平设为5%)(1)计算总体中上月平均工资95%的置信区间(分析描述统计探索)。下表为SPSS软件进行对“平均工资”变量进行描述统计分析所得。从表中可以直接得到95%置信区间为【2118.79,2277.21】统计量标准误(元)均值2198.0040.083均值的95%置信区间下限2118.79上限2277.215%修整均值2202.96中值2200.00方差241002.685标准差490.920极小值800极大值3700范围2900四分位距600偏度-.042.198峰度.713.3942(2)检验能否认为总体中上月平均工资等于2000元。(单个样本t检验)单个样本检验检验值=2000tdfSig.(双侧)均值差值差分的95%置信区间下限上限(元)4.940149.000198.000118.79277.21根据题目要求,这里采用双侧假设。零假设和备择假设为:H0=2000,H1≠2000。由上表得,p=0.0000.05=α,所以,拒绝原假设,即可以认为中体中上月平均工资不等于2000元(3)检验能否认为男生的平均工资大于女生。(两个独立样本t检验)组统计量性别N均值标准差均值的标准误(元)男生672422.39438.25453.541女生832016.87457.14450.178独立样本检验方差方程的Levene检验均值方程的t检验差分的95%置信区间FSig.tdfSig.(双侧)均值差值标准误差值下限上限(元)假设方差相等.004.9525.501148.000405.52173.712259.856551.185假设方差不相等5.526143.655.000405.52173.379260.478550.563检验的零假设和备择假设为:H0:男生的平均工资不大于女生H1:男生的平均工资大于女生如上表所示,方差检验的p值等于0.0920.05,因此不拒绝方差相等的原假设,认为男女平均工资的方差相等。所以t检验选取方差相等的一列,其中双侧检验的p值为0.000,因此右侧检验的p值为0.000/2=0.0000.05(显著性水平),所以拒绝原假设,因此认为男生的平均工资大于女生。3(4)一些学者认为,由于经济不景气,学生的平均工资今年和去年相比没有显著提高。检验这一假说。(匹配样本t检验)。成对样本检验成对差分tdfSig.(双侧)均值标准差均值的标准误差分的95%置信区间下限上限对1上月工资-去年同月工资-1.333190.36815.543-32.04729.381-.086149.932H0:μ1-μ2≤0;H1:μ1μ2双侧检验的p值为0.932,,因此右侧检验为0.4660.05。所以不拒绝原假设,即学生的平均工资今年和去年相比没有显著提高2、方差分析。(1)使用单因素方差分析的方法检验:能否认为不同学科的上月平均工资相等。如果不能认为全相等,请做多重比较。描述(元)N均值标准差标准误均值的95%置信区间极小值极大值下限上限经济类442215.91537.41181.0182052.522379.308003100管理类582182.76485.63163.7672055.072310.4510003600其他类482200.00461.72766.6442065.932334.0712003700总数1502198.00490.92040.0832118.792277.218003700ANOVA(元)平方和df均方F显著性组间27777.743213888.871.057.945组内3.588E7147244092.668总数3.591E7149H0:不同学科的上月平均工资相等;H1:不同学科的上月平均工资不全相等。4由上表得,P值为0.9450.05,因此拒绝零假设,即不同学科的上月平均工资不全相等。所以再进行多重比较:多重比较(元)LSD(I)学科(J)学科均值差(I-J)标准误显著性95%置信区间下限上限经济类管理类33.15098.773.738-162.05228.35其他类15.909103.116.878-187.87219.69管理类经济类-33.15098.773.738-228.35162.05其他类-17.24196.404.858-207.76173.28其他类经济类-15.909103.116.878-219.69187.87管理类17.24196.404.858-173.28207.76H0:两类差异不显著;H1:两类差异显著由上表得,经济类和管理类:p=0.7380.05;经济类和其他类:p=0.8780.05;管理类和其他类:p=0.8580.05。因此拒绝原假设,任意两类差异都是显著的。(2)在方差分析中同时考虑学科和性别因素,用双因素方差分析模型分析学科和性别对上月平均工资的影响。主体间因子值标签N性别0男生671女生83学科1经济类442管理类583其他类48描述性统计量因变量:(元)性别学科均值标准偏差N男生经济类2547.37335.60619管理类2368.00452.512255其他类2378.26491.71023总计2422.39438.25467女生经济类1964.00529.05625管理类2042.42468.39533其他类2036.00370.67525总计2016.87457.14483总计经济类2215.91537.41144管理类2182.76485.63158其他类2200.00461.72748总计2198.00490.920150主体间效应的检验因变量:(元)源III型平方和df均方FSig.校正模型6.613E651322539.0176.501.000截距7.218E817.218E83547.603.000性别6353215.52816353215.52831.228.000学科75318.176237659.088.185.831性别*学科480288.8312240144.4151.180.310误差2.930E7144203449.340总计7.606E8150校正的总计3.591E7149a.R方=.184(调整R方=.156)(1)“性别”显著性影响性:H0:“性别”对“上月工资”无显著性差异;H1:“性别”对“上月工资”有显著性差异。由上表得,“性别”对“上月工资”p=0.0000.05,因此拒绝原假设,不同性别的上月工资有显著性差异。(1)“学科”显著性影响性:H0:“学科”对“上月工资”无显著性差异;H1:“学科”对“上月工资”有显著性差异。由上表得,“学科”对“上月工资”p=0.8310.05,因此不拒绝原假设,不同学科的上月工资无显著性差异。(3)“性别”与“学科”交互作用的显著性影响:H0:“性别”与“学科”交互作用对“上月工资”无显著性差异;H1:“性别”与“学科”交互作用对“上月工资”有显著性差异。由上表得,“性别”与“学科”交互作用对“上月工资”p=0.3100.05,因此不拒绝原假设,“性别”与“学科”交互作用对“上月工资”无显著性差异。63、非参数检验。(1)用非参数检验方法检验能否认为男生和女生上月工资的中位数相等。使用非参数检验的两个独立样本的Wlicoxon秩和检验:检验的零假设和备择假设如下:H0:男性和女性的上月收入的中位数相等;H1:男性和女性的上月收入的中位数不相等。秩性别N秩均值秩和上月工资06794.926359.5018359.834965.50总数150检验统计量a上月工资Mann-WhitneyU1479.500WilcoxonW4965.500Z-4.931渐近显著性(双侧).000a.分组变量:性别根据表一,男性上月收入的平均秩是94.92,女性为59.83,说明从样本上看男性的上月收入的中位数高于女性。从表二看,WilcoxonW统计量为4965.5,表二中显示渐进显著性(双侧检验)的p值为0.000显著性水平0.05,拒绝原假设,结论是男性和女性的上月收入中位数不相等。(2)用非参数检验方法检验学生上月工资和去年同月工资的中位数是否有显著变化。使用非参数检验中的两个相关样本的Wilcoxon符号秩检验:检验的零假设和备择假设如下:H0:上月工资与去年同月工资之差的中位数为0;H1:上月工资与去年同月工资之差的中位数不为0。秩7N秩均值秩和去年同月工资-上月工资负秩66a64.684269.00正秩65b67.344377.00结19c总数150a.去年同月工资上月工资b.去年同月工资上月工资c.去年同月工资=上月工资检验统计量b去年同月工资-上月工资Z-.126a渐近显著性(双侧).900精确显著性(双侧).903精确显著性(单侧).451点概率.003a.基于负秩。b.Wilcoxon带符号秩检验频率N去年同月工资-上月工资负差分a66正差分b65结c19总数150a.去年同月工资上月工资b.去年同月工资上月工资c.去年同月工资=上月工资检验统计量a8去年同月工资-上月工资Z.000渐近显著性(双侧)1.000精确显著性(双侧)1.000精确显著性(单侧).500点概率.069a.符号检验表二采用渐进分布(正态分布)的Z值(-1.26)、p值(0.900),以及精确检验的p值(0.903)。由于其p值远远大于0.05,显然不能拒绝原假设,也就是说上月工资和去年同月工资的中位数没有有显著变化。表三和表四是符号检验的结果。表三表明有差值序列中有66个负数,65个正数;表四表明采用精确检验(二项分布)计算的双侧检验的p值为1.0,也不能拒绝原假设。(3)用非参数检验方法不同学科学生平均学分绩点的中位数是否相等。使用非参数检验中的多个独立样本的Kruskal-Wallis检验:检验的零假设和备择假设为:H0:三个学科平均学分绩点的中位数相等;H1:三个学科平均学分绩点的中位数不相等.秩学科N秩均值平均学分绩点14476.1825875.1234875.33总数150检验统计量a,b,c平均学分绩点卡方.016df2渐近显著性.992a.KruskalWallis检验b.分组变量:学科9检验统计量a,b,c平均学分绩点卡方.016df2渐近显著性.992a.KruskalWallis检验b.分组变量:学科c.由于没有足够内存,无法计算某些或所有精确显著性。由表一得,各组的平均值分别为76.18、75.12、75.33。表二表明,Kruskal-Wallis检验中使用χ2分布进行近似计算式的χ2统计量为0.016,自由度为2,相应的p值为0.9920.05(显著性水平),所以不能拒绝原假设,即三个学科平均学分绩点的中位数相等。(4)检验学生的上月工资是否服从正态分布。使用非参数检验的单样本K-S检验:原假设和备择假设为:H0:学生的上月工资服从正态分布;H1:学生的上月工资不服从正态分布。单样本Kolmogorov-Smirnov检验上月工资N150正态参数a,,b均值2198.00标准差490.920最极端差别绝对值.085正.072负-.085Kolmogorov-SmirnovZ1.044渐近显著性(双侧).226a.检验分布为正态分布。b.根据数据计算得到。由上表得,Dmax统计量的值为0.072,相应的p值为0.2260.05(显著性水平),所以不能拒绝原假设,即学生的上月工资服从正态分布。(5)检验学生对专业的满意程度是否为离散的均匀分布。10使用非参数检验中的一个样本的K-S检验中的均匀检验:零假设和备择假设为:H0:学生对专业的满意程度为离散的均匀分布H1:学生对专业的满意程度不是离散的均匀分布单样本Kolmogorov-Smirn