SPSS数据分析教程—《SPSS数据分析教程》主要内容假设检验的基本思想均值过程和输出结果的解释单样本T检验方法、应用条件和输出结果独立样本T检验方法、应用条件和输出结果配对样本T检验方法、应用条件和输出结果假设检验的基本思想假设检验的基本思想假设检验的思想反证法及小概率原理。所谓反证法及小概率原理即首先在原假设正确的条件下计算出现该样本或者样本统计量的概率,如果这种事件发生的概率很小,譬如小于5%,那么就拒绝原来的假设,而接受备择假设。两类错误“小概率事件在一次试验中几乎不会发生”,但是小概率事件并非是不可能发生,只是其发生的概率很小,并不能完全排斥其发生的可能性。因而假设检验有可能犯两类错误:第一类错误:原假设正确,而错误地拒绝了它,即“拒真”的错误,其发生的概率为犯第一类错误的概率。第二类错误:原假设不正确,而错误地没有拒绝它,即“受伪”错误,其发生的概率为犯第二类错误的概率。显著性值假设检验一般先对总体的比例、均值或分布做出某种假设,称为原假设;然后计算在该假设成立条件下出现该事件的概率,称为p值,或显著性值。如果小概率事件发生了,即p®,则表明样本不支持原来的假设,应拒绝原假设而接受备择假设;如果该事件发生的概率(或可能性)较大,即p®,则不拒绝原假设。我们用®来控制犯第一类错误的概率,即犯该类错误的概率最大为®。假设检验的步骤1.确定恰当的原假设和备择假设;2.选择检验统计量;3.计算检验统计量观测值发生的概率,即p值;4.给定显著性水平®,并作出决策。如果p®,则拒绝原假设,反之,没有理由拒绝原假设。均值子菜单均值过程SPSS的均值过程是描述和分析尺度变量(Scale)的一种有用的方法,可以获得需要分析的变量的许多中心趋势和离散趋势的统计指标,同时它可以对不同的组别或者交叉组别进行比较。均值过程可以计算一个或多个自变量类别中因变量的子组均值和相关的单变量统计。也可以从该过程获得单因素方差分析、eta和线性相关检验。均值过程分析本书数据文件HourlyWage.sav是对护士工资的调查,它调查了不同岗位的护士,记录了他们的小时工资、工作经验、年龄等指标。应用SPSS的均值过程分析护士的小时工资、工作经验和工作位置之间的关系。均值方法操作【分析】→【比较均值】→【均值】均值:选项双因素的均值过程分析在“层1的1”框中,yrsscale;单击【下一张】,把position变量选入“层2的2”框中。两因素的均值分析报告Anova和Eta由于均值过程只对第一层的自变量进行方差分析和线性相关检验,因此两个因素或者两个以上因素的均值分析过程的方差分析结果和单因素一样。不同的是描述性统计量,多因素的描述性统计量是对于各个交叉组别进行统计。单样本T检验单样本T检验即检验某个变量的总体均值和某指定值之间是否存在着显著性差异。如果是大样本的单样本检验,统计教科书上称为U检验,它采用服从正态分布的U统计量作为检验统计量;如果是小样本并且样本服从正态分布,则采用服从t分布的t统计量进行单样本T检验;否则,采取非参数检验。T检验稳健性(Robust)较好,如果样本分布偏离正态分布不太严重,也可采用T检验。T分布和正态分布比较-4-3-2-10123400.050.10.150.20.250.30.350.4x密度函数值t分布和标准正态分布标准正态t分布:n=3t分布:n=10t分布:n=26在大样本情况下,T分布和正态分布密度函数十分接近在大样本情况下,T检验和U检验是等价的例子打开数据文件brakes.sav,该数据为某工厂不同机器生产的刹车片直径,已知符合质量标准的刹车片直径应为322mm,现在需要知道哪些机器生产的刹车片直径不符合质量标准。按照机器号拆分文件需要对各个机器分别进行检验,因此需要根据机器拆分该数据文件。打开数据文件brakes.sav,选择【数据】→【拆分文件】单样本T检验选择【分析】→【比较均值】→【单样本T检验】单样本T检验结果差分的95%置信区间机器号tdfSig.(双侧)均值差值下限上限1刹车片直径(mm)-.53315.602-.0014858-.007413.0044592刹车片直径(mm)5.33615.000.0142629.008566.0199603刹车片直径(mm)-.65515.522-.0017174-.007302.0038684刹车片直径(mm)-2.61315.020-.0045649-.008289-.0008415刹车片直径(mm)1.84715.085.0042486-.000655.0091526刹车片直径(mm)1.13415.274.0024516-.002154.0070587刹车片直径(mm)2.65015.018.0061813.001210.0111538刹车片直径(mm)-1.71315.107-.0033014-.007409.000806独立样本T检验两独立样本是指两个样本所来自的总体相互独立,两个独立样本各自接受相同的测量,研究者或分析者的主要目的是分析两个独立样本的均值是否有显著的统计差异比较女性和男性的身高,教育从业者和金融从业者的起始工资等,都是两独立样本的例子。两独立样本T检验的前提条件独立性:两样本所来自的总体互相独立。正态性:样本来自的两个总体应服从正态分布。在样本所来自的总体不满足正态性条件时,如果两个样本的分布形状相似,它们的样本量相差不是太大并且样本量较大,仍然可以应用T检验。方差齐性:待比较的两个样本的方差相同。如果两个组的样本量大致相等,略微偏离了方差齐性对检验结果的精度影响不大。在T检验中,SPSS提供了方差齐性的Levene检验,当方差齐性不满足时,会提供方差齐性校正后的T检验结果。案例分析数据文件creditpromo.sav记录了接受不同促销方案的用户信用卡消费数据,现在需要检验新的促销方法是否能促进信用卡的消费,以此决定是否继续推进这种新促销方式。目的是比较采用新促销方法的信用卡消费金额均值和标准促销方法的信用卡消费金额均值,看二者是否在统计上有显著的差异。探索性分析先对两种促销方式的客户消费数据进行描述性统计分析,初步探索两种不同的促销邮件下的客户花费情况。正态性检验设置正态性检验正态性检验表T检验选择【分析】→【比较均值】→【独立样本T检验】配对样本T检验两配对样本T检验用来检验来自两配对总体的均值是否在统计上有显著性差异。常见的配对设计方法有以下几种:同一受试对象处理前后的数据,例如服用某种药物前和服用之后的血压变化;同一受试对象两个部位的数据,同一样本用两种方法测量的数据;配对的两个受试对象分别接受两种处理后的数据。两配对样本T检验的前提条件两样本应是配对的。即受试对象的年龄、性别、体重等非处理因素都相同或相似;两个样本所来自的总体应服从正态分布(大样本情况下,T检验较为稳健)案例分析数据文件dietstudy.sav包含对“Stillmandiet”的研究结果。医生为检验某种饮食方案是否对有家庭心脏病史的病人有效,对16个病人进行了了试验,记录他们在实行饮食方案前后的体重(磅)以及甘油三酸酯的水平(mg/100ml)。采用T检验对该饮食方案的效果进行分析。配对T检验操作选择【分析】→【比较均值】→【配对样本T检验(P)】T检验结果解释配对T检验注意事项需要先检查两个样本是否服从正态分布。应用直方图、Q-Q图或者K-S检验等方法来检验差值变量的正态性。分析变量中是否含有离群值。可以用箱图来检查离群值的情况。可以先计算配对样本的差值变量,然后进行单样本的T检验。动手练习数据文件GSS2004_Mod.sav中记录了男性或者女性每周上网浏览网页的时间(变量,单位小时)和每天观看电视的时间(变量TVHOURS,单位小时)。用本章学习的技巧分析男性和女性在观看电视的时间和上网的时间上分别就什么区别。谢谢!