PartFive均值比较与检验参数检验与非参数检验利用样本数据对总体特征(如均值、方差等)的推断通常在以下两种情况下进行:当总体分布给定(如正态分布)或假定的情况下——参数检验当总体分布未知的情况下——非参数检验对总体特征的推断一般采用参数估计(点估计和区间估计)和假设检验两类方式实现。两个问题:如何计算在假设成立的条件下样本值或更极端的值发生的概率?如何定义小概率事件?PartFive均值比较与检验一、单一样本的T检验1、统计知识回顾(1)假设检验:成立对总体情况的假设,随机抽取样本,以样本的统计量验证假设是否正确。(2)单一样本的T检验是指对均值的假设检验eg总体中人口平均年龄的研究假设H0:μ=50(μ-50=0);H1:μ≠50(μ-50≠0)抽样误差造成:H0原因总体真实情况:μ≠50:H12)检验基本思路直接检验H0,间接检定H12、SPSS中的运用Analysis→CompareMeans→OneSampleTTest判断样本均值和已知/假设的总体均值是否存在差异PartFive均值比较与检验要做检测的变量输入定值作为检验值:设定假设检验条件置信度缺省值处理均值标准差T值自由度假设检验值概率值均值差差值95%的置信区间:128.5452±1.96×20.43580=88.49103~168.5994;88.49-80~168.59-80;8.49~88.59PartFive均值比较与检验二、独立样本的T检验1、检验两个样本的均值是否存在差别2、两组数据间均值的比较3、统计公式①H0:μ1=μ2H1:μ1≠μ2;②统计量22212121nnxxZ22212121nSnSxxPartFive均值比较与检验PartFive均值比较与检验4SPSS中的运用Analysis→CompareMeans→Independent-SamplesTTest指定待检验变量分组变量:将变量分为两组检验指定分组变量定义分组指定2个特定值,系统对只具有这两个值的因变量均值进行比较。以该值为分界点,系统对该值前后的2组数据进行比较置信度缺省值的处理均值标准差1方差齐次性检验方差齐次方差非齐次2T值自由度2双尾检验概率值均值的差值分组变量为定类变量三、配对样本的T检验配对样本t检验与独立样本t检验的差别之一是要求样本是配对的。配对样本可以是个案在“前”“后”两种状态下某属性的两种状态,也可以是对某事物两个不同侧面或方面的描述。其差别在于抽样不是相互独立的,而是相互关联的。配对样本的两个特征:一是样本数相同;二是样本观察值的先后顺序一一对应,不能随意打乱。一般要求样本来自的总体应服从或近似服从正态分布。PartFive均值比较与检验1、通常是同一对象实验前后的对比2、spss中的运用Analysis→CompareMeans→Paired-SamplesTTest选择配对变量,可连续选择多个配对变量配对样本的简单统计均值标准差均值标准误配对样本的相关性相关系数概率值均值之差差值的标准差差值95%的置信区间T值自由度双尾检验概率值课堂练习1抽样调查中,居民年龄(age)分别为20235546303246656879,能否认为总体中居民平均年龄为47岁(写出H1,H0)。2“T检验.sav”中,现在认为近年来国民收入(income)平均为128亿元,正确吗?(写出H1,H0)有两名学生分别认为近年来城乡居民储蓄存款余额(deposit)分别为46.73亿元和8.56亿元,谁的观点正确?(写出H1,H0)3“数据1.sav”中,以性别为分组变量,判断男性和女性在薪水上有无差异。(显著性水平为1%),并分析统计结果。4按要求完成“T检验.doc”中题目。5“数据2.sav”中,判断实验前后各项指标是否存在变化。四、means过程SPSS运算过程Analysis→CompareMeans→Means对不同类别定距变量的分组计算计算两变量间E,r相关系数,F检验PartFive均值比较与检验对不同类别定距变量的分组计算“数据1.sav”,了解不同文化程度的被访者家庭平均人口规模,最大值,最小值,标准差;计算相关系数并检验PartFive均值比较与检验因变量,定距自变量:序,类,距对控制变量的分析E系数,F检验计算r,r2可计算的描述统计量