实证研究入门与SPSS操作讲座人:常州工学院金中坤E-mail:jinzk@czu.cn明确研究的问题?什么因素会影响居民消费信心?性别年龄学历收入发展预期居民消费信心承担债务……?提出研究假设城市验证研究假设1.构建检验模型简单线性关系Y=ax+bU形关系Y=ax2+bx+c(学历与信心)学历信心Index=β0+β1city+β2Sex+β3Age+β4Edu+β5Income+β6loan+β7expect+εiY=ax+b要证明Y与X有关,只需证明a≠0即可,那么只要找到(x1,y1),(x2,y2)两点,求出a,b即可。同理,要证明自变量与因变量有关系,需要证明β1、β2、β3、β4、β5、β6、β7、≠0,如果不能证明其中某个值≠0,则不能确定这个自变量和因变量之间存在确定的关系。这个模型的系数,需要跟多的样本统计值。如何收集样本统计值—问卷1.定量数据—直接记录2.定性数据(1)内部存在逻辑关系的定性数据,利用里克特量表。如学历、满意度。(2)内部不存在逻辑关系的定性数据。采用1、0哑变量.如性别。(3)不能直接观察的记录的变量,设计问题来衡量。如发展预期。里克特量表发展预期E1.那么与现在相比,一年以后您的家庭经济状况将会如何变化?E2.那么与现在相比,您认为一年以后本地区的经济发展状况将会如何?E3.那么您认为一年之后本地区的就业状况将会如何变化?E4.那么与现在相比,您认为五年之后,本地区的经济将会出现怎样的变化?E5.对于大宗耐用消费品的购买,如家用电器,家用电脑,以及高档家具之类的,您认为当前是购买的好时机吗?测项变量:一个新问题,设计的问题是否合适,能准确反映我想测量的变量?问卷的信度与效度检验。信度检验一、概念所谓信度是衡量没有误差的程度,也是测验结果的一致性(consistency)程度,信度是以衡量的变异理论为基础。二、衡量误差的意义与来源衡量误差可分为系统性误差及随机性误差。一般而言,大部份的误差是系统性的(从偏差而来)。而随机性误差(randomerror)的原因可能来自情境因素,或者被受测者一时的情绪而影响。衡量误差可能的来源如下:1.由回应者(respondent)产生的误差(倾向性)2.由情境因素产生的误差(阴天)3.由衡量者产生的误差(你加一个鸡蛋还是两个鸡蛋)4.由衡量工具产生的误差(尺子本身不准)三、衡量信度的方法1.再测信度(test-retestmethod):再测信度是让同一组受测者,在前后两个时间内测验两次,以其两次测验的结果求其相关系数,而此系数称为再测信度(test-retestreliability)。第一次测试第二次测试一周后2.折半信度(split-halfmethod):折半信度是将受测题目分成两半,然后再以前半段之题目与后半段之题目做相关,若相关程度很高就代表折半信度很高,是考验衡量的同构型。E1.那么与现在相比,一年以后您的家庭经济状况将会如何变化?E2.那么与现在相比,您认为一年以后本地区的经济发展状况将会如何?E3.那么您认为一年之后本地区的就业状况将会如何变化?E4.那么与现在相比,您认为五年之后,本地区的经济将会出现怎样的变化?3.复本信度(equivalent-formsmethod):为了让不同程度的受测者能够明确了解问卷题目的意思,有时候同一个测验中有甲、乙卷两种以上的复本,由一组受试者先用甲卷进行测试,同组人或另外一个人再用乙卷进行测试,用这两种测验的结果求其相关系数即为复本信度。(高考备用卷)4.库李信度(Kuder-Richardsonreliability)目的在于分析问项间的一致性。E1.那么与现在相比,一年以后您的家庭经济状况将会如何变化?E2.那么与现在相比,您认为一年以后本地区的经济发展状况将会如何?E3.那么您认为一年之后本地区的就业状况将会如何变化?E4.那么与现在相比,您认为五年之后,本地区的经济将会出现怎样的变化?E5.对于大宗耐用消费品的购买,如家用电器,家用电脑,以及高档家具之类的,您认为当前是购买的好时机吗?L.J.Cronbach另创α系数,其公式如下:其中,:为估计的信度:测验的总题数:测验的总变异数:题目与另一题目之共变数ijiiSSSkk2122K2iSijSSPSS的实现–1.點選Analyze/scale/reliabilityanalysis–2.程式操作–3.分析結果分析結果α系数=0.855,代表三道题目测量结果之内部一致性具高可信度。若是想要再提高信度,可由”CorrectedItem-Totalcorrelation”及”CronbachAlphaifitemDeleted”两栏数字来判断删除那些题目可提高内部一致性。效度检验一、效度的意义所谓效度是指衡量的工具是否能真正衡量到研究者想要衡量的问题。(测量到的是不是想要测量的东西,不要测偏了)二、效度的种类1.内容效度(contentvalidity):以研究者的专业知识来主观判断所选择的尺度是否能正确的衡量研究所欲衡量的东西。2.效标关联效度(criterion-relatedvalidity):所谓效标关联效度是指使用中的衡量工具和其它的衡量工具来比较两者是否具有关联性。3.建构效度(constructvalidity):建构效度(或称构念效度)指问卷或量表能测量到理论上的构念之程度。建构效度有两类:收敛效度与区别效度。而检测量表是否具备建构效度,最常使用之方法为因素分析法。同一因素构面中,若各题目之因子载荷(factorloading)愈大(一般以大于0.5为准),则愈具备「收敛效度」。若问卷题目在非所属因素构面中,其因素因子载荷(一般以低于0.5为准),则愈具备「区别效度」。构念问卷因子载荷=重叠部分/构念Spss的实现–1.點選Analyze/DataReduction/Factor–2.程式操作–3.分析結果KMO=0.630,(Sig=0.0000.05),代表数据适合进行因素分析。承担债务发展预期删除E5承担债务发展预期一、信度和效度的关系情况一,弹痕分散于靶内各处,并无一致性可言,以衡量的术语来说即是无信度无效度。情况二,虽然弹痕很集中,即具有一致性,但是并没有在靶中心,以衡量的观点来看,则是有信度无效度。情况三,才是好的衡量,同时具有效度及信度。相关分析(描述两变量关系的量数)为什么要做相关性分析?1.初步了解变量之间的关系.2.防止回归过程中出现多重共线性。什么是多重共线性?Y=a+bX1Y=c+dX2X2=ex1+fY=a+bX1+cX2变量之间相关的密切程度可以用相关系数r来表示,其取值范围为[-1,+1],绝对值r越接近1表明相关密切程度越高,或者说一变量受另一变量的影响程度越高。可见具有函数关系的两变量,其相关系数一定为+1或-1。正相关:方向一致,如学历与收入成正相关。负相关:方向相反,如收入与债务。零相关:不存在线性相关,如城市与学历。图7-4相关系数示意图散点呈椭圆形分布,X、Y同时增减---正相关(positivecorrelation);X、Y此增彼减---负相关(negativecorrelation)。散点在一条直线上,X、Y变化趋势相同----完全正相关;反向变化----完全负相关。X、Y变化互不影响----零相关(zerocorrelation)零相关Spss的实现(1)菜单选择:Analyze/Correlate/Bivariate偏相关控制某一个变量,研究另外两个变量之间的相关关系。比如,在收入相等的情况下,年龄和消费信心指数之间是否具有关系。Spss的实现(1)菜单选择:Analyze/Correlate/partial伪相关年龄时间20032004200520062007200820092010女儿7891011121314父亲3334353737383940