应用统计学教学北大总复习

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

总复习数据质量评估选择数据分析方法执行描述和统计推断分析写量化研究论文1第一步、数据质量评估样本代表性文本解读•是否概率抽样•研究总体与抽样框•PSU的数量、抽取方法•是否分层,分层指标是否与研究高度相关•调查的回答率•抽样和调查的质量控制计算•标准误(简单随机抽样vs复杂抽样;绝对误差&相对误差)•偏差•覆盖误差•无回答误差2测量质量信度•前测后测法•复本法•折半法•内部一致性法:alpha0.6效度•内容效度•准则效度•结构效度–探索性因子分析–验证性因子分析–因子负载、共同度、因子累计贡献率0.55–组合信度、平均变异萃取量0.5–因素区别力第二步、选择数据分析方法解释性研究多水平模型:自变量不属于同一个测量水平时,使用多水平模型,其中定距定比变量用分层线性回归(HLM)潜变量法:研究潜变量之间的因果关系时,使用该方法。观测变量和潜变量都是定距定比时,使用结构方程模型,定类定序时使用潜在类别分析纵贯数据/历时数据:时间序列分析、事件史分析等横截面数据:方差分析、相关分析、回归分析等3描述性研究类序变量距比变量数据整理因子分析聚类分析无回答插补数据质评信度系数因子分析第二步、选择数据分析方法方差分析因变量为定距定比自变量为定类定序分析的是因变量在自变量的各个类别上是否有均值差异P0.05说明有显著的差异事后比较可以用Scheffe系数注重交互项的作用分为一元单因素、一元多因素和多元方差分析4相关分析P0.05说明有显著的相关趋近1表示高度相关趋近0表示不相关相关系数的选择要恰当相关分析无控制、局限于两个变量之间的关系,无法回答数量上的共变关系回归分析P0.05说明有显著的相关回归分析方法的选择要恰当回归分析有控制、研究多个变量之间的关系,能回答数量上的共变关系能回答自变量与因变量的关系,模型整体解释力第三步、执行描述和推断描述变量为定距定比(散点图、折线图、直方图)集中趋势•均值、中位数、众数离散趋势•方差、标准差、四分互差变量为定类定序(圆瓣图、柱形图、条形图)频数和百分比分布•注意行百分比和列百分比的解读不能计算均值可以计算中位数、众数5第三步、执行描述和推断推断逻辑概率(依据概率来下结论)概率分布(概率从何而来,从概率分布而来)抽样分布(抽样数据,如何得到概率分布,通过抽样分布而来)正态分布(如果获得大多数现象的抽样分布?通过正态分布而来,中心极限定理是桥梁,将大多数现象可用正态分布来表达)标准正态分布(去掉量纲,形成固定的概率分布表)推断方法参数估计•点估计:样本均值、样本比例、样本方差可获得无偏估计•区间估计:在一定置信水平下的参数值的区间范围假设检验•小概率原理6第三步、执行描述和推断相关分析7定类→定类定序→定序定距/比→定距/比ф系数、Q系数Gamma相关系数Pearson相关系数C系数,V系数Kendall’stau-b/tau-c系数Lambda(λ)Somers’d系数Goodman&KruksalTau-ySpearman等级相关系数第三步、执行描述和推断方差分析分析目的:因变量在自变量的不同类别上的均值是否相等种类:一元单因素、一元多因素、多元方差分析如果自变量的统计显著(p0.05),则说明均值有显著的差异一元多因素:饱和模型和非饱和模型交互项的作用更重要,体现了相互控制的结果事后检验:各个类别之间的均值差是否显著,如果显著,均值差是多少,置信区间是多少8第三步、执行描述和推断回归分析9因变量回归方法回归模型自变量-因变量(在95%置信水平下,在控制了其他变量的情况下,)整体评价连续型定距定比OLS回归、稳健回归Y=a+bxx每增加1个单位,y增加b个单位Adj.R2离散型定距定比CountregressionLn(r)=a+bxx每增加1个单位,在一段时间内事件平均发生的次数是原来的exp(b)倍LL0;伪R21卡方检验p0.05二分类定类变量Binarylogisticx每增加1个单位,因变量发生与不发生的概率之比是原来的exp(b)倍多分类定类变量Multi-nominallogisticx每增加1个单位,因变量新的发生比是原来的exp(b)倍,发生比是指选择m类和选择k类的概率之比定序变量ordinallogisticx每增加1个单位,因变量新的发生比是原来的exp(b)倍,发生比是指高于某水平和低于该水平的概率之比bxakypmyp))()(ln(bxamypmyp))()(ln(bxapp)1ln(第四步、写量化研究论文选题要有创新,理论假设要有争论色彩,要可检验要尽到文献综述的义务说明数据来源检验数据质量分析数据结果说明理论假设有概括和归纳不局限于一个模型模型之间要比较有理论意义和现实意义10结束,谢谢!祝各位暑期愉快!11

1 / 11
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功