统计学在社会学中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

统计学在社会学中的应用1YanlongSept.2003统计学在社会学中的应用1950-2000:一个简要的回顾Adrian.E.Raftery12001年2月15日1Adrian.E.Raftery,华盛顿大学统计学和社会学教授,统计学和社会科学研究中心主任。Email:raftery@stat.washington.edu,Web:。作者感谢MarkBecker,MarkHandcock,DonRubin,MichaelSobel,TomSnijders,RobWarren,YuXie以及KazuoYamaguchi给予本文的宝贵评价,这些评价对与本文的改进起到了极大的帮助作用。统计学在社会学中的应用2YanlongSept.2003概要统计学方法在社会学中的运用已经成功地走过了半个世纪,它对提高社会学这门学科的科学研究水平做出了巨大的贡献。根据研究者所使用的数据类型的不同,我将战后统计学方法在社会学中的应用过程分为三个层叠的时期。第一代统计方法起于1940年代晚期,研究者主要运用交互表(cross-tabulations)的方法,同时对关联测量(measuresofassociation)和对数线性模型(log-linearmodels)倾注了许多心血,可以说这是社会学对统计学贡献最大的一个领域。第二代统计方法始现于1960年代,这一时期的研究者主要面对的是个体层次的调查数据,同时他们将注意力集中在具有线性结构关系(LISREL)的因果模型和事件史分析(eventhistoryanalysis)上。第三代统计方法在1980年代晚期就已经初现端倪,研究者所处理的数据已经不能简单地归入上文所述的任何一个范畴。一方面是因为这些数据都具有与众不同的形式,比如文本和口述,另一方面是因为在与空间的和社会网的数据联系时,依赖性已经成为一个至关重要的方面。尽管有许多新的挑战,但用统计学方法研究这一领域的条件已经成熟,最近,几个主要的研究机构已经开始在统计学和社会科学领域展开新的探索。统计学在社会学中的应用3YanlongSept.2003目录1引言.........................................................................................................42第一代统计方法:交互表(Cross-Tabulations).....................................62.1分类数据的分析(CategoricalDataAnalysis)..............................................................................................62.2潜在类别模型(LatentClassModel).............................................................................................................82.3假设检验和模型选择(HypothesisTestingandModelSelection)................................................................83第二代统计方法:个体层次的调查数据(Unit-LevelSurveyData)...93.1对职业地位的测量(MeasuringOccupationalStatus)..................................................................................93.2结构方程模型的诸多应用(TheManyUsesofStructuralEquationModels)............................................103.3事件史分析(EventHistoryAnalysis).........................................................................................................123.4二分因变量(BinaryDependentVariables).................................................................................................133.5其他有限因变量(OtherLimitedDependentVariables).............................................................................143.6多层次模型(MultilevelModels)................................................................................................................153.7缺省数据(MissingData)............................................................................................................................163.8因果关系(Causality)...................................................................................................................................174第三代统计方法:新数据,新挑战,新方法(NewData,NewChallenges,NewMethods)................................................................194.1社会网络和空间数据(SocialNetworksandSpatialData)........................................................................194.2文本和定性数据(TextualandQualitativeData)........................................................................................204.3叙述和序列分析(NarrativeandSequenceAnalysis).................................................................................214.4仿真模型(SimulationModels)...................................................................................................................214.5宏观社会学(Macro-sociology)...................................................................................................................225讨论.......................................................................................................22参考文献..................................................................................................24统计学在社会学中的应用4YanlongSept.20031引言为了纪念千禧年的来临,美国统计学会月刊(JournaloftheAmericanStatisticalAssociation)刊登了一个由大约50篇短文组成的连载,每篇短文都着力概括统计学中的某一领域在即将过去的一个世纪所取得的进展。这一计划的初衷在于将统计学中一些最优秀的成果做一总结,并且突出未来研究中的具有潜力的领域。我写作了有关统计学在社会学中应用的那篇论文(Raftery,2000)。其他几篇相关的论文或许会对那些对社会学方法论感兴趣的读者有帮助,这些文章涵盖了列联表(contingencytable),对数线性模型(Fienberg,2000),因果推理在社会科学中的应用(Sobel,2000),人口学(Xie,2000),政治学方法论(Beck,2000),计量心理学(Browne,2000),经验方法在法律科学中的应用(Eisenberg,2000)等诸多领域。在我这篇论文的初稿问世后,许多同事都对我的文章发表了评论,其中有许多评论正确地指出了我在文章中不慎遗漏的该领域的一些重要发展。然而,由于美国统计学会月刊给我的篇幅有限,我不可能将这些遗漏的部分全部补充进来。幸运的是,社会学方法论(SociologicalMethodology)编辑MichaelSobel和MarkBecker请我撰写一篇在此基础上有所扩展的专题论文,或许这篇论文能够为这一不断发展的研究领域提供一个更为合适的概括。社会学起源于十九世纪中期,孔德(他首先引进了“社会学”一词),马克思,韦伯和涂尔干围绕着工业革命后新出现的社会,写下了一系列具有奠基意义的著作。社会学从一开始就使用了定量的研究方法。孔德,这位学科的奠基人,清晰的意识到这门学科应该以统计数据为基础。而涂尔干的《自杀论》更是成为了广泛运用统计数据的典范。然而,在二战以前,可供研究的数据都显得支离破碎,统计方法也比较简单,仅仅停留在描述性统计的层次上。经过仔细的考证Camic和Wilson(1994)认为,FranklinH.Giddings是美国定量社会学之父。Giddings于1894年在哥伦比亚获得社会学教授职务,1931年逝世,他将社会学界定为研究集体层面社会现象的一门学科。他认为在很大程度上社会学中的统计分析是将诸多的个体分成不同的类别,同时发现每一类别的平均特征。从现代统计学角度来看,缺乏对变化的考察是他著作的一个最为显著的特征。从那以后,研究用的数据变得越来越复杂,同时统计方法也在不断发展,以适应数据分析的需要。这时期的统计学方法的发展,有许多是要归因于社会学家而非统计学家的努力。Clogg(1992)以及他文章的评论者们有力的论证并且记述了这一点。这种情况部分反映了一个事实,即致力于研究社会学问题的统计学家的数量相对较少。更多的统计学家倾向于关注药物学,工程技术以及生物科学方面的问题。这或许反映了在二十世纪后半期不同学科间研究资金分布的不平衡状况。然而,最近有迹象表明这一情况正在发生变化,我将在本文的结尾论述这个问题。在过去的五十年中,社会学总的趋势是向更为严格、清晰的假设;更大更详细的数据集合发展;为了拟合数据,统计模型变得越来越复杂;主要社会学期刊所发表文献的统计分析水平也在不断提高。统计方法在社会学领域成功地走过了半个世纪,使得该学科研究的科学水平有了极大的提高。社会学中广泛的使用了各种各样的统计学方法和统计模型。在这里,我将集中考

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功