部分协变量缺失下的线性回归分析及其应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

毕业论文题目部分协变量缺失下的线性回归分析及其应用学院基础科学学院专业班级110802学号20112994姓名吴佳桐指导教师袁晓惠二〇一五年六月四日I中文摘要在目前的各个领域的研究调查中,由于受到各种已知或者未知因素的影响,经常会导致缺失数据出现的情况。而由于缺失数据的存在,不但会增加研究者分析数据的难度,而且会造成分析结果的偏差,从而降低研究者统计计算工作的效率。因此考虑如何消除或者尽可能的减少这些缺失数据的影响就变的越来越重要了。文章首先介绍了回归模型及其基本概念并介绍了使用方法;然后介绍了国内外对缺失数据的研究现状,并简单介绍了数据缺失机制的三种形式,指出解决数据缺失的一般性方法。并在接下来的文章中介绍了在协变量缺失下的线性回归模型,最后是利用R程序对数据进行实证分析。为了有效地解决缺失数据带来的问题,本文使用了其中三种方法对缺失数据集做了相应的处理。首先使用的是剔除法即将含有缺失数据列直接删除;第二种方法是对数据集做逆概率加权;第三种方法是使用回归补值法,对缺失数据集进行填补,从而形成一个完整的数据集,然后对填补后的数据集进行相应的统计分析。本文研究的重点是部分析变量缺失下的回归分析,对不同的样本量做数值模拟,研究在两种缺失程度的数据(15%、30%的随机缺失)通过对比,针对本文的数据研究发现逆概率加权法更好。关键词线性回归缺失值缺失机制填补方法IITitleLinearregressionanalysiswithmissingcovariatesanditsapplicationAbstractInthepresentinvestigationofvariousfields,becauseoftheinfluenceofvariousknownorunknownfactors,itoftenleadstothemissingdata.Becauseoftheexistenceofmissingdata,itnotonlyincreasesthedifficultyoftheresearcherstoanalyzethedata,butalsocanleadtothedeviationoftheresultsoftheanalysis,whichcanreducetheefficiencyofthestudy.Soitbecomesmoreandmoreimportanttoconsiderhowtoeliminateorminimizetheimpactofthesemissingdata.Atfirst,thepaperintroducestheregressionmodelandthebasicconceptanddescribesthemethodologyused;thenintroducestheresearchstatusathomeandabroadforthemissingdata,andintroducesthreeformsofthemissingdatamechanism,itispointedoutthattosolvethegeneralmethodsofmissingdata.Inthenextarticle,thelinearregressionmodelisintroduced,andthedataisanalyzedbyRprogram.Inordertosolvetheproblemcausedbythemissingdata,threemethodsareusedtodealwiththemissingdatasets.Thefirstuseofeliminationwillcontainmissingdatadirectlytoacolumnremoved;thesecondmethodistodatasetstodotheinverseprobabilityweighted;thethirdmethodisusingregressionimputationmethod,tofillthemissingdataset,soastoformacompletedataset,andthenthecorrespondingstatisticalanalysistofillthedataset.Thefocusofthispaperisanalysisofmissingvariablesregressionanalysis,tothedifferentamountofsamplenumericalsimulationstudyintwolevelsofmissingdata(15%,30%ofthemissingatrandom)bycontrast,accordingtothedataofthestudyfoundinverseprobabilityweightingmethodisbetter.KeywordsLinearregressionMissingvalueMissingmechanismImputationmethodIII目录1绪论...............................................................................................................................................11.1回归分析的发展历程.........................................................................................................11.2多元线性回归模型的一般形式.........................................................................................11.3多元线性回归模型的基本假定.........................................................................................21.4回归参数的估计的主要方法.............................................................................................31.5回归分析研究的主要内容.................................................................................................42缺失数据的介绍...........................................................................................................................52.1研究缺失数据的背景和意义.............................................................................................52.2国内外研究情况.................................................................................................................52.2.1国外研究情况..........................................................................................................52.2.2国内研究背景概况..................................................................................................62.3缺失的原因.........................................................................................................................62.4缺失机制.............................................................................................................................72.4.1完全随机缺失..........................................................................................................72.4.2随机缺失..................................................................................................................82.4.3完全非随机缺失......................................................................................................82.5缺失数据的处理方法.........................................................................................................92.5.1剔除数据法...............................................................................................................92.5.2回归填补法...............................................................................................................92.5.3IPW逆概率加权法..................................................................................................93协变量缺失下的回归分析.........................................................................................................113.1协变量缺失下的回归分析的介绍...................................................................................113.2协变量缺失下的估计方程...............................................................................................113.2.1估计方程的介绍....................................................................................................113.2.2完整案例分析和相关偏差...................

1 / 34
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功