中图分类号:学校代码:10055UDC:密级:公开硕士专业学位论文Lasso在广义线性模型中的应用——基于Logistic回归方法的财务预警模型TheapplicationforLassoinGeneralizedLinearModels:Thefinancialearly-warningmodelbasedonLogisticRegression论文作者尹卓菲指导教师刘民千教授申请学位应用统计硕士培养单位数学科学学院学科专业应用统计研究方向试验设计与数据分析答辩委员会主席王兆军评阅人杜洪策杨建峰南开大学研究生院二○一五年四月南开大学学位论文原创性声明本人郑重声明:所呈交的学位论文,是本人在导师指导下进行研究工作所取得的研究成果。除文中已经注明引用的内容外,本学位论文的研究成果不包含任何他人创作的、已公开发表或者没有公开发表的作品的内容。对本论文所涉及的研究工作做出贡献的其他个人和集体,均已在文中以明确方式标明。本学位论文原创性声明的法律责任由本人承担。学位论文作者签名:年月日非公开学位论文标注说明(本页表中填写内容须打印)根据南开大学有关规定,非公开学位论文须经指导教师同意、作者本人申请和相关部门批准方能标注。未经批准的均为公开学位论文,公开学位论文本说明为空白。论文题目申请密级□限制(≤2年)□秘密(≤10年)□机密(≤20年)保密期限20年月日至20年月日审批表编号批准日期20年月日南开大学学位评定委员会办公室盖章(有效)注:限制★2年(可少于2年);秘密★10年(可少于10年);机密★20年(可少于20年)南开大学学位论文使用授权书本人完全了解《南开大学关于研究生学位论文收藏和利用管理办法》关于南开大学(简称“学校”)研究生学位论文收藏和利用的管理规定,同意向南开大学提交本人的学位论文电子版及相应的纸质本,并委托印刷存档论文。本人了解南开大学拥有在《中华人民共和国著作权法》规定范围内的学位论文使用权,同意在以下几方面向学校授权。即:1.学校将学位论文编入《南开大学博硕士学位论文全文数据库》,并作为资料在学校图书馆等场所提供阅览,在校园网上提供论文目录检索、文摘以及论文全文浏览、下载等信息服务;2.学校可以采用影印、缩印或其他复制手段保存学位论文;学校根据规定向教育部指定的收藏和存档单位提交学位论文;3.非公开学位论文在解密后的使用权同公开论文。4.同意学校将本人向有关电子出版单位授权的学位论文(含电子版和授权书)转交相关授权单位。本人承诺:本人的学位论文是在南开大学学习期间创作完成的作品,并已通过论文答辩;提交的学位论文电子版与纸质本论文的内容一致,如因不同造成不良后果由本人自负。本人签署本授权书一份,交图书馆留存。学位论文作者暨授权人(亲笔)签字:20年月日南开大学研究生学位论文作者信息论文题目Lasso在广义线性模型中的应用——基于Logistic回归方法的财务预警模型姓名尹卓菲学号2120120090答辩日期2015年5月19日论文类别博士□学历硕士□专业学位硕士√同等学力硕士□划√选择学院(单位)数学科学学院学科/专业(专业学位)名称应用统计联系电话13821466767电子邮箱m13821466767@163.com通信地址(邮编):天津市南开区卫津路94号300071非公开论文编号备注注:本授权书适用我校授予的所有博士、硕士的学位论文。由作者填写一份并签字后交校图书馆,如已批准为非公开学位论文,须附批准通过的《南开大学研究生申请非公开学位论文审批表》和“非公开学位论文标注说明”页。摘要Ⅰ摘要随着经济全球化进程加速,企业面临的竞争环境和竞争内容都发生了很大变化。现如今我国企业面临着来自各方的压力和各种风险,由于经营管理不善导致企业破产的例子屡见不鲜。财务预警系统的构建可以有效地预防企业财务危机的发生。本文运用一种变量选择的方法Lasso,根据Logistic回归模型构建了一种财务预警系统。文章主要分为三个部分,重点是第三部分的财务预警模型的构建,前两部分是第三部分的理论基础。第一部分介绍了Lasso的思想、Lasso估计和惩罚项的参数估计。第二部分介绍了广义线性模型的概念和性质,以及Lasso如何运用在广义线性模型中。最后是模型的构建部分。首先对比分析了线性概率模型与Logistic回归模型,说明了Logistic回归模型对于财务预警系统模型的适用性,然后分别利用企业被特殊处理前一年和前两年的财务数据构建模型,模型的预测效果可以证明,利用企业特殊处理前两年的数据构建模型更科学。最后,对比Lasso惩罚和elasticnet惩罚构建的Logistic回归模型可以看出,虽然理论上elasticnet更适用于本文的情形,但两种模型对企业破产概率的预测结果表明,Lasso约束下的Logistic回归模型更适用于构建财务预警系统。关键词:Lasso;elasticnet;广义线性模型;Logistic回归;财务预警模型AbstractⅡAbstractNowadays,thecompaniesmustmanagetosurviveintheincreasinglyseveresituationsandtaketheriskofbankruptcy.Anincreasingnumberofcompaniesgobankruptduetothebadmanagementandthusitisextremelynecessarytoconstructafinancialdistressearly-warningsystemtohelpthemanagersavoidthefinancialdistressorevenbankruptcy.ByusingamethodcalledLassowhichcanmakethevariableselection,thispaperconstructsafinancialdistressearly-warningsystembasedonLogisticregression.Sothepaperconsistsofthreeparts,wherethemainresultisgiveninthethirdpart–theconstructionofthefinancialdistressearly-warningmodelandthefirsttwopartsprovidethetheoreticalbasisforthethirdpart.Inthefirstpart,themainideaofaverypopularvariableselectionmethodcalledtheleastabsoluteshrinkageandselectionoperator(Lasso),isintroduced.Inthesecondpart,thedefinitionsandpropertiesofthegeneralizedlinearmodels(GLM)includingthelogisticmodel,aswellastheapplicationoftheLassointheGLMarediscussed.Inthethirdpart,first,thecomparisonofthelinearregressionmodelsandthelogisticmodelsisprovidedandtheapplicabilityofthelogisticmodelintheearly-warningsystemisillustrated.Then,basedonthefinancialdataofoneyearandtwoyearsbeforespecialtreat,theLogisticmodelisconstructedusingtheLasso.Thepredictionresultsprovidethatthemodelwhichisconductedbydataoftwoyearsbeforespecialtreatismorereasonable.ComparingtheLogisticregressionmodelsbasedonthelassopenaltyandtheelasticnetpenalty,thoughtheelasticnetpenaltyismoresuitableforthiscaseintheory,thepredictionresultsfortheruinprobabilitiesofthesetwomodesshowthattheLogisticregressionmodelbasedonLassopenaltyismoresuitableforthefinancialdistressearly-warningmodel.KeyWords:Lasso;elasticnet;generalizedlinearmodels;logisticregression;thefinancialdistressearly-warningmodel目录Ⅲ目录第一章引言..............................................1第一节研究背景......................................................................................................1第二节本文结构......................................................................................................2第二章Lasso及其相关方法................................4第一节文献综述......................................................................................................4第二节Lasso的定义...............................................................................................5第三节Lasso及其相关方法....................................................................................62.3.1正交设计情形的Lasso估计.........................................................................................62.3.2估计误差和参数t的估计..............................................................................................72.3.3elasticnet方法................................................................................................................8第四节Lasso的求解...............................................................................................92.4.1Lasso算法................................................................................................................