银行信贷问题数学建模优秀论文

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2015高教社杯全国大学生数学建模竞赛承诺书我们仔细阅读了中国大学生数学建模竞赛的竞赛规则.我们完全明白,在竞赛开始后参赛队员不能以任何方式(包括电话、电子邮件、网上咨询等)与队外的任何人(包括指导教师)研究、讨论与赛题有关的问题。我们知道,抄袭别人的成果是违反竞赛规则的,如果引用别人的成果或其他公开的资料(包括网上查到的资料),必须按照规定的参考文献的表述方式在正文引用处和参考文献中明确列出。我们郑重承诺,严格遵守竞赛规则,以保证竞赛的公正、公平性。如有违反竞赛规则的行为,我们将受到严肃处理。我们授权全国大学生数学建模竞赛组委会,可将我们的论文以任何形式进行公开展示(包括进行网上公示,在书籍、期刊和其他媒体进行正式或非正式发表等)。我们参赛选择的题号是(从A/B/C/D中选择一项填写):B我们的参赛报名号为(如果赛区设置报名号的话):3所属学校(请填写完整的全名):延安大学西安创新学院参赛队员(打印并签名):1.2.3.指导教师或指导教师组负责人(打印并签名):日期:2015年8月4日赛区评阅编号(由赛区组委会评阅前进行编号):2015高教社杯全国大学生数学建模竞赛编号专用页赛区评阅编号(由赛区组委会评阅前进行编号):赛区评阅记录(可供赛区评阅时使用):评阅人评分备注全国统一编号(由赛区组委会送交全国前编号):全国评阅编号(由全国组委会评阅前进行编号):银行信贷业务问题摘要银行信贷业务是银行最基本、最重要的资产业务,通过发放银行贷款收回本金和利息,扣除成本后获得利润。银行为了获得更大的利润,对每一位顾客的信息进行分类,然后对不同的顾客采用不同的方案。针对问题一本文应用SPSS软件对附件bank1中的部分数据进行二元Logistic回归分析。建立Logistic回归方程,并将数据带入计算出比值odds,当比值0.05odds时,此客户有贷款;当比值0.05odds时,此客户无贷款。针对问题二本文应用SPSS软件构造决策树模型对有贷款和无贷款的模型进行细分,只选取题中所给数据bank1中贷款、工作、婚姻状况、年平均余额等数据,把有无贷款定义为因变量,贷款、工作、婚姻状况、年平均余额定义为自变量,画出决策树。把决策树的每一个分支作为一个分类,由此本文把有贷款的和无贷款的各分为五类。针对问题三本文将其分为两个小问题来解决,(1)任意给出一个客户信息通过问题一所建立的模型判断此客户是否可能购买贷款产品,当0.05odds时,客户有贷款,可能购买贷款产品;当0.05odds时,客户无贷款,不可能购买贷款产品。(2)根据问题二构造的决策树模型,判断出此客户应该购买相应的贷款产品。关键词:Logistic回归分析决策树比值判别法1一、问题的重述银行信贷业务是银行最基本、最重要的资产业务,通过发放银行贷款收回本金和利息,扣除成本后获得利润。一般来说,银行信贷业务是银行赢利的重要手段,所以很多银行都推出了很多新的业务来满足更多人士的贷款需求。从银行信贷业务的分类来说,可以分为法人信贷业务、个人信贷业务。其中法人信贷业务包括项目贷款、流动资金贷款、小企业贷款、房地产企业贷款等;个人信贷业务包括个人住房贷款、个人消费贷款、个人经营贷款等。银行信贷业务同时也是风险性较大的一种业务。按照贷款期限来说,银行信贷业务分为短期贷款,即一年以内;中期贷款,即一年以上五年以下;长期贷款,五年以上等三种类型。按保障条件来分,银行信贷业务可以分为信用贷款、担保贷款和票据贴现等三个类别。某银行为了对客户提供更好的信贷服务,对信用卡客户进行了详细的分析和调查。调查主题是对某种家庭和个人背景的用户成为银行信贷的潜在客户的可能性进行分析与判断。问题一:建立能够描述有贷款和无贷款的客户的基本背景数据模型;问题二:对有贷款和无贷款的客户群进行细分建模;问题三:给定一个客户的背景,判断其是否可能购买贷款产品,如果可能的话建议其购买哪种贷款产品。二、问题的分析2.1问题一的分析问题一要求我们建立能够描述有贷款和无贷款的基本背景的数据模型,本文首先将bank1中的数据进行处理(数据见附录一),然后把数据导入SPSS中进行二元Logistic回归分析。假设是否贷款只与age、工作、婚姻状况、受教育程度、是否有房贷有关。回归分析时因变量为是否贷款,协变量为age、工作、婚姻状况、教育程度、是否有房贷,并且设置进入概率为N=0.05,分类标准值为0.5,分析贷款与自变量之间的关系,建立Logistic回归模型,从而描述客户的背景。2.2问题二的分析问题二要求我们对有贷款和无贷款的客户群进行细分建模。首先在题中所给数据bank1表格中选取贷款、工作、婚姻、年平均余额的数据,并将这些数据导入SPSS软件中,构建决策树模型。2.3问题三的分析问题三要求我们给定一个客户的背景,判断其是否可能购买贷款产品,如果可能的话建议其购买哪种贷款产品,在这一问中我们把它分为两小问来处理。(1)给定一个客户的信息判断其是否可能购买贷款产品,然后把个人信息代入到问题一所建立的模型中,得出他是否会购买贷款产品。(2)首先我们把问题二中得到的有贷款的客户细分类进行贷款产品配对,然后把客户信息代入问题二的模型中,看出应该给他推荐哪一类贷款产品。三、模型假设与符号说明3.1模型假设1.假设有无贷款只与age、工作、婚姻状况、教育程度、是否有房贷有关,与其他因素无关。22.假设客户购买贷款产品只与家庭背景有关。3.2符号说明符号符号含义ˆP预测概率odds比值x工作a婚姻状况b教育程度c有无住房贷款id工作所对应的系数kf教育程度所对应的系数je婚姻状况所对应的系数lm有无住房所对应的系数四、模型的建立与求解4.1问题一的分析与处理问题一要求我们建立能够描述有贷款和无贷款的基本背景的数据模型,本文首先将bank1中的数据进行处理(见附录一),然后把数据导入SPSS中进行二元Logistic回归分析[1-2]。假设是否贷款只与age、工作、婚姻状况、受教育程度、是否有房贷有关。回归分析时因变量为是否贷款,协变量为age、工作、婚姻状况、教育程度、是否有房贷,并且设置进入概率为0.05N,分类标准值为0.5,分析贷款与自变量之间的关系,从而描述客户的背景。以下是利用SPSS软件进行Logistic回归分析得:表1案例处理汇总未加权的案例aN百分比选定案例包括在分析中4521100.0缺失案例0.0总计4521100.0未选定的案例0.0总计4521100.03表1给出了案例处理汇总摘要。从该表可以得到参与回归分析的样本数据共有4521个,没有缺失案例,参与率为100%。表2因变量编码初始值内部值No0Yes1表2给出了因变量在迭代运算中的编码表,从该表可以看出无贷款的编码0,有贷款的编码是1。表3分类表a,b已观测已预测贷款百分比校正noyes步骤0贷款no38300100.0yes6910.0总计百分比84.7a.模型中包括常量。b.切割值为.500表3给出了模型中只有常数项而无自变量时,正常预测的百分率为84.7%。也就是说,原数据的4521个观察个体中,无贷款的有3830人,有贷款的有691人,如果每一个个体均分布到无贷款中,则可以的到正确预测百分率为84.7%。表4方程中的变量BS.E,WalsdfSig.Exp(B)步骤0常量-1.712.0411716.6961.000.180表4给出了模型中只有常数项而无自变量时的回归参数及其检验结果。这里6914521ˆlogln1.71269114521BitP,..SE为参数的渐进标准误,Sig为Wald卡方值在自由度为1时对应的检验P值。4表5未在方程中的变量得分dfSig.步骤0变量age.5721.449工作47.19111.000工作(1)2.6751.102工作(2)1.1991.273工作(3).3521.553工作(4)4.7381.030工作(5)8.0131.005工作(6)1.3441.246工作(7).1811.670工作(8).0321.859工作(9)11.2101.001工作(10)2.1501.143工作(11)5.8161.016婚姻10.8802.004婚姻(1)4.7081.030婚姻(2)10.6331.001教育39.7983.000教育(1)1.2421.265教育(2)8.5291.003教育(3)27.6041.000住房housing(1)1.5391.215总统计量83.01718.000表5为单变量分析结果。在将每个变量放入模型之前,采用得分检验方法,检验某一自变量与应变量之间有无联系。由表可看出219.451Score,自由度5df,相应的P值为0.002。又因为检验标准为0.05,说明模型全局性检验有统计学意义。表6Hosmer和Lemeshow检验的随机性表贷款=no贷款=yes总计已观测期望值已观测期望值步骤11428428.8292625.1714542413404.8214250.1794553392396.9726257.0284544386389.3506561.6504515391385.2346166.7664526381379.7777172.22345257373372.1477777.8534508360366.3019184.6994519349361.15410390.84645210357345.41593104.585450表7分类表a已观测已预测贷款百分比校正noyes步骤1贷款no38300100.0yes6910.0总计百分比84.7a.切割值为.500表8方程中的变量BS.E,WalsdfSig.Exp(B)EXP(B)的95%C.I.下限上限步骤1aage-.008.0052.4311.119.992.9821.002工作27.84111.003工作(1)-.038.245.0241.876.963.5951.557工作(2)-.210.228.8461.358.811.5191.267工作(3)-.123.227.2971.586.884.5671.378工作(4)-.033.229.0201.886.968.6181.515工作(5)-.327.363.8121.368.721.3541.469工作(6).541.2713.9981.0461.7181.0112.920工作(7)-.606.3572.8831.090.545.2711.098工作(8)-.093.295.1001.752.911.5111.625工作(9)-1.6011.0402.3701.124.202.0261.548工作(10).078.238.1081.7431.081.6791.7226续BS.E,WalsdfSig.Exp(B)EXP(B)的95%C.I.下限上限步骤1a工作(11)-2.6471.0316.58410.010.0710.0090.535婚姻9.03720.011婚姻(1)-0.4010.1556.66610.010.670.4940.908婚姻(2)-0.0930.1290.51810.4720.9110.7081.173教育23.57430教育(1)-0.3040.1374.92210.0270.7380.5640.965教育(2)-0.3160.1286.08710.0140.7290.5680.937教育(3)-1.5980.39316.531100.2020.0940.437房贷(1)0.0550.0890.38110.5371.0570.8871.259常量-0.9860.3289.04110.0030.373a.在步骤1中输入的变量:age,工作,婚姻,教育,房贷.由表8可建立Logistic预测概率模型,其中1x、2x、3x11x、12x分别表示12种工作,失业、管理人员、蓝领、自由职业者、技术员、企业家、服务、行政管理、学生、女仆、退休、未知的,1a、2a、3a分别表示结婚、单身、离婚,1b、2b、3b、4b分别表示

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功