决策论论文摘要:决策论是根据信息和评价准则,用数量方法寻找或选取最优决策方案的科学,是运筹学的一个分支和决策分析的理论基础。在实际生活中对同一个问题所面临的几种自然情况或状态,又有几种可选方案,就构成一个决策,而决策者为对付这些情况所取的对策方案就组成决策方案或策略。决策论是在概率论的基础上发展起来的。随着概率论的发展,早在1763年贝叶斯决策论相关书籍斯发表条件概率定理时起,统计判定理论就已发萌芽。统计判定理论实际上是在风险情况下的决策理论。这些理论和对策理论概念上的结合发展成为现代的决策论。决策论在包括安全生产在内的许多领域都有着重要应用。Abstract:thedecisiontheoryisbasedoninformationandevaluationcriteria,withquantitativemethodsforselectingthebestdecisionscience,operationalresearchisabranchofdecisionanalysisandtheoreticalbasis.Inreallifetothesamequestionfacingseveralnaturalconditionorstate,andthereareseveraloptionalscheme,makeadecision,anddecisionmakerstodealwiththesesituationsfortheschemeandcountermeasuresofdecisionschemeorstrategy.Decisiontheoryinprobabilitytheoryisdevelopedonthebasisof.Withthedevelopmentofthetheoryofprobability,asearlyasin1763bayesiandecisiontheory,therelevantbookspublishedconditionalprobabilitytheoremtimewhenthestatisticaldecisiontheoryhashairbud.Statisticaldecisiontheoryisactuallyinthedecisionunderrisktheory.Thesetheoriesandcountermeasuretheoryandconceptualcombinedwithdevelopedintomoderndecisiontheory.Decisiontheoryinsafetyproduction,includingmanyareasofallhastheimportantapplication.关键字:粗钢GDP决策论粗钢产量预测一元线性回归Keyword:crudesteelGDPdecisiontheorycrudesteelproductionforecastalinearregression引言21世纪中国经济快速发展而同时去年从财经频道了解到2008年金融危机后,中国的钢材市场由之前的过热导致钢材产量过剩。在快速发展的中国金融危机之前钢材没有出现过剩而金融危机到来伴随着钢材的产能过剩。让人产生想法钢材的产量与GDP之间存在的关系来预测国内市场,对钢材的产量需求预测决定生产粗钢的产量而不至于导致严重的产能过剩。而是从国家统计局近几年的统计年鉴中找出钢材以及GDP相关的产量数据。看到中国经济快速发展,同时也中国的粗钢产量也以非常快的速度增加。粗钢与GDP之间是存在怎样的关系,是否可以做线性模型做预测。如果存在线性关系那么从回归模型中的预测以及国家GDP相关数据指导中国下一阶段的粗钢生产。一:线性回归模型概述(做预测的原理基础)对于我们所关心的因变量Y而言,如果我们猜测解释变量X是对其惟一存在系统性影响的因素,或二者之间存在均衡关系,而且这种影响或均衡关系是线性的,则一元线性总体回归模型可设定为如下的形式:uXY10(1)其中,0和1分别为一常系数,u为一随机变量,并至少应满足0)(XuE。在上述设定下,显然有:XXYE10)((2)(2)被称为总体回归方程。假定我们找到了一种估计方法,利用样本数据,我们对模型(1)参数0和1给出的估计量为0ˆ和1ˆ。显然,0和1不能通过简单地将niXYii,,2,1:),(代入(1)而解出。但与(1)相对应,我们可以建立相应的样本回归模型:niuXYiii,,2,1ˆˆˆ10(3)其中,0ˆ和1ˆ是根据样本数据求出的对0和1的估计值,而iuˆ则称为样本回归模型的残差或剩余,它可以被理解为利用样本数据对iu的可能取值的一种估计。需要特别指出的是,相对于给定的样本数据,(3)是一个确定性方程,而相对于给定容量的样本,(3)则是一个随机性方程。与(3)所对应的样本回归方程被定义为:niXYii,,2,1ˆˆˆ10(4)显然应该有:iiiYYuˆˆ(5)现在,我们需要在(3)设定的基础上,寻找到一种估计方法,得出关于0和1的一种合理、有效的估计公式。普通最小二乘估计方法是最基础的参数估计方法。普通最小二乘估计方法的基本思路是:对于一个给定的样本,,ˆ01的选定值应使得确定的样本回归方程对样本数据拟合得最好。如何确立具体的拟合标准呢?对容量为n的样本,普通最小二乘估计法给出的拟合最好的标准是:niiuQ12minˆ(6)在一元情形中,(1)意味着:niiiniiiXYYYQ121012min)ˆˆ()ˆ((7)显然,对于给定的样本数据而言,)ˆ,ˆ(10fQ,即0ˆ和1ˆ的选定值不同,Q的取值也不同,它是0ˆ和1ˆ的一个二元二次函数。0ˆ和1ˆ选值使(1)中的残差平方和最小,根据微积分学中的极值原理,(6)存在最小值,其充分必要条件是:0ˆ2)ˆˆ(2ˆ0ˆ2)ˆˆ(2ˆ102101iiiiiiiiuXXXYQuXYQ(8)由(8)得正规方程组:iiiiiiYXXXYXn22121ˆ)(ˆ)(ˆ)(ˆ(9)解(9)得:22210)(ˆˆiiiiiiiXXnYXXYXXY(5)22221)())(()(ˆiiiiiiiiiiiixyxXXYYXXXXnYXYXn(6)其中,nYYnXXii/,/,称为样本的均值;YYyXXxiiii,,称为样本的离差。(5)和(6)就是根据普通最小二乘原理得出的一元线性回归模型。作为一个简单的推广将1ˆ做向量推广,即多元线性总体回归模型可设定为:uXXXYkk22110(10)其中u至少应满足0),,,(21kXXXuE,总体回归方程自然为:kkkXXXXXXYE2211021),,,((11)接下来,我们希望通过获得因变量和解释变量的一个容量为n的样本观测数据集niXYii,,2,1:),(,来对模型(1)中的参数0和1做出正确的估计。在多元情形中,样本数据集表示为:niXXXYikiii,,2,1:),,,,(21,待估计参数为:k,,,10,同样的推广最小二乘法得到各个参数的估计。然后一个重要的步骤是对模型的显著性以及参数的显著的显著性检验得到模型是否合理参数是否合理有效,一般在SAS软件做回归模型分析时模型的显著性以及变量的显著性都会在SAS的output窗口给出。每次建立模型时都必须检查模型以及变量是否显著有效。二:模型的重复以及统计年鉴中GDP与粗钢原始数据从国家统计局网站上找到统计每一年的国家年鉴并制定成一份Excel表(由于数据表格比较多所以用截取的一部分Excel表展示)年份粗钢产量(万吨)钢材进口(万吨)钢材出口(万吨)GDP(万亿)197831783645197934484062.619803712500.6446.854545.619813560331.8661.724891.619823716393.78110.15323.4····································2007489271687.16271265810.320085004515435923314045.42009567801763.22459.65340506.92010626651643.014255.6397983把上述数据表导入SAS中(N表示年份,CL表示粗钢产量,JK表示钢材进口,CK表示钢材出口,GDP则是国民生产总值)绘制各个变量随时间的散点图。(SAS程序略)(GDP随时间的变化)GDP0100000200000300000400000N19701980199020002010(粗钢产量随时间关系)CL010000200003000040000500006000070000N19701980199020002010(钢材进口随时间的变化)JK01000200030004000N19701980199020002010(钢材的出口随时间的变化)CK01000200030004000500060007000N19701980199020002010由上面各个散点图数据看出:近三十年来,我国粗钢产量在持续上升,大致可划分为三个阶段:1980年~1989年的平稳增长期,我国粗钢产量增长不明显,十年间仅从5%左右略升至7%左右;1990年~1999年的低速增长期,我国粗钢产量的增速有所扩大,由8%左右升至15%左右的水平;2000年~2009年的高速增长期,这十年间我国粗钢产量快速增长,其增速也明显加大,2009年我国粗钢产量较2000年的产量增长了近两倍以上,而这些数据和国内GDP数值散点图非常相识。从上面的散点图可以做一般的结论中国粗钢产量和GDP存在一定的关系。事实上,从一般的认识上也可以知道国家的粗钢产量与该国GDP存在较大的相关性。中国经济体的增长模式明显更为粗放,其经济增长在很大程度上依赖于第一产业以及第二产业而这两个产业贡献的GDP对钢材的依赖很大关系,因此可以断定GDP与钢材有相互关系。通过对粗钢产量与GDP的关系可以从GDP数据预测中国市场上的粗钢合理产量,同时也可以通过在正常的产量水品也可以估测GDP大小,建立钢材产量与GDP的对应关系相互预测。三:模型的建立以及分析对分析的数据建立回归模型(由上面的散点图判断GDP与CL,JK,CK的回归分析)模型回归的程序如下:procregdata=sasuser.gdp;modelgdp=cljkck;run;SAS中output结果截取重要部分:InterceptIntercept1-160896432.48068-2.500.0187CLCL16.766960.4356315.53.0001JKJK11.686214.096500.410.6839CKCK1-6.399804.11876-1.550.1319得到:模型的整体F检验看出模型显著,但是从单个变量看JK以及CK都不显著。得到方程的回归模型为:GDP=-16089+6.76696CL+1.68621JK+-6.39980CK即需要改进,该模型的多重共线性检测(统计检验没有采用经济意义方法)从回归的模型的F检验可以看出P0.0001模型显著。但是从单个变量的T检验中由于JK的P=0.68390.05同样的CK的P=0.13190.05则可以认为在95%的置信水平下JK与CK的系数不显著。(SAS中统计检验是否存在多重共线性的程序)proccorrdata=sasuser.gdp;varNcljkgdp;run;得到分析量之间的协相关系数矩阵output窗口的结果:(相关系数矩阵)CLJKCKGDPCL10.841