金融投资摘要本文针对金融投资问题,采用了正态分布模型(模型一)和蒙特卡罗方法(模型二),并运用概率论相关知识对三个问题进行求解。对于要求一,我们建立了正态分布模型(模型一)和蒙特卡罗模拟模型(模型二)。对于模型一,我们首先画出其频数直方图,并对其进行拟合,我们发现拟合图近似服从正态分布,接着采用皮尔逊2拟合检验,确定了其服从正态分布,然后运用Excel求出均值=7.4863和标准差=9.8520,从而得到概率密度函数为:1238.1944863,722852.91xexf,运用概率论的相关知识,得下一个周期内的损失的数额超过10万元的可能性为3.80%,以95%的置信度保证损失的数额的最大值为8.72万元,由线性关系得若在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为1146.79万元;对于模型二,我们用计算机模拟的蒙特卡罗法将255个数据扩展为100000,得到下一个周期内的损失的数额超过10万元的可能性为3.91%,以95%的置信度保证损失的数额的最大值为8.89万元,以及初始投资额最多应为1124.86万元。对于要求二,我们由正态分布的可加性知:Z=1X+2X~N(14.9726,194.1238),再用要求一的解法,求得下一个周期内的损失的数额超过10万元的可能性为3.65%,以95%的置信度保证损失的数额的最大值为7.95万元,以及要求在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为1257.86万元;对于要求三,由正态分布可加性得Z=21XX+…+TX~2,TT,则TTTTTT*852.9,*4863.7,同理得到T个周期内的损失的数额超过L万元的可能性为1-TTL,以1-的置信度保证损失的数额的最大值为X=TTz(其中1z,当给定时,就可以查表求得z的值),以及要求在T周期内的损失超过L万元的可能性不大于,那么初始投资额最多应为0M=XLM万元。关键词:金融投资正态分布皮尔逊2拟合检验蒙特卡罗法一、问题重述某公司在金融投资中,需要考虑如下两个问题:1)准备用数额为1000万元的资金投资某种金融资产(如股票,外汇等)。它必须根据历史数据估计在下一个周期(如1天)内的损失的数额超过10万元的可能性有多大,以及能以95%的置信度保证损失的数额不会超过多少。2)如果要求在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为多少。下面是该公司在过去一年255个交易日的日收益额(单位为万元)的统计数据,假定每天结算一次,保持每天在市场上的投资额为1000万元:收益额33323130292827262524232221201918天数1111121214026347收益额171615141312111098765432天数58571014819911111410668收益额10-1-2-3-4-5-6-7-8-9-10-11-12-13-14天数9593741625532210收益额-15-16-17-18-19-20-21-22-23-24-25-26-27-28-29-30天数1000000100100000要求:1)参考以上数据,建立两种模型来解决前述的两个问题,并对这两个模型加以比较;2)讨论二周期情形(如今后两天内)上述两个问题的答案。3)陈述上述两个问题的一般形式(即初始投资额为M,限定损失额为L,置信度为1-,T个周期)及其解决方案。二、问题分析要求概率,首先我们需要先确定所给的样本服从何种分布,于是先对数据进行可视化分析。作出频数直方图,然后对其进行拟合(如下图)。由于大部分随机变量都是服从正态分布的,故我们可以建立模型观察它是否近似服从正态分布,再进行非参数检验即可,得到随机变量的分布函数后,我们就可以用概率论的相关知识求解有关问题了。三、模型假设1.所给的数据具有随机性,可以反映该公司在过去一年内的收益额总体情况2.假设每年影响收益额分环境因素是稳定的3.假设每个周期内的收益额独立同分布4.假设收益率为定值,即投资额与收益额之间呈线性关系四、符号系统T:周期数;1-:置信度i:i个周期时的样本均值i:i个周期时的样本标准差K:最大损失额0M:初始投资额五、模型建立5.1一周期情况下的两种模型5.1.1模型一:正态分布法由于大部分随机变量都服从正态分布,故我们考虑这255个交易日的日收益额是否服从正态分布,我们首先画出其频率直方图,发现它确实近似服从正态分布,再用皮尔逊2拟合检验法[1]验证其是服从正态分布;接着求出分布函数和概率密度函数,最后利用概率论知识求解。1.我们利用matlab软件[2]画出了频数直方图,见图1(程序见附录1)图1日收益额频数直方图对该图进行拟合,得到拟合图,见图2(程序见附录2),我们发现其近似服从正态分布。图2日收益额的拟合图2.我们再利用matlab软件进行皮尔逊2拟合检验检验代码:x=[11111212140263475857101481991111141066895937416255322101000000100100000];[h,p,stats]=chi2gof(x);运行后得到h=0,即接受原假设,也就是x服从正态分布;3.由255个交易日的日收益额的统计数据,我们用Excel求得正态分布的参数=7.4863,=9.8520,故正态分布的概率密度函数为:1238.1944863,722852.91xexf第一问:(1)求下一个周期内的损失的数额超过10万元的可能性,即求p{X-10},其中X~N(7.4863,2852.9)我们利用matlab软件输入命令[3]:normspec([-inf-10],7.4863,9.852),得到运行结果ans=0.037957,即p{X-10}=0.0379573.80%;(2)求解以95%的置信度保证损失的数额的最大值要求以95%的置信度保证损失的数额不会超过多少,设最大损失额为K,则即求P{X-K}=0.95时的X值。要使P{X-K}=0.95,即等价于使P{X-K}=1-0.95=0.05,由此可得P}{KX=0.05,K=1-K=0.05,所以K=0.95,查表得K=1.645,所以K=1.645*-=1.645*9.852-7.4863=8.72万元第二问:设初始投资额为0M,由假设4得到,72.81010000M,解得0M=1149.43万元,故如果要求在一个周期内的损失超过10万元的可能性不大于5%,那么初始投资额最多应为1146.79万元。5.1.2模型二:蒙特卡罗法[4]题中已经给了255个数据,我们可以利用蒙特卡罗法,先对这255个数据进行理论分析,得到了这些数据的均值为7.4863,标准差为9.852,再通过模拟,将255个数据按一定的法则扩展成100000个数据,最后进行相关问题的求解。第一问:(1)求下一个周期内的损失的数额超过10万元的可能性,即求p{X-10}我们将根据均值和标准差,将255个数据扩展为100000个,再求这100000个随机数据中数额超过10万元的概率,我们用matlab软件(程序见附录1)得到p{X-10}=0.0391=3.91%(2)求解以95%的置信度保证损失的数额的最大值由于第一问中我们得到损失数额超过10万元的概率小于0.05,故要求以95%的置信度保证损失的数额的最大值,其值必然小于10万元,我们取它在(-10,10),以0.01为步长,找到概率为0.05的那个值,即为要求的最大值,我们用matlab软件(程序见附录2)解得ans=-8.89,即损失数额的最大值为8.89万元第二问:由假设4,我们知初始投资额与日收益额之间为线性关系,故89.81010000M,所以0M=10000/8.89=1124.86万元5.1.3两种模型的比较首先比较两组模型的结果发现它们的结果是近似相等的,这说明两组模型均有一定准确度。对于模型一,我们由经验猜测其服从正态分布,并用理论证明了我们的猜想,在得到其服从正态分布后,我们运用概率论的相关知识以及matlab软件中的一些基本命令进行求解,得到了较为准确的结果;对于模型二,我们用蒙特卡洛法进行计算机随机数模拟,利用模拟的过程得到相应要求的概率或损失最大额。由于计算机模拟产生的是随机数,其运算的结果必然不会每次相同,而有一定的范围,要使运算结果相对准确,就需要产生更多的随机数,即拓展的数据越大,得到的结果更准确,这样必然就增大了计算量,增加运算时间,所以我们认为模型一相对更好。5.2二周期情况当为两周期情形时,收益额1X、2X为独立同分布,即1X、2X~iid2(,)N,由正态分布具有可加性,所以21XX~22,2,则9328.132,9726.14222第一问:(1)求周期内的损失的数额超过10万元的可能性,即求p{21XX-10}:我们利用matlab软件输入命令:normspec([-inf-10],14.9726,13.9328),得到运行结果ans=0.0365,即p{X-10}=0.0365=3.65%;(2)同第一种情形的解法,得损失数额的最大值K=1.645*22=1.645*13.9328-14.9726=7.95万元;第二问:同第一种情形的解法:95.71010000M,所以0M=1257.86万元5.3一般情形当为T周期情形时,收益额1X、2X、…、TX为独立同分布,即1X、2X…、TX~iid2(,)N,由正态分布具有可加性,所以Z=21XX+…+TX~2,TT,则TTTTTT*852.9,*4863.7第一问:(1)求周期内的损失的数额超过L万元的可能性,即求p{LZ},Z~N(211,):p{LZ}=}{TTLTTZp=TTL=1-TTL(2)求解以1-的置信度保证损失的数额的最大值设损失数额的最大值为K,所以即求1}{KXp}{KXp,所以}{TTKTTXp)(TTK1)(TTK,令zTTK(当给定时,就可以查表求得z的值),所以K=TTz第二问:同第一种情形的解法:KLMM0,其中K=TTz,所以0M=KLM万元。六、模型评价与推广1.模型的优点(1)模型一通过经验初步估计随机变量服从正态分布,再根据数据的频数直方图以及拟合图发现255个交易日的日收益额确实近似服从正态分布,最后通过理论验证证实其确实服从正态分布,模型建立考虑周全,较严谨;(2)模型二通过取大量的随机数,得到相关的结果,结果较准确;(3)对于一般情形,模型利用正态分布的可加性将问题简化,计算简便;2.模型的改进由于题中对初始投资额和日收益额之间的关系没有给出,所以我们假设其呈线性关系,但在实际问题中未必如此。在实际问题中,我们应当查阅大量的不同初始投资额与每年的日收益额,分析数据得到初始投资额与日收益额的关系。3.模型的推广本文的正态分布模型和模特卡罗法均可以用于实际问题中,如企业的生产规划等。七、参考文献[1]印凡成、夏乐天,概率论与数理统计,南京:河海大学出版社,2004.8[2]张德丰、雷晓平,MATLAB程序设计与综合应用,清华大学出版社,2012.1[3]谢中华,MATLAB统计分析与应用:40个案例分析,北京航空航天大学出版社,2010.6[4]赵静、但琦,数学建模与数学实验,高等教育出版社,2009.11附录附录1:x=normrnd(7.4863,9.852,1,100000);p=sum(x=-10)/10000;附录2:symsxn;x=normrnd(7.