学时⒊投资分析的数量方法(QuantitativeMethodsforInvestmentAnalysis)——投资工具29第五章:正态概率分布Chapter⒌CommonProbabilityDistributions本章简介(Introduction)P226本章的内容,是四种概率分布及它们的应用,即:①theuniform;②thebinomial;③thenormal;④thelognormal。本章的其他数量工具:①Hypothesistesting;②regressionanalysis;③time-seriesanalysis。不连续的随机变量(DiscreteRandomVariables)P227§⒈定义和解释概率分布(ProbabilityDistributions)概率分布(ProbabilityDistributions),即将随机变量可能结果的概率予以特定。每个随机变量都有描述它的概率分布,概率分布的方式有两种:①概率函数(probabilityfunctions)。②累积分布函数(cumulativedistributionfunctions/distributionfunctions/cdf§⒉区别:连续的随机变量和不连续(discrete)的随机变量随机变量,是一个未来结果不确定的数。随即变量有两种类型:不连续的随机变量(discreterandomvariable)、连续的随机变量(continuousrandomvariable)。变量的结果能予以历数(个数有限)的随机变量,为不连续的随机变量。§⒊描述某特定变量可能结果的集合§⒋定义一个概率函数(Probabilityfunction)并说明它的关键特征概率函数的表示方法是:P(X=x),它表示随机变量的值为x的概率。不连续随机变量的概率函数,可以缩写为p(x);连续随机变量的概率函数用f(x)表示,称之为概率密度函数(Probabilitydensityfunctions/density/pdf)。概率函数有两个关键特征:⑴0≤p(x)≤1;⑵随机变量X所有值的概率的总和等于1。§⒌定义概率密度函数(Probabilitydensityfunction)学时⒊投资分析的数量方法(QuantitativeMethodsforInvestmentAnalysis)——投资工具30§⒍定义累积分布函数(cumulativedistributionfunction)并根据累积分布函数计算随机变量的概率累积分布函数(cumulativedistributionfunctions/distributionfunctions/cdf),表示随机变量的结果位于某一范围的概率。cdf函数的功能相当于累积相对频率。连续的或不连续的随机变量的结果的累积概率分布,可以记作F(X)=P(X≤x),或F(X)=P(x1≤X≤x2),或F(X)=P(X≥x)。累积概率函数(cdf函数)的特征:⑴0≤F(x)≤1;⑵随着x的增加,cdf函数或增加或保持不变。不连续的单项分布(TheDiscreteUniformDistribution)P228§⒎给定不连续的单项分布(adiscreteuniformdistribution),定义不连续的单一随机变量并计算概率单项分布(UniformDistribution),即随机变量所有可能结果的概率都相等。单项分布的应用:①它是为其它概率分布产生随机数以作为随机观察对象(randomobservation)的基础;②它可以用来描述结果概率相等的随机变量。贝诺里分布(ThebinomialDistribution)P230§⒏给定贝诺里概率分布(binomialProbabilityDistributions),定义贝氏随机变量(BernoulliRandomvariable)并计算概率⒈贝诺里(Binomial)分布的功能贝诺里(Binomial)分布的功能:描述有两项可能结果的随机变量的每一项结果的概率分布。其模型是:两项选择的价格模型(thebinomialOptionPricingModel,BOPM),即价格的上升或价格的下降。⒉贝氏随机变量(BernoulliRandomvariable)贝诺里分布的建构元素是贝氏随机变量(BernoulliRandomvariable)。假定某个能重复进行的试验有两个可能的结果,每次试验产生的结果必为其一,这样的试验称为贝诺里试验(Bernoullitrial)。在结果为成功时,则Y=1;在结果为失败时,则Y=0,则贝氏随机变量Y的概率函数为:p(1)=p(Y=1)=pp(0)=p(Y=0)=1-p学时⒊投资分析的数量方法(QuantitativeMethodsforInvestmentAnalysis)——投资工具31⒊贝诺里随机变量(binomialRandomvariable)对n个贝诺里试验,有0—n个“成功”。如果单个贝诺里试验的结果是随机的,则n个贝诺里试验的结果为“成功”的总数也是随机的。定义贝诺里随机变量X为n个贝诺里试验中结果为成功的总数。用“Yi”表示第i个贝诺里试验的结果为“1”或“0”(i=1,2,…,n),则:X=Y1+Y2+…+Yn。贝诺里随机变量由参数p和n定义。p即每次试验结果为“成功”的概率;n贝诺里试验的次数。对贝诺里分布,可作有如下假设:⑴对所有贝诺里试验,结果为“成功”的概率是一个常数;⑵贝诺里试验相互独立。因此,贝诺里随机变量X可以完全用两个参数描述,即X~B(n,p)。贝氏随机变量Y是n=1的贝诺里随机变量的值,即:Y~B(1,p)。⒋贝诺里随机变量X~B(n,p)的概率函数P(X=x)的表示公式:①X是贝诺里随机变量,表示n个贝诺里试验中的“成功”的总数;X=x,是这n个贝诺里试验中成功的总数等于x。②p(x)和P(X=x),表示n个贝诺里试验中,成功的总数等于x的概率。③〔nCx〕是在n个贝诺里试验中有x个成功的排列方式的数目。④p,是单个贝诺里试验的结果为成功的概率;(1-p),是单个贝诺里试验的结果为不成功的概率。⑤px(1-p)n-x,是每一个排列都具有的概率。⒌贝诺里随机变量概率函数的形状当单个贝诺里试验的结果为成功的概率p=50%时,贝诺里分布式对称的。若p≠50%,则贝诺里随机变量概率函数的图像就具有偏向性。①当p<50%时,概率函数的会向右偏(right-skewed),即图像的右部有较长的尾巴;②当p>50%时,概率函数的会向左偏(left-skewed)。对同一贝诺里随机变量有p1、p2,如果p1+p2=1,则它们的图像呈镜像对称。§⒐贝诺里随机变量(bernoulliRandomvariable)的预期值和方差p(x)=P(X=x)=〔nCx〕×px(1-p)n-x〔nCx〕=n!/[x!(n-x)!]学时⒊投资分析的数量方法(QuantitativeMethodsforInvestmentAnalysis)——投资工具32贝诺里随机变量(bernoulliRandomvariable)的预期值和方差连续的随机变量分布(ContinuousRandomVariables)P240§⒑给定连续的单项分布(acontinuousuniformdistribution),定义连续的单项随机变量并计算概率连续的单一分布(ContinuousUniformDistribution)⒈连续的单项随机变量的概率密度函数(pdf):⒉连续的单项随机变量的累积概率函数(cdf):计算概率密度函数f(x)在定义域(a≤x≤b)上的面积(即累积概率值)的数学方法是,对函数f(x)从a到b积分(integral),即:可以用上述等式对(-∞,+∞)范围内的任意两个实数求积分。因为连续随机变量的值是无限的,所以,连续随机变量的值等于任一定点的概率为0。这对计算连续随机变量的累积概率函数(cdf)有重要意义:对任何连续的随机变量X,有P(a≤x≤b)=P(ax≤b)=P(a≤xb)=P(axb)。当a≤x≤b时,f(x)=1/(b-a)表示的是连续随机变量在区间a≤x≤b的平均概率。Mean(weightedaverage)VarianceBinomial,B(1,p)pp(1-p)Binomial,B(n,p)npnp(1-p)Binomial,B(5,0.5)2.5(即5×p)1.25即5×p(1-p)Binomial,B(5,0.1)0.5(即5×p)0.45即5×p(1-p)1/(b-a)(a≤x≤b)f(x)=0其他值0(x≤a)F(x)=(x-a)/(b-a)(a<x<b)1(x≥b)P(a≤x≤b)=∫abf(x)dx学时⒊投资分析的数量方法(QuantitativeMethodsforInvestmentAnalysis)——投资工具33正态分布(TheNormalDistribution)P243§⒒解释正态分布的关键特征①描述正态分布的两个参数:平均值μ(Mean)和方差(σ2)或标准差σ。正态分布可以表示为:X~N(μ,σ2)。②正态分布的下述参数值:偏向性(skewness)=0;峰度(kurtosis)=3,剩余峰度(excesskurtosis)=0。正态随机变量的平均值(mean)、中值(median)、众数(mode)都相等。③两个正态随机变量的线性叠加(linearcombination),还是正态分布。§⒓区别:单变量(univariance)分布和多变量分布(multivariance)单变量分布(univariatedistribution),描述单个的随机变量;多变量分布(multivariatedistribution),描述的是一组随机变量的概率。当我们有一组资产时,我们可以将每一项资产的收益分布分别模型化,也可以将这些资产作为一组(asagroup)来将它们的收益分布模型化。作为一组,即考虑收益系列之间的统计关系,其中经常使用的模型就是多变量的正态分布(multivariatenormaldistribution)。n种证券的收益的多变量正态分布,可以用三个参数予以定义:①单个证券收益的平均值(mean)的清单;②证券收益方差的清单;③收益的所有互不相同的相关系数(correlations)的清单,共n(n-1)/2个。与单变量正态分布相比较,相关系数(correlations)是多变量的正态分布的区别特征之一。§⒔解释相关系数在多变量正态分布中的作用§⒕定义标准正态分布(standardsnormaldistribution)并解释如何使随机变量标准化⒈正态分布的概率密度函数(pdf)的表达式(-∞<x<+∞):当μ=0,σ=1时,该正态分布称之为标准(standard)正态分布或单位(unit)正态分布。f(x)=exp[-(x-μ)2/2σ2]/(σ√2π)学时⒊投资分析的数量方法(QuantitativeMethodsforInvestmentAnalysis)——投资工具34对于正态分布,标准差(σ)越大,其相对于平均值的分布就越分散。利用标准差,我们能够对任何正态分布的结果的分散性作出概率报告:①大约有50%的观察对象,在区间μ±(2/3)σ的范围内;②大约有68%的观察对象,在区间μ±σ的范围内;③大约有95%的观察对象,在区间μ±2σ的范围内;④大约有99%的观察对象,在区间μ±3σ的范围内。⒉随机变量的标准化标准正态随机变量用Z~N(0,1)表示。将随机变量X~N(μ,σ2)标准化的公式:随机变量X=x0对应的标准正态随机变量Z=z0=(x0-μ)/σ。其意义是:对X~N(μ,σ2),随机变量的值小于或等于x0的概率,正好等于标准正态分布Z~N(0,1)中随机变量的值小于或等于z0的概率〔z0=(x0-μ)/σ〕。即:对X~N(μ,σ2)有P(X≤x0);对Z~N(0,1)有N(Z≤z0)。当z0=(x0-μ)/σ时,则P(X≤x0)=N(Z≤z0)。§