Matlab笔记数值计算—概率篇017

linbin1012
2 ℃
2020-01-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

17.数值计算—概率篇一、计算组合数、排列数!n——factorial(n)或prod(1:n)knC——nchoosek(n,k)knA——factorial(n)/factorial(n-k)二、生成随机数1.rand(m,n)——生成m×n的服从[0,1]上均匀分布的随机数；用a+(b-a).*rand(m,n)生成m×n的服从[a,b]上均匀分布的随机数。2.二项分布与正态分布随机数binornd(N,P,m,n)——生成m×n的服从二项分布B(N,P)的随机数；normrnd(MU,SIGMA,m,n)——生成m×n的服从正态分布N(MU,SIGMA2)的随机数；3.通用格式：分布缩写+rnd(分布参数,m,n)或random(‘分布名或缩写’,分布参数,m,n)可以用来生成m×n该分布的随机数。各种分布名见下图：表1一维随机变量概率分布名称表分布缩写、分布名称函数说明'beta'或'Beta'Beta分布'bino'或'Binomial'二项分布'chi2'或'Chisquare'卡方分布'exp'或'Exponential'指数分布'f'或'F'F分布'gam'或'Gamma'GAMMA分布'geo'或'Geometric'几何分布'hyge'或'Hypergeometric'超几何分布'logn'或'Lognormal'对数正态分布'nbin'或'NegativeBinomial'负二项式分布'ncf'或'NoncentralF'非中心F分布'nct'或'Noncentralt'非中心t分布'ncx2'或'NoncentralChi-square'非中心卡方分布'norm'或'Normal'正态分布'poiss'或'Poisson'泊松分布'rayl'或'Rayleigh'瑞利分布't'或'T'T分布'unif'或'Uniform'均匀分布'unid'或'DiscreteUniform'离散均匀分布'weib'或'Weibull'威布尔分布4.使用randsample和randsrc函数生成指定离散分布随机数X=randsample(N,k,replace,w)N相当于[1:N],也可以是具有确定值的向量；k表示生成k个随机数；replace=’true’表示可重复，或’false’表示不可重复（默认）；w是权重向量。X=randsrc(m,n,[x;p])生成m×n的随机矩阵，服从取值为向量x,对应概率为向量p的离散分布。例1设离散型随机变量X服从如下分布：X-2-1012P0.050.20.50.20.05生成服从3×5的该分布的随机数。代码：xvalue=[-2-1012];xp=[0.050.20.50.20.05];%调用randsample函数生成100个服从指定离散分布的随机数x=randsample(xvalue,15,true,xp);reshape(x,[35])%调用randsrc函数生成10*10的服从指定离散分布的随机数矩阵y=randsrc(3,5,[xvalue;xp])运行结果：ans=00100000-1-111001y=-1-111-1-10020-10-1005.已知概率密度函数，生成服从该分布的随机数例2设随机变量X的概率密度函数为（抛物线分布）：6(1),01()0,xxxfx其他调用crnd函数（来自《MATLAB统计分析与应用40个案例分析》作者：谢中华），生成3×5个服从该分布的随机数。代码：pdffun='6*x*(1-x)';%密度函数表达式x=crnd(pdffun,[01],3,5)运行结果：x=0.31600.68660.27240.28160.12680.26810.84390.19480.79990.53830.73770.20400.49320.19480.69096.生成多元分布的随机数mrnd(N,P,m)——多项分布，P为概率向量；mvnrnd(mu,sigma,m)——多元正态分布，mu,sigma为n元向量；mvtrnd(C,df,m)——多元t分布；wishrnd(sigma,df,m)——Wishart分布；iwishrnd(sigma,df,m)——逆Wishart分布；例3利用mvnrnd函数生成3组的二元正态分布随机数，其中分布的参数为1013==20316，代码：mu=[1020];sigma=[13;316];xy=mvnrnd(mu,sigma,3)运行结果：xy=11.833625.73859.034717.80269.603019.5821三、随机变量的概率密度函数及其图像概率密度函数，描述随机变量X在点x附近取值的可能性。1.通用格式：pdf(‘分布名或缩写’,x,分布参数)——返回该分布在X=x处的概率密度值；例如，Pk=pdf('bino',3,10,0.4)2.专用函数分布名缩写+pdf(x,分布参数)例如，binopdf(k,n,p)例4绘制卡方分布密度函数在自由度分别为1、5、15的图形。代码：x=0:0.1:30;y1=chi2pdf(x,1);plot(x,y1,':')holdony2=chi2pdf(x,3);plot(x,y2,'+')y3=chi2pdf(x,10);plot(x,y3,'o')axis([0,30,0,0.2])运行结果：四、随机变量的分布函数分布函数定义为：F(x)=P{X≤x}，表示随机变量X的取值落在(-∞,x)范围内的概率。引入分布函数的目的，就是可以计算随机变量X的取值落在任意区间内的概率，例如，P{aX≤b}=F(b)-F(a)1.通用格式：cdf(‘分布名或缩写’,x,分布参数)——返回该分布的分布函数；例如，Pk=cdf('bino',3,10,0.4)2.专用函数分布名缩写+cdf(x,分布参数)例如，binocdf(k,n,p)05101520253000.020.040.060.080.10.120.140.160.180.2五、逆分布函数已知F(x)=P{X≤x}的值，求x点。1.通用格式：icdf(‘分布名或缩写’,p,分布参数)——返回该分布的分布函数F(x)=P{X≤x}=p的x值；例如，Pk=icdf('bino',3,10,0.4)2.专用函数分布名缩写+inv(p,分布参数)例如，binoinv(p,N,P)3.分位数N(0,1)的上α分位数：P{Xuα}=α，故uα=norminv(1-α,0,1)其它分布的上分位数也是类似的。N(0,1)的双侧α分位数：P{|X|uα/2}=α,故uα/2=norminv(1-α/2,0,1)注意：-uα/2=u1-α/2（-uα/2右侧的面积为1-α/2），其它对称分布也成立，例如，t1-α(n)=-tα(n).六、随机变量的数字特征注：若要X中除NaN（非数）之外的数进行操作，加前缀nan,例如nanmean(X).1.几种平均(1)算术平均值（样本均值）适用于性质相同、单峰，且近似服从正态分布的定量数据；代码：mean(X)（若X为矩阵，返回每列的均值）(2)中位数代码：median(X)(3)几何平均值11nniiGx适用于对比率数据的平均，并主要用于计算数据平均增长（变化）率；服从正偏态分布（较长右尾），特别是对数正态分布数据（取对数变换后服从正态分布）。代码：geomean(X)(4)调和平均值11niinHx即先取倒数，再取算术平均值，再取倒数回来。例如前半段时速60公里，后半段时速30公里（两段距离相等），则其平均速度为两者的调和平均数时速40公里。在实际中，往往由于缺乏总体单位数的资料而不能直接计算算术平均数，这时需用调和平均法来求得平均数。代码：harmmean(X)(5)众数出现次数最多的数，代码：mode(X)2.期望和方差(1)样本数据mean(X)——样本均值11niixxnvar(X)或var(X,0)——样本方差2211=()1niiSxxnvar(X,1)——方差211()niiDxxnstd(X)或std(X,0)——样本标准差Sstd(X,1)——标准差D(2)常见分布的期望和方差通用格式：[E,D]=分布名缩写+stat(分布参数)返回E为期望，D为方差；例如，[E,D]=normstat(MU,SIGMA)(3)已知离散型随机变量的分布律，求期望和方差例5设离散型随机变量X服从如下分布：X-2-1012P0.30.10.20.10.3求E(X),E(X2-1),D(X).代码：X=[-2-1012];p=[0.30.10.20.10.3];EX=sum(X.*p)%或EX=X*p’Y=X.^2-1;EY=sum(Y.*p)XX=X.^2;EXX=sum(XX.*p);DX=EXX-EX^2运行结果：EX=0EY=1.6000DX=2.60003.极差、偏度、峰度极差，数据的最大值与最小值之差。代码：range(X)偏度，是数据关于均值不对称的指标。若偏度为负，说明均值左边的数据比右边的数据更散；若偏度为正，说明均值右边的数据比左边的数据更散，正态分布的偏度为0.代码：skewness(X)峰度，是用来反映数据的分布曲线顶端尖峭或扁平程度的指标。代码：kurtosis(X)4.矩k阶中心矩——m=moment(X,k)k阶原点矩——可以使用下面自编的OriginMoment.mfunctiony=OriginMoment(X,k);%X为样本矩阵[n,m]=size(X);y=zeros(1,m);forii=1:m;y(ii)=sum(X(:,ii).^k)/n;end5.协方差（矩阵）、相关系数（矩阵）对于样本数据矩阵：11121212221212nnnmmmnmnxxxxxxXXXXxxxMatlab将矩阵X的每一列Xj,j=1,…,n作为一个随机变量的样本，每一行[xj1,xj2,…,xjn],j=1,2,...,m作为n个随机变量的联合分布的一个样本。由于矩阵X给出的只是随机变量的样本数据，并不知道这些随机变量的（联合）概率分布，因此是不能计算出这些随机变量的总体期望、方差或协方差的，而只能计算出它们的一个无偏估计，即样本均值、样本方差与样本协方差。样本协方差公式：11(,)()()1niiiCOVXYxxyyn111212122212nnnnnnnnccccccccc,其中(,)ijijcCOVXX称为随机变量X1,…,Xn的协方差矩阵（实对称、非负定）。协方差矩阵是一维随机变量方差、二维随机向量协方差向高维随机向量的推广，常应用于在主成分分析中。相关系数（矩阵）是协方差（矩阵）的标准化，反映了随机变量两两之间的线性关系的强弱程度。代码：cov(X)——返回样本矩阵X的协方差矩阵；corrcoef(X)——返回样本矩阵X的相关系数矩阵；例6随机生成样本数据矩阵X，计算X的协方差矩阵、相关系数矩阵。代码：M=5;N=3;X=10.*rand(M,N)CovX=cov(X)Cov12=cov(X(:,1),X(:,2))Cov11=cov(X(:,1),X(:,1))var(X(:,1))RhoX=corrcoef(X)运行结果：X=1.06658.68694.31419.61900.84449.10650.04633.99781.81857.74912.59872.63808.17308.00071.4554CovX=19.6061-6.38125.3900-6.381211.6214-5.58945.3900-5.58949.7937Cov12=19.6061-6.3812-6.381211.6214Cov11=19.606119.606119.606119.6061VarX1=19.6061RhoX=1.0000-0.42270.3890-0.42271.0000-