1专题:Matlab概率统计2目录•1随机数的产生•2随机变量的概率密度计算•3随机变量的分布函数值•4随机变量的逆累积分布函数•5随机变量的数字特征•6统计作图•7参数估计•8假设检验•9方差分析31随机数的产生•1.1二项分布的随机数据的产生•1.2正态分布的随机数据的产生•1.3常见分布的随机数产生•1.4通用函数求各分布的随机数据41.1二项分布的随机数据的产生•命令参数为N,P的二项随机数据•函数binornd•格式R=binornd(N,P)N、P为二项分布的两个参数,返回服从参数为N、P的二项分布的随机数,N、P大小相同。R=binornd(N,P,m)m指定随机数的个数。R=binornd(N,P,m,n)m,n分别表示R的行数和列数•例题151.2正态分布的随机数据的产生•命令参数为μ、σ的正态分布的随机数据•函数normrnd•格式R=normrnd(MU,SIGMA)返回均值为MU,标准差为SIGMA的正态分布的随机数据,R可以是向量或矩阵。R=normrnd(MU,SIGMA,m)m指定随机数的个数,与R同维数。R=normrnd(MU,SIGMA,m,n)m,n分别表示R的行数和列数61.3常见分布的随机数产生71.4通用函数求各分布的随机数据•命令求指定分布的随机数•函数random•格式y=random('name',A1,A2,A3,m,n)name的取值见下页表;A1,A2,A3为分布的参数;m,n指定随机数的行和列•例题4产生12(3x4)个均值为2,标准差为0.3的正态分布的随机数8常见分布函数表92随机变量的概率密度计算•2.1通用函数计算概率密度函数值•2.2专用函数计算概率密度函数值•2.3常见分布的密度函数作图102.1通用函数计算概率密度函数值•命令通用函数计算概率密度函数值•函数pdf•格式Y=pdf(name,x,A)Y=pdf(name,x,A,B)Y=pdf(name,x,A,B,C)•说明返回在X=x处、参数为A、B、C的概率密度值,对于不同的分布,参数个数是不同;name为分布函数名,其取值如下表。11常见分布函数表12例题4,5•例题4计算正态分布N(0,1)的随机变量X在点0.6578的密度函数值。•例题5自由度为8的卡方分布,在点2.18处的密度函数值。132.2专用函数计算概率密度函数值•命令二项分布的概率值•函数binopdf•格式binopdf(k,n,p)等同于pdf(‘bino’,k,n,p),p—每次试验事件发生的概率;K—事件发生k次;n—试验总次数14•命令泊松分布的概率值•函数poisspdf•格式poisspdf(k,Lambda)等同于pdf(‘pois’,k,Lambda)15•命令正态分布的概率值•函数normpdf•格式normpdf(x,mu,sigma)计算参数为μ=mu,σ=sigma的正态分布密度函数在x处的值16专用函数计算概率密度函数表17例题6•绘制卡方分布密度函数在自由度分别为1、5、15的图形x=0:0.1:30;y1=chi2pdf(x,1);plot(x,y1,':')holdony2=chi2pdf(x,5);plot(x,y2,'+')y3=chi2pdf(x,15);plot(x,y3,'o')axis([0,30,0,0.2])%指定显示的图形区域182.3常见分布的密度函数作图•二项分布(7)•卡方分布(8)•非中心卡方分布(9)•指数分布(10)•F分布(11)•非中心F分布(12)•Γ分布(13)•对数正态分布(14)•负二项分布(15)•正态分布(16)•泊松分布(17)•瑞利分布(18)•T分布(19)•威布尔分布(20)193随机变量的累积概率值(分布函数值)•3.1通用函数计算累积概率值•3.2专用函数计算累积概率值(随机变量的概率之和)203.1通用函数计算累积概率值•命令通用函数cdf用来计算随机变量的概率之和(累积概率值)•函数cdf•格式cdf(‘name’,K,A)cdf(‘name’,K,A,B)cdf(‘name’,K,A,B,C)•说明返回以name为分布、随机变量X≤K的概率之和的累积概率值,name的取值见表1“常见分布函数表”21例题21,22•例21求标准正态分布随机变量X落在区间(-∞,0.4)内的概率(该值就是概率统计教材中的附表:标准正态数值表)。•例22求自由度为16的卡方分布随机变量落在[0,6.91]内的概率cdf('norm',0.4,0,1)cdf('chi2',6.91,16)223.2专用函数计算累积概率值(随机变量的概率之和)•命令二项分布的累积概率值•函数binocdf•格式binocdf(k,n,p)n为试验总次数p为每次试验事件A发生的概率k为n次试验中事件A发生的次数该命令返回n次试验中事件A恰好发生k次的概率。23•命令正态分布的累积概率值•函数normcdf•格式normcdf(x,mu,sigma)返回F(x)=的值,mu、sigma为正态分布的两个参数xdt)t(p24例23•设X~N(3,22),(1)求(2)确定c,使得}3X{P},2X{P},10X4{P},5X2{P1{}{}2PXcPXc}52{XP}104{XP}2{1}2{XPXP}3X{P1}3X{Pp1=p2=p3=p4=p1=normcdf(5,3,2)-normcdf(2,3,2)p1=0.5328p2=normcdf(10,3,2)-normcdf(-4,3,2)p2=0.9995p3=1-normcdf(2,3,2)-normcdf(-2,3,2)p3=0.6853p4=1-normcdf(3,3,2)p4=0.500025专用函数的累积概率值函数表264随机变量的逆累积分布函数•4.1通用函数计算逆累积分布函数值•4.2专用函数-inv计算逆累积分布函数•4.3随机变量的数字特征已知,求x。}xX{P)x(F274.1通用函数计算逆累积分布函数值•命令icdf计算逆累积分布函数•格式icdf(‘name’,P,a1,a2,a3)返回分布为name,参数为a1,a2,a3,累积概率值为P的临界值,这里name与前面表1相同。如果P=cdf(‘name’,x,a1,a2,a3),则x=icdf(‘name’,P,a1,a2,a3)28例24,25,26•例24:在标准正态分布表中,若已知=0.975,求x•例25:在分布表中,若自由度为10,=0.975,求临界值Lambda。•例26:在假设检验中,求临界值问题。已知:,查自由度为10的双边界检验t分布临界值)x(205.0294.2专用函数-inv计算逆累积分布函数•命令正态分布逆累积分布函数•函数norminv•格式X=norminv(p,mu,sigma)p为累积概率值,mu为均值,sigma为标准差,X为临界值满足:p=P{X≤x}。30例题24,25•在标准正态分布表中,若已知=0.975,求x•在分布表中,若自由度为10,=0.975,求临界值Lambda。)x(x=icdf('norm',0.975,0,1)x=1.96002}{P2Lambda=icdf('chi2',0.025,10)Lambda=3.247031例26•在假设检验中,求临界值问题:,查自由度为10的双边界检验t分布临界值05.0lambda=icdf('t',0.025,10)lambda=-2.228132常用临界值函数表33例27•设X~N(3,22),(1)求(2)确定c,使得}3X{P},2X{P},10X4{P},5X2{P1{}{}2PXcPXc2{}3PXc1{}3PXcX=norminv(2/3,3,2)X=3.861534例28•公共汽车门的高度是按成年男子与车门顶碰头的机会不超过1%设计的。设男子身高X(单位:cm)服从正态分布N(175,36),求车门的最低高度。设h为车门高度,X为身高,求满足条件的h:即P{Xh}=0.9901.0}hX{P35例29•显示如下图:365随机变量的数字特征•5.1平均值、中值•5.2数据比较•5.3期望•5.4方差•5.5常见分布的期望和方差•5.6协方差与相关系数375.1平均值、中值•命令利用mean求算术平均值•格式mean(X)X为向量,返回X中各元素的平均值mean(A)A为矩阵,返回A中各列元素的平均值构成的向量mean(A,dim)在给出的维数内的平均值•说明X为向量时,算术平均值的数学含义是,即样本均值。n1iixn1x例3038•命令忽略NaN计算算术平均值•格式nanmean(X)X为向量,返回X中除NaN外元素的算术平均值。nanmean(A)A为矩阵,返回A中各列除NaN外元素的算术平均值向量。例3139•命令利用median计算中值(中位数)•格式median(X)X为向量,返回X中各元素的中位数。median(A)A为矩阵,返回A中各列元素的中位数构成的向量。median(A,dim)求给出的维数内的中位数例3240•命令忽略NaN计算中位数•格式nanmedian(X)X为向量,返回X中除NaN外元素的中位数。nanmedian(A)A为矩阵,返回A中各列除NaN外元素的中位数向量。例3341•命令利用geomean计算几何平均数•格式M=geomean(X)X为向量,返回X中各元素的几何平均数。M=geomean(A)A为矩阵,返回A中各列元素的几何平均数构成的向量。•说明几何平均数的数学含义是,其中:样本数据非负,主要用于对数正态分布。n1)x(Mn1ii例3442•命令利用harmmean求调和平均值•格式M=harmmean(X)X为向量,返回X中各元素的调和平均值。M=harmmean(A)A为矩阵,返回A中各列元素的调和平均值构成的向量。•说明调和平均值的数学含义是,其中:样本数据非0,主要用于严重偏斜分布。n1iix1nM例35435.2数据比较•命令排序•格式Y=sort(X)X为向量,返回X按由小到大排序后的向量。Y=sort(A)A为矩阵,返回A的各列按由小到大排序后的矩阵。[Y,I]=sort(A)Y为排序的结果,I中元素表示Y中对应元素在A中位置。sort(A,dim)在给定的维数dim内排序•说明若X为复数,则通过|X|排序。例3644•命令按行方式排序•函数sortrows•格式Y=sortrows(A)A为矩阵,返回矩阵Y,Y按A的第1列由小到大,以行方式排序后生成的矩阵。Y=sortrows(A,col)按指定列col由小到大进行排序[Y,I]=sortrows(A,col)Y为排序的结果,I表示Y中第col列元素在A中位置。•说明若X为复数,则通过|X|的大小排序。例3745•命令求最大值与最小值之差•函数range•格式Y=range(X)X为向量,返回X中的最大值与最小值之差。Y=range(A)A为矩阵,返回A中各列元素的最大值与最小值之差。例38465.3期望•命令计算样本均值•函数mean•例39•例40设随机变量X的分布率为:X-2-1012P0.301.0.20.10.3求E(X)和E(X2+1)475.4方差•命令求样本方差•函数var•格式D=var(X)var(X)=s2,若X为向量,则返回向量的样本方差。D=var(A)A为矩阵,则D为A的列向量的样本方差构成的行向量。D=var(X,1)返回向量(矩阵)X的简单方差(即置前因子为