1数学实验第十讲数理统计的matlab求解Matlab介绍1.表示位置的统计量—平均值和中位数.平均值(或均值,数学期望):niiXnX11中位数:将数据由小到大排序后位于中间位置的那个数值.2.表示变异程度的统计量—标准差、方差和极差.标准差:2112])(11[niiXXns它是各个数据与均值偏离程度的度量.方差:标准差的平方.极差:样本中最大值与最小值之差.一、统计量3.表示分布形状的统计量—偏度和峰度偏度:niiXXsg1331)(1峰度:niiXXsg1442)(1偏度反映分布的对称性,g10称为右偏态,此时数据位于均值右边的比位于左边的多;g10称为左偏态,情况相反;而g1接近0则可认为分布是对称的.峰度是分布形状的另一种度量,正态分布的峰度为3,若g2比3大很多,表示分布有沉重的尾巴,说明样本中含有较多远离均值的数据,因而峰度可用作衡量偏离正态分布的尺度之一.4.k阶原点矩:nikikXnV11k阶中心矩:nikikXXnU1)(12020/1/11中国人民大学六西格玛质量管理研究中心4偏度系数的意义由图2-1可表示出来。图2-110V10V10V目录上页下页返回结束2020/1/11中国人民大学六西格玛质量管理研究中心5峰度用峰度系数表示:4124()(1)niixxVSn23V23V23V目录上页下页返回结束二、基本统计量对随机变量x,计算其基本统计量的命令如下:均值:mean(x)中位数:median(x)标准差:std(x)方差:var(x)偏度:skewness(x)峰度:kurtosis(x)2020/1/117随机变量的数字特征随机变量的数学期望1.数组的平均值---Y=mean(X)功能:当X为向量时,输出一个平均数;当X为矩阵时,输出为行向量,对应于矩阵每列的平均值;因此计算矩阵所有数的平均值,应用嵌套:mean(mean(X))或m=mean(X(:))与此类似的有:求和(sum),最大(max),最小(min)等2.离散型随机变量的期望----EX=sum(X.*P)功能:计算随机值向量X与对应概率向量P的乘积之和3.连续型随机变量的期望----EX=int(x*fx,x,a,b)功能:用积分计算期望2020/1/118随机变量的数字特征例4设随机变量X的分布列,求期望。程序:clear;x=[-1,0,2,3];p=[1/8,1/4,3/8,1/4];EX=sum(x.*p)1.3750X-1023P1/81/43/81/42020/1/1193.3随机变量的数字特征例3.5设随机变量X的分布密度为:且EX=3/5,求常数a,b的值。程序:clear;symsabx;fx=a+b*x^2;EX=int(x*fx,x,0,1)EX=1/4*b+1/2*aF=int(fx,x,0,1)F=a+1/3*bf1=EX-3/5;f2=F-1;[a,b]=solve(f1,f2)a=3/5,b=6/5其他100)(2xbxaxf2020/1/11103.3随机变量的数字特征例3.6设随机变量X的分布密度为:求随机变量Y=|X|的期望。程序:clear;symsx;fx1=0.5*exp(x);fx2=0.5*exp(-x);EY=int(-x*fx1,x,-inf,0)+int(x*fx2,x,0,inf)EY=1其他05.05.0)(xeexfxxdxxfxgEY)()(2020/1/1111随机变量的数字特征随机变量的方差1.统计数据的方差---D=var(X,1)功能:当X为向量时,输出一个标量;当X为矩阵时,输出为行向量,对应于矩阵每列的方差值;因此计算矩阵所有数的方差值,应用嵌套:var(var(X))缺省1,计算:否则计算:2.统计数据的标准差---S=std(X,1)功能:用法和1的解释同上3.一般随机变量的方差----DX=E(X2)-(EX)2功能:用积分或级数编程计算niixxnS122)(11niixxnS122)(12020/1/1112随机变量的数字特征例3.7设随机变量X的分布密度为:求随机变量X的期望和方差。程序:clear;symsx;fx=2/pi*cos(2*x);EX=int(x*fx,x,-pi/2,pi/2)E2X=int(x^2*fx,x,-pi/2,pi/2)DX=E2X-EX^2其他2||02cos2)(xxxf三、常见概率分布的函数常见的几种分布的命令字符为:正态分布:norm指数分布:exp泊松分布:poiss分布:beta韦布尔分布:weib2分布:chi2t分布:tF分布:FMATLAB工具箱对每一种分布都提供5类函数,其命令字符为:概率密度:pdf概率分布:cdf逆概率分布:inv均值与方差:stat随机数生成:rnd(当需要一种分布的某一类函数时,将以上所列的分布命令字符与函数命令字符接起来,并输入自变量(可以是标量、数组或矩阵)和参数即可.)例2画出正态分布)1,0(N和)2,0(2N的概率密度函数图形.在MATLAB中输入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)1.密度函数:p=normpdf(x,mu,sigma)(当mu=0,sigma=1时可缺省)如对均值为mu、标准差为sigma的正态分布,举例如下:例3.计算标准正态分布的概率P{-1X1}.命令为:P=normcdf(1)-normcdf(-1)结果为:P=0.68273.逆概率分布:x=norminv(P,mu,sigma).即求出x,使得P{Xx}=P.此命令可用来求分位数.2.概率分布:P=normcdf(x,mu,sigma)例4取05.0,求21u21u的含义是:)1,0(~NX,P{X21u}=2105.0时,P=0.975,975.0unorminv(0.975)=1.964.均值与方差:[m,v]=normstat(mu,sigma)例5求正态分布N(3,52)的均值与方差.命令为:[m,v]=normstat(3,5)结果为:m=3,v=255.随机数生成:normrnd(mu,sigma,m,n).产生m×n阶的正态分布随机数矩阵.例6命令:M=normrnd([123;456],0.1,2,3)结果为:M=0.95672.01252.88543.83345.02886.1191此命令产生了2×3的正态分布随机数矩阵,各数分别服从分布:N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32).1.给出数组data的频数表的命令为:[N,X]=hist(data,k)此命令将区间[min(data),max(data)]分为k个小区间(缺省为10),返回数组data落在每一个小区间的频数N和每一个小区间的中点X.2.描绘数组data的频数直方图的命令为:hist(data,k)四、直方图的描绘2020/1/1121随机变量及其分布注:以后碰到命令末尾为:rnd----产生随机数X;cdf----产生分布函数F(x)pdf----产生密度函数p(x)或分布列Px=P{X=x}inv----计算x=F-1(p)→p=F(x)2020/1/1122常见分布的随机数产生2020/1/1123专用函数计算概率密度函数表2020/1/1124专用函数的累积概率值函数表2020/1/1125常用临界值函数表2020/1/1126常见分布的均值和方差2020/1/1127随机变量及其分布例3.1某人向空中抛硬币100次,落下为正面的概率为0.5。这100次中正面向上的次数记为X:(1)试计算x=45的概率和x≤45的概率;(2)绘制分布函数图象和分布列图象。程序:》clear;px=pdbinof(45,100,0.5)%计算x=45的概率px=0.0485fx=binocdf(45,100,0.5)%计算x≤45的概率fx=0.1841》x=1:100;p1=binocdf(x,100,0.5);plot(x,p1,'+');title('分布函数图')2020/1/11283.1随机变量及其分布p2=binopdf(x,100,0.5);plot(x,p2,'*r');title('概率分布图')2020/1/11293.1随机变量及其分布例3.2设X~N(2,0.25)(1)求概率P{1X2.5};(2)绘制分布函数图象和分布密度图象;(3)画出区间[1.5,1.9]上的分布密度曲线下方区域。程序:(1)p=normcdf(2.5,2,0.5)-normcdf(1,2,0.5)p=0.8186(2)x=0:0.1:4;px=normpdf(x,2,0.5);fx=normcdf(x,2,0.5);plot(x,px,'+b');holdon;plot(x,fx,'*r');legend('正态分布函数','正态分布密度');(3)specs=[1.5,1.9];pp=normspec(specs,2,0.5)2020/1/11303.1随机变量及其分布00.511.522.533.5400.10.20.30.40.50.60.70.8ProbabilityBetweenLimitsis0.26209DensityCriticalValue2020/1/1133例3.8设生成一组均值为15,方差为2.52的正态分布的随机数据,然后对这组数据进行置信度97%的参数估计。程序:clear;w=normrnd(15,2.5,50,1);或w=15+2.5*randn(50,1);alpha=0.03;[mh,sh,mc,sc]=normfit(w,alpha)运行一次:mh=15.1076sh=2.4038mc=14.3478~15.8674sc=1.9709~3.07033.4参数估计2020/1/1134例3.9设从一大批产品中抽取100个产品,经检验知有60个一级品,求这批产品的一级品率(置信度95%)。程序:clear;alpha=0.05;N=100;X=60;[Ph,Pc]=mle('bino',X,alpha,N)运行一次:Ph=0.6000Pc=0.4972~0.69673.4参数估计五、参数估计1.正态总体的参数估计设总体服从正态分布,则其点估计和区间估计可同时由以下命令获得:[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)此命令在显著性水平alpha下估计数据X的参数(alpha缺省时设定为0.05),返回值muhat是X的均值的点估计值,sigmahat是标准差的点估计值,muci是均值的区间估计,sigmaci是标准差的区间估计.2.其它分布的参数估计有两种处理办法:一、取容量充分大的样本(n50),按中心极限定理,它近似地服从正态分布;二、使用MATLAB工具箱中具有特定分布总体的估计命令.(1)[muhat,muci]=expfit(X,alpha)──在显著性水平alpha下,求指数分布的数据X的均值的点估计及其区间估计.(2)[lambdahat,lambdaci]=poissfit(X,alpha)──在显著性水平alpha下,求泊松分布的数据X的参数的点估计及其区间估计.(3)[phat,pci]=weibfit(X,alpha)──在显著性水平alpha下,求Weibull分布的数据X的参数的点估计及其区间估计.六、假设检验在总体服从正态分布的情况下,可用以下命令进行假设检验.1.总体方差已知时,总体均值的检验使用z检验[h,sig,ci]=ztest(x,m,sigma,alpha,tail)检验数据x的关于均值的某一假设是否成立,其中sig