应用篇-第10章-Matlab在数理统计中的应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第10章Matlab在数理统计中的应用数理统计是伴随着概率论的发展而发展起来的一个数学分支,研究如何有效的收集、整理和分析受随机因素影响的数据,并对所考虑的问题作出推断或预测,为采取某种决策和行动提供依据或建议。数理统计在自然科学、工程技术、管理科学及人文社会科学中得到越来越广泛和深刻的应用,其研究的内容也随着科学技术和政治、经济与社会的不断发展而逐步扩大,但概括地说可以分为两大类:(1)试验的设计和研究,即研究如何更合理更有效地获得观察资料的方法;(2)统计推断,即研究如何利用一定的资料对所关心的问题作出尽可能精确可靠的结论,当然这两部分内容有着密切的联系,在实际应用中更应前后兼顾。本章我们将介绍如何使用Matlab研究解决数理统计和概率论的问题,通过本章的学习着重应该了解面对一批数据如何进行描述与分析,并需要掌握参数估计和假设检验这两个数理统计的最基本方法在Matlab中的实现,这其中我们将着重介绍使用Matlab的统计工具箱(StatisticsToolbox)来实现数据的统计描述和分析。10.1数据分析10.1.1总体与样本总体:是指客观存在的、在同一性质基础上结合起来的许多个别单位的整体,即研究对象的某项指标的取值的集合或全体。个体:每个研究对象。样本:总体的一部分。10.1.2几种均值在给定的一组数据中,要进行各种均值的计算,在Matlab中可由以下函数实现。mean算术平均值函数。对于向量x,mean(x)得到它的元素的算术平均值;对于矩阵,mean(x)得到x各列元素的算术平均值,返回一个行向量。nanmean求忽略NaN的随机变量的算术平均值。geomean求随机变量的几何平均值。harmmean求随机变量的和谐平均值。rimmean求随机变量的调和平均值。10.1.3数据比较在给定的一组数据中,还常要对它们进行最大、最小、中值的查找或对它们排序等操作。Matlab中也有这样的功能函数。max求随机变量的最大值元素;nanmax求随机变量的忽略NaN的最大值元素;min求随机变量的最小值元素;nanmin求随机变量的忽略NaN的最小值元素;median求随机变量的中值;nanmedian求随机变量的忽略NaN的中值;mad求随机变量的绝对差分平均值;sort对随机变量由小到大排序;sortrows对随机矩阵按首行进行排序;range求随机变量的值的范围,即最大值与最小值的差(极差)。10.1.4累和与累积向量或矩阵的元素累和或累积运算是比较常用的运算,在Matlab中可由以下函数实现。sum若X为向量,sum(X)为X中各元素之和,返回一个数值;若X为矩阵,sum(X)为X中各列元素之和,返回一个行向量。nansum忽略NaN求向量或矩阵元素的累和。cumsum求当前元素与所有前面位置的元素和。返回与X同维的向量或矩阵。cumtrapz梯形累和函数。prod若X为向量,prod(X)为X中各元素之积,返回一个数值;若X为矩阵,prod(X)为X中各列元素之积,返回一个行向量。cumprod求当前元素与所有前面位置的元素之积。返回与X同维的向量或矩阵。10.1.5简单随机样本,i.i.d,独立同分布。无限总体抽样。在Matlab中各种随机数可以认为是独立同分布的,即简单随机样本。以下罗列在Matlab中的实现方法。,均匀分布样本。n=10;x=rand(1,n)n=10;a=-1;b=3;x=rand(1,n);x=(b-a)*x+a,正态分布样本。n=10;x=randn(1,n)。mu=80.2;sigma=7.6;m=1;n=10;x=normrnd(mu,sigma,m,n);上面首先对总体均值赋值mu=80.2,再对标准差赋值sigma=7.6,m=1,n=10,分别对生成的随机阵对的行数和列数进行赋值,然后可直接利用Matlab自带的函数normrnd生成正态分布的随机数。类似地可生成m行n列的随机矩阵,服从指定的分布。生成随机数的函数后缀都是rnd,前缀为分布的名称。)(~,,,21xFXXXn)1,0(~,,,21UXXXn),(~,,,21baUXXXn)1,0(~,,,21NXXXn),(~,,,221baNXXXn10.1.6有限总体的无放回样本若有限总体为,希望从中无放回抽取容量为n的样本,这里N与n已经赋值,则可利用:r=randperm(N)产生,的一个随机全排列,即r是一个N维向量。于是,对于给定的N维向量X,令x=X(r(1:n)),可得到容量为n的无放回抽样本x。无放回抽样中,各样本点不是独立的。NXXX,,,21N,,2,110.2离散型随机变量的概率及概率分布随机取值的变量就是随机变量,随机变量分为离散型随机变量与连续型随机变量两种(变量分为定性和定量两类,其中定性变量又分为分类变量和有序变量;定量变量分为离散型和连续型),随机变量的函数仍为随机变量。有些随机变量,它全部可能取到的不相同的值是有限个或可列无限多个,这种随机变量称为离散型随机变量。10.2.1几个常见分布:1.二项分布2.Poisson分布3.超几何分布10.2.2概率密度函数值无论是离散分布还是连续分布,在Matlab中,都用通用函数pdf或专用函数来求概率密度函数值。而对于离散型随机变量,取值是有限个或可数个,因此,其概率密度函数值就是某个特定值的概率,即利用函数pdf求输入分布的概率。1.通用概率密度函数pdf计算特定值的概率命令:pdf格式为:Y=pdf(‘name’,k,A)Y=pdf(‘name’,k,A,B)Y=pdf(‘name’,k,A,B,C)说明:返回以name为分布,在随机变量X=k处,参数为A、B、C的概率密度值;对离散型随机变量X,返回X=k处的概率值,name为分布函数名。常见的分布有:name=bino(二项分布),hyge(超几何分布),geo(几何分布),poiss(Poisson分布)。2.专用概率密度函数计算特定值的概率(1)二项分布的概率值命令:binopdf格式:binopdf(k,n,p)说明:等同于pdf(‘bino’,k,n,p)。n—试验总次数;p—每次试验事件A发生的概率;k—事件A发生k次。(2)Poisson分布的概率值命令:poisspdf格式:poisspdf(k,Lambda)说明:等同于pdf(‘poiss’,k,Lambda),参数Lambda=np。(3)超几何分布的概率值命令:hygepdf格式:hygepdf(k,N,M,n)说明:等同于pdf(‘hyge’,k,N,M,n),N—产品总数,M—次品总数,n—抽取总数(n≤N),k—抽得次品数。3.通用函数cdf用来计算随机变量X≤k的概率之和(累积概率值)命令:cdf格式:cdf(‘name’,k,A)cdf(‘name’,k,A,B)cdf(‘name’,k,A,B,C)说明:返回以name为分布、随机变量X≤k的概率之和(即累积概率值),name为分布函数名。4.专用函数计算累积概率值(随机变量X≤k的概率之和,即分布函数)(1)二项分布的累积概率值命令:binocdf格式:binocdf(k,n,p)(2)Poisson分布的累积概率值命令:poisscdf格式:poisscdf(k,Lambda)(3)超几何分布的累积概率值命令:hygecdf格式:hygecdf(k,N,M,n)5.二项分布(1)求n次独立重复试验中事件A恰好发生k次的概率P。命令:pdf或binopdf格式:pdf(‘bino’,k,n,p)或binopdf(k,n,p)说明:该命令的功能是计算二项分布中事件A恰好发生k次的概率。pdf为通用函数,bino表示二项分布,binopdf为专用函数,n为试验总次数,k为n次试验中,事件A发生的次数,p为每次试验事件A发生的概率。(2)在n次独立重复试验中,事件A至少发生k次的概率P_s。命令:cdf或binocdf格式:cdf(‘bino’,k,n,p)或binocdf(k,n,p)说明:该命令的功能是返回随机变量X≤k的概率之和(即累积概率值)。其中cdf为通用函数,binocdf为专用函数,n为试验总次数,k为n次试验中,事件A发生的次数,p为每次试验事件A发生的概率。所以,至少发生k次的概率为P_s=1-cdf(‘bino’,k-1,n,p)或P_s=1-binocdf(k-1,n,p)6.Poisson分布在二项分布中,当n的值很大,p的值很小,而np又较适中时,用Poisson分布来近似二项分布较好(一般要求=np10)。(1)n次独立重复试验中,事件A恰好发生k次的概率P_k。命令:pdf或poisspdf格式:pdf(‘poiss’,k,Lambda)或poisspdf(k,Lambda)说明:在Matlab中,poiss表示Poisson分布。该命令返回事件恰好发生k次的概率。(2)n次独立重复试验中,事件A至少发生k次的概率P累积概率值命令:cdf或poisscdf格式:cdf(‘poiss’,k,Lambda)或poisscdf(k,Lambda)说明:该函数返回随机变量X≤k的概率之和,Lambda=npA至少发生k次的概率P_kP_k=1-cdf(‘poiss’,k-1,Lambda)或P_k=1-poisscdf(k-1,Lambda)7.超几何分布(1)设N为产品总数,M为其中次品总数,n为随机抽取件数(n≤N),则次品数X恰为k件的概率p_k(k=0,1,2,…,min(n,M))可由下列命令求得:命令:pdf或hygepdf格式:pdf(‘hyge’,k,N,M,n)或hygepdf(k,N,M,n)。(2)累积概率值的求法:命令:cdf或hygecdf格式:cdf(‘hyge’,k,N,M,n)或hygecdf(k,N,M,n)。说明:该函数的功能是返回次品数X≤k的概率之和。10.3连续型随机变量的概率及其分布对于随机变量X,若存在一个非负的可积函数f(x)(x∈R),使对于任意两个实数a、b(假设ab),都有:P{axb}=则称X为连续性随机变量。其中f(x)为X的概率分布密度函数,记为X~f(x).10.3.1几个常见的分布以下罗列出数理统计中几个重要的分布的概念与性子。分布:设一维连续型随机变量X的密度函数为:则称服从自由度为n的分布,记为X~(n)。20,00,e)2/(21)(2122/xxxnxfxnnnX22(1)期望与方差:,(2)来源:独立同分布,则(3)可加性:若,,且俩者独立,则有4)重要结论:若,则:以下给出了自由度为5,10,20的分布的密度函数,如下图所示:nXEnX2D)1,0N(~,,,21nXXX)(~222221nXXXn)(~121nY)(~222nY)(~21221nnYY),N(~,,,221nXXX)1(~)()1(221222nXXSnnii2图例:分布密度函数示意图051015202530354000.020.040.060.080.10.120.1422.t分布设一维连续型随机变量的密度函数为:则称X服从自由度为n的t分布,记为。3.F分布设一维连续型随机变量X的密度函数为:其中常数则称X服从第一自由度,第二自由度为的F分布,记为。X2121)2()21()(nnnxnnnxf)(~ntX0,00,1)(22112211xxxnncxxfnnn22121211)2()2()2(nnnnnnnc

1 / 52
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功