第5章估计理论•5.1验证性实验•5.2设计性实验•5.3综合性试验第5章估计理论•参数估计是根据从总体中抽取的样本估计总体分布中包含的未知参数的方法。它是统计推断的一种基本形式,是数理统计学的一个重要分支,分为点估计和区间估计两部分。5.1验证性实验•实验一统计作图•【实验目的】•1.熟悉Matlab软件的关于统计作图的基本操作•2.熟悉常见分布的分布律,概率密度函数,分布函数的作图•3.学会观察和处理数据•【实验要求】常见分布的分布律和概率密度函数,Matlab软件•【实验内容】•1.作服从正态分布的数据的钟形直方图。•2.产生50个标准正态分布的随机数,指出分布特征,并画出经验累计分布函数图。•3.实验数据2,3.4,5.6,8,11,12.3,13.8,16,18.8,19.9,用加号“+”标注其数据位置,作最小二乘拟合曲线。•4.产生100个标准正态分布的随机数和参数为1的指数分布的随机数,并画出它们的正态分布概率图形。•【实验过程】•1.在命令窗口输入:•X=-3:0.5:3;•Y=randn(10000,1);•hist(Y,X)•运行结果为:•2.在命令窗口输入:•X=normrnd(0,1,50,1);•[h,stats]=cdfplot(X)•输出结果为:•h=•159.0016•stats=•min:-2.1707•max:2.1832•mean:0.0393•median:0.1196•std:0.9760••3.在命令窗口输入:•X=[23.45.681112.313.81618.819.9]';•plot(X,'+')•lsline•运行结果为:123456789102468101214161820注:如果数据来自正态分布,则正态分布概率图形为直线,而来自其他分布则可能在图中产生弯曲00.511.522.533.544.50.0030.010.020.050.100.250.500.750.900.950.980.990.997DataProbabilityNormalProbabilityPlot•实验二统计中的样本数字特征•【实验目的】•1.掌握样本数字特征•2.会用Matlab求常见的样本数字特征•【实验要求】样本数字特征理论知识,Matlab软件•【实验内容】•1.随机生成4组100个整数数据,求每组数据的平均值。•2.随机生成5组99个整数数据,求每组数据的中位数。•3.随机生成服从参数为1的指数分布的6组10个数据,求每组数据的几何平均数,调和平均数和修正平均值。•4.随机生成服从标准正态分布的6组10个数据,求每组数据的极差,样本方差,样本标准差,平均绝对偏差。•【实验过程】•1.在命令窗口输入:•X=fix(20*rand(100,4));•M=mean(X)•运行结果为:•M=•10.05008.83009.59009.0600•2.在命令窗口输入:•X=fix(30*rand(99,5));•M=median(X)•运行结果为:•M=•1415161311•3.在命令窗口输入:•X=exprnd(1,10,6);•M1=geomean(X)•M2=harmmean(X)•M3=trimmean(X,10)•运行结果为:•M1=•Columns1through5•0.61060.28450.59950.68840.7826•Column6•0.8781•M2=•Columns1through5•0.54820.03200.31730.53650.3493•Column6•0.5019•M3=•Columns1through5•0.68800.70701.14640.94681.2291•Column6•1.2585•4.在命令窗口输入:•X=normrnd(0,1,10,6);•M1=range(X)•M2=var(X)•M3=std(X)•M4=mad(X)•运行结果为:•M1=•Columns1through5•2.85653.01553.21732.49273.5858•Column6•2.7031•M2=•Columns1through5•0.81620.77951.41570.61351.1709•Column6•0.7044•M3=•Columns1through5•0.90340.88291.18980.78321.0821•Column6•0.8393•M4=•Columns1through5•0.65750.65661.03280.64280.8920•Column6•0.6517•实验三单个总体参数的估计•【实验目的】•1.掌握单个总体参数的矩估计方法,极大似然估计法,区间估计方法•2.会用Matlab对单个总体参数进行估计•【实验要求】参数估计理论知识,Matlab软件•4.在命令窗口输入:•X=normrnd(0,1,100,1);•Y=exprnd(1,100,1);•normplot(X)•normplot(Y)•运行结果为:•【实验内容】•1.一组来自正态分布总体的样本观察值683,681,676,678,679,672,求总体均值和方差的点估计值及置信度0.95的置信区间。•2.随机生成100个二项分布样本,其中任意给定一次实验成功的概率是0.4,由样本估计概率参数p的值并求p的置信度为0.95的置信区间。•3.一组来自泊松分布总体的样本观察值0,1,2,3,4,求总体参数的点估计和0.90的置信区间。•4.随机生成10个服从区间(0,1)上的连续型均匀分布的样本,并由此样本估计总体参数。•5.设电池的寿命服从参数为λ的指数分布,随机抽取15只电池进行寿命试验,测得失效时间(单位:小时)为115,119,131,138,142,147,148,155,158,159,163,166,160,170,172,试求电池的平均寿命λ的极大似然估计值。•6.产生二项分布的随机数,并用mle函数进行参数估计。•【实验过程】•1.在命令窗口输入:•X=[683681676678679672];•[mu,sigma,muci,sigmaci]=normfit(X)•运行结果为:•mu=•678.1667•sigma=•3.8687•muci=•674.1067•682.2266•sigmaci=•2.4149•9.4884•说明均值和方差的点估计值分别是678.1667和3.8687,置信区间分别是[674.1067,682.2266]和[2.4149,9.4884]。•2.在命令窗口输入:•X=binornd(100,0.4);•[p,pci]=binofit(X,100)•运行结果为:•p=•0.4800•pci=•0.37900.5822•说明概率参数的点估计值是0.4800,置信区间是[0.3790,0.5822]。•3.在命令窗口输入:•X=[01234];•[l,lci]=poissfit(X,0.1)•运行结果为:•l=•2•lci=•1.0851•3.3924•说明参数的点估计是2,置信区间是[1.0851,3.3924]。•4.在命令窗口输入:•r=unifrnd(0,1,10);•[a,b,aci,bci]=unifit(r)•运行结果为:•a=•Columns1through5•0.16220.07820.00460.13610.0760•Columns6through10•0.04970.05980.01540.08110.3063•b=•Columns1through5•0.79430.99610.96190.91060.8530•Columns6through10•0.94480.95610.82120.78020.9294•aci=•Columns1through5•-0.0586-0.2425-0.3297-0.1345-0.1954•0.16220.07820.00460.13610.0760•Columns6through10•-0.2630-0.2533-0.2660-0.16310.0887•0.04970.05980.01540.08110.3063•bci=•Columns1through5•0.79430.99610.96190.91060.8530•1.01511.31681.29631.18121.1244•Columns6through10•0.94480.95610.82120.78020.9294•1.25741.26921.10261.02441.1470•5.在命令窗口输入:•X=[115119131138142147148155158159163166160170172];•p=expfit(X)•运行结果为:•p=•149.5333•说明参数λ的极大似然估计值是149.5333。•6.在命令窗口输入:•X=binornd(20,0.75);•[p,pci]=mle('bino',X,0.05,20)•运行结果为:•p=•0.8000•pci=•0.5634•0.9427•说明概率参数的点估计值是0.8000,置信区间是[0.5634,0.9427]。•实验四两个正态总体均值差,方差比的区间估计•【实验目的】•1.掌握两个正态总体均值差,方差比的区间估计方法•2.会用Matlab求两个正态总体均值差,方差比的区间估计•【实验要求】两个正态总体的区间估计理论知识,Matlab软件•【实验内容】•1.一制造商在位于国内两个不同地区的两家工厂生产一种合成纤维,他竭力想使两家工厂生产的纤维的平均抗断强度保持一致,为了确定两家工厂生产的纤维的平均抗断强度是否真的一致,这个制造商从a厂抽选了25个样品做样本,从b厂抽选了16个样品做样本,来自工厂a的样本均值为22kg,来自工厂b的样本均值为20kg,从以往的经验•知道,两家工厂生产的合成纤维的抗断强度都服从正态分布,且方差都为10kg,请算出两总体均值差的0.95的置信区间。•2.为比较甲乙两种型号步枪子弹的枪口速度,随机的取甲种型号子弹10发,得到枪口速度的平均值为500(m/s),标准差为1.10(m/s),随机的取乙种型号子弹20发,得到枪口速度的平均值为496(m/s),标准差为1.20(m/s),根据生产过程,可假定两个总体•都近似服从正态分布,且方差相等。求两总体均值差的一个置信水平为0.95的置信区间。•3.从甲乙两个蓄电池厂生产的产品中,分别抽取10个产品,测得他们的电容量(单位:安培小时)为:•甲厂:146,141,138,142,140,143,138,137,142,137•乙厂:141,143,139,139,140,141,138,140,142,136•若蓄电池的电容量服从正态分布,求两个工厂生产的蓄电池的电容量的方差之比的置信水平0.90的置信区间。•【实验过程】•1.由题意可知两正态总体是独立的,且方差已知,根据理论知识有均值差的置信度为0.95的置信区间为•其中分别是两总体的样本均值,样本容量和方差。],[222121025.0222121025.0nnZYXnnZYX222121,;,;,nnYX•在命令窗口输入:•z=norminv(0.975);•d1=22-20-z*(sqrt(10/25+10/16))•d2=22-20+z*(sqrt(10/25+10/16))•运行结果为:•d1=•0.0157•d2=•3.9843•说明所求的置信区间为[0.0157,3.9843]。•2.由题意不妨假设两正态总体是独立的,且有方差相等,故根据理论知识有均值差的置信度为0.95的置信区间为•其中分别是两总体的样本均值,样本容量和样本方差。]11)2(,11)2([2121025.02121025.0nnSnntYXnnSnntYXWW