实验12统计推断【实验目的】1.掌握数据的统计描述和参数估计、假设检验的基本概念与原理,及用MATLAB实现的方法;2.练习用这些方法解决实际问题。【实验内容】【题目2】据说某地汽油的价格是115美分/gal,为了验证这种说法,一位司机开车随机选择了一些加油站,得到某年1月和2月的数据如下:1月1191171151161121211151221161181091121191121171131141091091182月118119115122118121120122128116120123121119117119128126118125(1)分别用两个月的数据验证这种说法的可靠性;(2)分别给出1月和2月汽油价格的置信区间(α=0.05)(3)如何给出1月和2月汽油价格差的置信区间(α=0.05)2.1汽油价格的置信区间2.1.1模型分析本题是个假设检验问题。首先设该地的汽油价格服从正态分布),(2N。其原假设与备择假设分别为115:0H,115:1H。此时总体方差未知,则nsx0~)1(nt,取)1(nt得2/1分位数,记nsxt0,12/1ttP,从而可以据此选择接受或者拒绝H0。2.1.2matlab求解用matlab运行如下程序x1=[119117115116112121115122116118109112119112117113114109109118];x2=[118119115122118121120122128116120123121119117119128126118125];m1=mean(x1)m2=mean(x2)[h1,sig1,ci1]=ttest(x1,115,0.05,0)[h2,sig2,ci2]=ttest(x2,115,0.05,0)得到如下输出结果:m1=115.1500m2=120.7500h1=0sig1=0.8642ci1=113.3388116.9612h2=1sig2=1.3241e-006ci2=119.0129122.48712.1.3结果分析月份均值检验结果价格的置信区间一月115.1500接受[113.3388116.9612]二月120.7500拒绝[119.0129122.4871]从一月份的数据来看,应接受平均有家为115美分/gal的说法,从二月份的数据看则不可以接受。一月份汽油价格的置信区间为[113.3388116.9612],二月份汽油价格的置信区间为[119.0129122.4871]。2.2汽油价格差的置信区间对于此题有两种理解,一是两月的数据分别一一对应,来自于同一加油站;二是两组数据的来源均是随机的,来自于不同加油站。2.2.1两月数据一一对应来自同一加油站对于此种理解,则两个月的差值及时一组样本。故课分别求出每个加油站的两个月份油价差,产生一组新的随机变量,直接对这组数据进行t检验,得到其差值的置信区间。x3=x2-x1;[h3,sig3,ci3]=ttest(x3,0,0.05,0)输出结果如下:h3=1sig3=2.0582e-004ci3=3.03938.1607因此,置信区间为[3.03938.1607]。2.2.2两组数据来自不同加油站在此种理解下,应构造T统计量由t分布检验,把一月与二月的数据看作两个总体,其均值的差值应该服从两个总体时的t分布。取221221nsnsxxt~)2(21nnt,其中2)1()1(2122212nnsnsns。。当t满足处于置信区间内时我们可以认为一月和二月该地的汽油价格是相同的。该题要求确定置信区间,即为假定一月和二月的汽油价格不变,差值必定满足显著性水平,所以差值区间即为置信区间。[h4,sig4,ci4]=ttest2(x2,x1,0.05,0)得到如下结果:h4=1sig4=3.6952e-005ci4=3.17278.0273此时置信区间为[3.17278.0273]。2.3小结本题主要考察了t检验。虽然在编程时用到了ttest的两种不同的检验,但是它们本质只是t分布的几种变换形式。本题同时让我们复习了假设检验中的基本流程:先根据原题中的目标建立原假设,再写出备择假设,然后根据拒绝域的形式,利用正态分布、t分布等构造出拒绝域形式,最终代入样本数据,对总体进行检验。MATLAB利用此思想方便地利用函数进行检验。【题目5】甲方向乙方成批供货,甲方承诺合格率为90%,双方商定置信概率为95%。现从一批货中抽取50件,43件为合格品,问乙方应否接受这批货物?你能为乙方不接受它出谋划策吗?5.1模型分析一件产品只有合格品和废品之分,记产品合格为0,不合格为1,从而产品的合格情况服从0-1分布。设废品率为p,则总体X的期望p,)1(2pp,虽然X不服从正态分布,但是根据中心极限定理,当样本容量充分大时,对样本均值x近似有npppxz/)1(000~)1,0(N。此题中由于X服从0-1分布,故样本均值恰好表示产品的不合格率。现乙方不信任甲方,由此可对总体的废品率p作如下检验假设:00:ppH,01:ppH。该假设的判断标准时:若uz,则接受0H,否则拒绝。5.2matlab求解xbar=43/50;p0=0.9;n=50;z=(xbar-p0)/((p0*(1-p0)/n)^0.5);alpha=0.05;ifz=norminv(alpha)h=0elseh=1end得到如下结果:h=0由此可以看出,应当接受假设,相信这批货物的合格率在90%以上,乙应接受这批货物。5.3乙方策略若乙方怀疑甲的货物合格率不足,为了不接受这批货物,则需要改变合约中的参数值。乙方的策略应分别针对合约中的承诺合格率要求、置信概率,或者是增加抽检数。使得其不包括大于90%的部分,使得乙方拒绝这批货物),或将抽检数提高等,总的目的是使unpppxz/)1(0005.3.1提高合格率要求要提高p0使得unpppxz/)1(000成立,则可以通过解关于p0的方程得到结果。首先建立函数文件functiony=celve1(p0,xbar,n,alpha)y=(xbar-p0)/((p0*(1-p0)/n)^0.5)-norminv(alpha);end运行如下程序xbar=43/50;p=0.9;n=50;alpha=0.05;[p0,fv,ef]=fzero(@celve1,p,[],xbar,n,alpha)得到如下输出结果p0=0.9223fv=1.1102e-015ef=1又以上结果可知,当约定合格率提高为92.23%,乙方有理由拒绝这批货物。5.3.2增大显著性水平xbar=43/50;p0=0.9;n=50;z=(xbar-p0)/(p0*(1-p0)/n)^0.5;foralpha=0.05:0.001:0.2ifznorminv(alpha,0,1)breakendendalpha得到如下结果alpha=0.1730由此看出,当显著性水平增大到0.173时,即置信度减小到0.827,乙有更大的倾向不相信甲的检测结果,从而拒绝这批货物。5.3.3增大抽检次数xbar=43/50;p0=0.9;alpha=0.05;forn=50:200z=(xbar-p0)/(p0*(1-p0)/n)^0.5;ifznorminv(alpha,0,1)breakendendn得到如下结果:n=153当n增大时,方差的分布会变窄。此结果表明,若次品率不变,抽查153次时,乙方可以拒绝这批货物。5.4小结本题较为复杂,主要体现在乙方的策略中。乙方的策略是根据假设检验中检验量的形式构造出的。乙的策略改变分别就检验量中的三个变量解方程得到。此题的策略对检验量形式变换要求较高,让我对假设检验有了更深的理解。【题目7】为研究胃溃疡的病理医院做了两组人胃液成分的试验,患胃溃疡的病人组与无胃溃疡的对照组各取30人,胃液中溶菌酶含量如表(1)根据这些数据判断患胃溃疡病人的溶菌酶含量与“正常人”有无明显差别(2)若表中患胃溃疡病人组的最后五个数据有误,去掉后再作判断病人0.210.40.30.410.911.31.12.012.416.22.117.618.93.33.820.74.54.824.025.44.940.05.042.25.350.060.07.59.845.0正常人0.25.40.35.70.45.80.77.51.28.71.58.81.59.11.910.32.015.62.416.12.516.52.816.73.620.04.820.74.833.07.1模型建立由于需要比较两组数据的差别,则应使用量总体的t分布进行检验,做检验假设如下(α=0.05):210:H,211:H。7.2matlab求解x11=[0.210.40.30.410.911.31.12.012.416.22.117.618.93.33.820.74.54.824.025.44.940.05.042.25.350.060.07.59.845.0];x12=[0.25.40.35.70.45.80.77.51.28.71.58.81.59.11.910.32.015.62.416.12.516.52.816.73.620.04.820.74.833.0];[h1,sig1,ci1]=ttest2(x11,x12)%去掉最后五个数据x21=[0.210.40.30.410.911.31.12.012.416.22.117.618.93.33.820.74.54.824.025.44.940.05.042.25.3];x22=[0.25.40.35.70.45.80.77.51.28.71.58.81.59.11.910.32.015.62.416.12.516.52.816.73.6];[h2,sig2,ci2]=ttest2(x21,x22)得到如下输出结果:h1=1sig1=0.0251ci1=0.988614.3114h2=1sig2=0.0353ci2=0.402210.8378通过以上结果可知,当使用全部数据时,判断结果为患胃溃疡病人的溶菌酶含量与“正常人”有明显差别;而当去掉表中患胃溃疡病人组的最后五个数据再进行假设检验时,判断结果为患胃溃疡病人的溶菌酶含量与“正常人”无明显差别。