数理统计上机报告姓名:苏宏健班级:信计11-1组别:成绩:.合作者:指导教师:实验日期:2013.11.24.上机实验一:假设检验一、上机目的:1.进一步理解假设检验的基本思想,学会使用检验和进行统计推断。2.学会使用R软件进行假设检验的方法。二、上机实验的内容和实例这一部分讲述2种利用R实现的假设检验方法,F检验、t检验。1.F检验如果想知道两组样本的方差是否相等。可以用两个样本方差相等的F检验。设两个正态总体的方差分别为21和22,如果在两总体中随机选取容量为1n和2n个独立样本,那么统计量2122SFS服从自由度为1n-1和2n-1的F分布。假设检验问题:2222012112:;:HH,给定显著性水平,则拒绝域为:1212121212122{(,,,;,,,)|(1,1)(1,1)}nnWxxxyyyFFnnFFnn或。下面以一例介绍两个正态总体方差的F检验。例1、有甲、乙两个实验员,对同一实验的同一指标进行测定,两个测定的结果如下:试验号12345678甲4.33.23.83.53.54.83.33.9乙3.74.13.83.54.63.92.84.4试问:甲乙的测定有无显著差异?取显著性水平α=0.05.实验程序:x-c(4.3,3.2,3.8,3.5,3.5,4.8,3.3,3.9)y-c(3.7,4.1,3.8,3.8,4.6,3.9,2.8,4.4)sq1-var(x)sq2-var(y)F-sq1/sq2n1-length(x)n2-length(y)alpha-0.05F1-qf(alpha/2,n1-1,n2-1)F2-qf(1-alpha/2,n1-1,n2-1)jieguo-list(F,F1,F2)jieguo实验结果:有实验结果可以看出F1FF2,接受原假设,甲乙没有显著差异。t检验2.1单个总体方差未知时均值的t检验设单个正态总体方差2未知时,如果在总体中随机选取容量为n样本,则统计量0/xtsn服从自由度为1n的t分布。假设检验:0010::HH的拒绝域为:0122{(,,,):||||(1)}/nxWxxxttnsn。下面以一例介绍单个正态总体方差未知时均值的t检验。例2、某型号玻璃纸的横向延伸率要求不低于65%,且其服从正态分布,现对一批该型号的玻璃纸测得100个数据如下:x%(横向延伸35.537.539.541.543.545.547.549.551.553.555.557.559.561.563.5率)频数7811991217145320201试问:该批玻璃纸的横向延伸率是否符合要求?(取显著性水平为α=0.05)实验程序:alpha-0.05;x-rep(c(35.5,37.5,39.5,41.5,43.5,45.5,47.5,49.5,51.5,53.5,55.5,57.5,59.5,61.5,63.5),c(7,8,11,9,9,12,17,14,5,3,2,0,2,0,1));n-100;sd1-sd(x);xbar-mean(x);t-(xbar-65)/(sd1/sqrt(n));tvalue-qt(alpha,n-1);实验结果:有以上结果可以知道,ttvalue拒绝原假设,认为该批玻璃纸的横向延伸率不符合要求。2.2两个总体方差相等未知时均值差的t检验设两个正态总体的方差分别为21和22未知,但22212(如果验证两组样本的对应总体方差相等。可以用两个样本方差相等的F检验),如果在两总体中随机选取容量为1n和2n个独立样本,那么统计量1212()()11wxytsnn服从自由度为122nn的t分布。假设检验问题:012112:;:HcHc(c已知常数)给定显著性水平,则拒绝域为:1212212(){(,,,):||||(2)}11/nwxycWxxxttnnsnn。例子如例1;实验程序:alpha-0.05;n1-8;n2-8;x-c(4.3,3.2,3.8,3.5,3.5,4.8,3.3,3.9);y-c(3.7,4.1,3.8,3.8,4.6,3.9,2.8,4.4);var1-var(x);xbar-mean(x);var2-var(y);ybar-mean(y);Sw2-((n1-1)*var1+(n2-1)*var2)/(n1+n2-2)t-(xbar-ybar)/(sqrt(Sw2)*sqrt(1/n1+1/n2));tn-16;linjie-qt(1-alpha/2,n-2)linjie实验结果:实验结果tlinjie,我们接受其假设,也就说明甲乙没有显著差异。三、实验小结:上机实验一我们可以加深对假设检验的认识,同时了掌握常见假设检验方法的R解法。本实验重点涉及到假设检验的各个方面内容,使我们:(1)进一步了解F检验、t检验统计量的含义;(2)掌握F检验的R解法以及在实际问题中的应用;(3)了解2种类型t检验R解法以及多种应用;上机实验二:区间估计一、上机目的:1.更深层理解数学期望和方差的置信区间的概念和思想,学习求正态总体的均值和方差的置信区间。2.了解常用统计函数在R中的表示方法,运用在R中求出这些统计函数值,计算参数的置信区间。二、上机实验的内容和实例1、单个总体方差已知时均值的区间估计根据统计学原理,当总体呈正态分布,抽取的样本的平均值也呈正态分布.其平均数为总体平均数,方差为总体方差除以样本数,即2/n。当总体不是正态分布,平均数的抽样分布也不是正态分布。但是根据统计学中的中心极限定理可知.如果从平均数为和方差为2的总体中随机抽样,当样本容量大时,平均数的抽样分布接近正态分布N(,2/n).在实际应用中,如果样本数大于25,一般认为样本数足够大,样本平均数的抽样分布非常接近正态分布N(,2/n).这里为了进行区间估计,设12,,,nxxx来自正态总体2(,)N样本,其中2已知。因为统计量/xn服从标准正态分布,所以1}/{2/12/1unxuP,从而得出均值的置信度1的置信区间为],[2/12/1nuxnux。2、单个总体方差未知时均值的区间估计在现实的抽样调查中,通常不知道总体的方差是多少。如果方差不知道,上面的估计区间就不能用于总体平均数置信区间的估计。在统计学中,如果总体方差未知,用样本方差代替。此时即使总体是正态分布,样本平均数的抽样分布也不再是正态分布,而是自由度1n的t分布。设12,,,nxxx来自正态总体2(,)N样本,其中2未知。因为统计量/xsn服从自由度1n的t分布,所以1)}1(/)1({2/12/1ntnsxntP,从而得出均值的置信度1的置信区间为])1(,)1([2/12/12/1nntxunntx。下面以一例介绍R下单个正态总体方差已知与未知时均值的区间估计的求法例1、随机的从一批钉子中抽取16枚,测得其长度为(单位:cm)2.142.102.132.152.132.122.132.102.152.122.142.102.132.112.142.11设钉子的分布为正态分布,分别对下列两种情况求出总体均值μ的90%置信度的置信区间。(1)已知σ=0.01cm;(2)σ未知。(1)实验程序:alpha-0.1sigma-0.01x-c(2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15,2.12,2.14,2.10,2.13,2.11,2.14,2.11)n-length(x)xbar-mean(x)fws-qnorm(1-alpha/2,0,1,lower.tail=TRUE)left-xbar-fws*sigma/sqrt(n)right-xbar+fws*sigma/sqrt(n)实验结果:其置信区间为(2.120888,2.129112)(2)实验程序:alpha-0.1x-c(2.14,2.10,2.13,2.15,2.13,2.12,2.13,2.10,2.15,2.12,2.14,2.10,2.13,2.11,2.14,2.11)n-length(x)xbar-mean(x)s-sd(x)fws-qt(1-alpha/2,n-1,lower.tail=TRUE)left-xbar-fws*s/sqrt(n)right-xbar+fws*s/sqrt(n)实验结果:其置信区间(2.117494,2.132506)2、方差已知情况下,两总体平均数差值的区间估计方法两总体均值方差μ1-μ2的置信区间(1)σ1=σ2=σ未知取估计函数:2)1()1(),2(11)()(U212*222*11212121nnSnSnSnntnnSuyxWW其置信区间:))2(11)(()(21212121nntnnSyxuW(2)σ1=σ2=σ已知))(()(),1,0()()(U212221212122212121unnyxuNnnuyx下面以一例介绍R下单个正态总体方差相等未知时均值之差的区间估计的求法例2、为了在正常条件下检验一种杂交作物的两种新处理方案,在同一地区随机的挑选8块地,在每块试验地上按两种方案种植植物,这8块地的单位面积产量分别是:1号方案产量86875693849375792号方案产量8079589177827466假设两种方案的产量都服从正态分布。试求这两个平均产量之差的置信度为95%的一个置信区间。实验程序:alpha-0.05n1-8n2-8x-c(86,87,56,93,84,93,75,79)y-c(80,79,58,91,77,82,74,66)var1-var(x)xbar-mean(x)var2-var(y)ybar-mean(y)Sw2-((n1-1)*var1+(n2-1)*var2)/(n1+n2-2)fws-qt(1-alpha/2,n1+n2-2)left-(xbar-ybar)-fws*sqrt(Sw2)*sqrt(1/n1+1/n2)right-(xbar-ybar)+fws*sqrt(Sw2)*sqrt(1/n1+1/n2)实验结果:其置信区间为(-6.187367,17.68737)三、实验小结通过本次上机,我们掌握了几种常见的总体平均数和方差的区间估计以及两个总体的差值和比值的区间估计,具体包括:1、总体方差已知情况下,总体均值的区间估计以及R的计算方法;2、总体方差未知情况下,总体均值的区间估计以及R的计算方法;3、总体方差已知情况下,两总体平均数差值的区间估计方法,以及R的计算方法。上机实验三:方差分析一、上机目的:1、进一步理解方差分析的统计思想,学会使用方差分析进行统计推断。2、学会利用R进行方差分析的方法。二、上机实验的内容和实例R软件提供了方差分析方法:包括单因素方差分析、可重复双因素分析、无重复双因素分析。本次试验介绍两种。1、单因素方差分析单因素方差分析可用于检验两个或两个以上总体平均值相等的零假设。检验假设总体是正态分布,总体方差是相等的,并且随机样本是独立的。下面以一例介绍R中“单因素方差分析”工具的使用例1、在入户推销上有5种方法,某大公司想比较这5种方法的效果有无显著差异,设计了一项实验:从应聘的且无推销经验的人员中挑选一部分人,将他们随机地分为5个组,每组用一种推销方法进行培训,培训相同时间后观察他们在一个月的推销额,数据如下表所示。(单位:千元)组别推销额第1组20.016.817.921.223.926.822.4第2组24.921.322.630.229.922.520.7第3组16.