t分布及其应用的探讨

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

StatisticalandApplication统计学与应用,2015,4(4),319-334PublishedOnlineDecember2015inHans.://dx.doi.org/10.12677/sa.2015.44036文章引用:申小征,吴仍康.t分布及其应用的探讨[J].统计学与应用,2015,4(4):319-334.:Dec.9th,2015;accepted:Dec.27th,2015;published:Dec.30th,2015Copyright©2015byauthorsandHansPublishersInc.ThisworkislicensedundertheCreativeCommonsAttributionInternationalLicense(CCBY).分布及其应用的探讨申小征,吴仍康云南财经大学统计与数学学院,云南昆明收稿日期:2015年12月9日;录用日期:2015年12月27日;发布日期:2015年12月30日摘要t分布是统计学中的一类重要分布,它在区间估计和假设检验中有很重要的应用,具体包括单样本的区间申小征,吴仍康320估计、独立两样本的区间估计、单样本的均值检验、两样本均值差的t检验。文中详细介绍了t分布定义性质及其在产品寿命、渔业、农业等实际生活中的应用,并借助统计软件SPSS实现单样本t检验和两样本t检验。关键词t分布,区间估计,t检验,SPSS软件1.引言t分布是统计学中的一类重要分布,英国统计学家哥塞特(Gosset)发现了它与标准正态分布的微小差别,在置信区间估计和显著性检验问题的计算中起到了重要作用。从各种有关统计资料中可以发现很多有关t分布的应用,例如在渔业中、农业、工业等中的应用,为此可用t分布进行区间估计和假设检验来解决一些实际生活问题。t检验是假设检验方法最常用方法之一,常用于正态总体均值的假设检验。单边检验和双边检验的拒绝域在许多统计学和概率论的教材中都给出了明确的定义。当样本数据比较多的时候,t检验方法虽然简单,但其计算量仍然比较大,因此我们可以使用SPSS软件来实现t检验。本文用SPSS13.0分别讨论了单样本与独立两样本两种情形的t检验。2.t分布2.1.t分布的定义[1]假设随机变量()()212~0,1,~,XNXnχ且变量1X与变量2X相互独立,则称12XtXn=的分布为自由度为n的t分布,记作()~ttn。下面导出t分布的密度函数。由标准正态密度函数的对称性可知,1X与1X−相同分布相同,从而t与−t有相同分布。这说明:对任意实数y有()()()000,PtyPtyPyt=−=−于是()()2210.2PtyPty=由F变量构造可知,()2212~1,XtFnXn=,将上式两边关于y求导可得t分布的密度函数为()()()121121222212211121122121,.π2ntFnnnpyypyyyynnnyynnn+−−+−+Γ==+ΓΓ+Γ=+−∞∞Γ这就是自由度为n的t分布的密度函数。t分布是一簇曲线,其形态大小变化与自由度的大小相关。如果自由度v越小,t分布的曲线就越低申小征,吴仍康321平;如果v自由度越大,t分布的曲线越与标准正态分布曲线接近,t分布图像,如图1。2.2.t分布的性质[1]性质1:设12,,,nxxx是来自正态分布()2,Nµσ的一个样本,x与2s分别是该样本均值与样本方差,则有()()~1nxttnsµ−=−(1.1)证明:由于()2~,xNnµσ所以可以推出()~0,1xNµσ−。将(1.1)式左端改写成为()()2211xnxnsnsnµµσσ−−=−−因为分母的根号里是自由度为1n−的2χ变量除以它的自由度,分子是标准正态变量,并且分子与分母相互独立,我们由t分布定义可知()~1ttn−,证毕。性质2:设12,,,mxxx是来自()211,Nµσ的样本,12,,,nyyy是来自()222,Nµσ的样本,且此两样本相互独立,记()()22221111,,11mnxiyiiisxxsyymn===−=−−−∑∑其中1111,,mniiiixxyymn====∑∑则有()221222~1,1xysFFmnsσσ=−−设22212σσσ==,并记()()()()22222111122mniixyiiwxxyymsnssmnmn==−+−−+−==+−+−∑∑Figure1.Degreeoffreedomwas1,5,∞forthetdistribution图1.自由度为1、5、∞的t分布申小征,吴仍康322则有()()()12~211wxytmnsmnµµ−−−+−+3.t分布在区间估计中应用3.1.单样本的区间估计[1]3.1.1.均值的区间估计方差未知时,t统计量()()~1nxttnsµ−=−,其中s为样本标准差()211niixxsn=−=−∑,n为样本容量.利用t分布,对于任意可能的偏差0ε,我们计算概率()Pxµε−,设()()11XPXPPttSnSnαµεµεα−−−===−其中1tSnαε−=,即1tnαεε−=,则对于置信度1α−,可以查t分布表(自由度为1n−),求出1tα−,进而按上式求出偏差ε,便可得到µ的置信区间为1sxtnαµε−−=,或11sstxtnnααµ−−−−,即11ssxtxtnnααµ−−−+。也常记为()121xtnsnα−±−,此处()22111niisxxn==−−∑是2σ的无偏估计。3.1.2.单样本区间估计的应用1)在渔业中的应用例2.1某水产研究所池塘养殖室,1979年在某渔场一块面积15亩的池塘,他们将利用城市的污水进行养殖鲢、鳙鱼来进行试验,年初时鲢、鳙鱼种在池塘中各放入12,000条(其中鱼的个体长约8寸),经数据统计知年终取样捕捞鳙鱼22条,经计算可以得到样本均值为1.34x=市斤,该样本的标准差为0.34S=市斤.试求该样本总体均值µ以90%的置信区间。解:自由度122121kn=−=−=和0.1α=查t分布表可得到11.721tα−=,由此可得偏差为10.341.7210.1222stnαε−==×=所以置信区间为1.340.121.340.12µ−+即1.221.46µ。也就是说,我们有90%的把握推断该鱼塘鳙鱼平均体重为1.22~1.46市斤.有时候我们需要知道样本量,故可通过单样本区间估计得出样本量。样本量的确定,从2.1.1的推导我们可以知道,对于置信区间α,偏差xµ−满足sPxtnαµα−=。由sxtnαµ−可以得到()222stnxαµ−通常我们取tα等于自申小征,吴仍康323由度为∞时的值来确定取样数比较可靠:()()22,stnxαµ∞=−,其中2s可以在正式调查前的预备调查中的实际算出。例2.2在上例所述的池塘中,假设已知鲢鱼样本标准差为0.17s=市斤,如果我们要求样本均值与总体均值的允许偏差为总体均值的允许偏差为0.07市斤,试求90%置信概率的鲢鱼样本应取样数。解:2220.171.6415.9160.07n×==≈即取样数为16即可。2)单样本区间估计在产品寿命中的应用例2.3[2]假定某种轮胎的寿命服从正态分布.为了估计这种轮胎的平均使用寿命,我们随机地抽取12只轮胎进行试用,测得它们的使用寿命(单位:万千米)如表1。试求平均寿命的0.95置信区间。解:这里正态总体的标准差未知,故可使用t分布求均值的置信区间.其中4.7092x=,20.0615s=.取0.05α=,查t分布表可知()0.975112.2010t=,故轮胎平均寿命的0.95置信区间为[]4.70922.20100.0615124.5516,4.8668±×=实际应用当中,我们总期望轮胎的使用寿命能够越长越好,所以,这里我们可以只求轮胎平均寿命的置信下限,即构造单侧的置信下限,由于()()111nxPtnsαµα−−−=−从上述不等式变形可以得到µ的1α−置信下限为()11xtnsnα−−−。将()0.95111.7959t=代入计算可得轮胎平均寿命µ的0.95置信下限为4.5806(万千米)。例2.4[2]假设某种灯泡的寿命服从正态分布,我们先从一批灯泡中随机抽取16只灯泡,测得这16只灯泡使用寿命(小时)如表2。试确定该批灯泡平均使用寿命95%的置信区间。解:根据抽样结果计算的:()()()2112384092001490,24.77161161nniiiixxxxsnn==−======−−∑∑小时小时根据0.05α=查t分布表得()()20.0251152.131tntα−==,故平均使用寿命的置信区间为:Table1.Theuselifeof12tireswererandomlyselected(unit:million)表1.随机抽取12只轮胎的使用寿命(单位:万千米)4.684.864.324.854.615.025.204.604.584.724.384.70Table2.Theservicelifeofthe16lightbulbswererandomlyselected表2.随机抽取16只灯泡的使用寿命1510145014801460152014801490146014801510153014701500152015101470申小征,吴仍康324()1224.77114902.131149013.216xtnsnα−±−=±×=±故该种灯泡平均使用寿命95%的置信区间为(1476.8,1503.2)小时。3.2.独立两样本的区间估计[3]设12,,,mxxx是来自()21,Nµσ的样本,12,,,nyyy是来自()22,Nµσ的样本,且此两样本相互独立。x与y分别是它们的样本均值,记()22111mxiisxxm==−−∑,()22111nyiisyyn==−−∑,分

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功