武汉理工大学应用数学系模式分析研究室王展青第一章样本及抽样分布1.1总体和样本1.2抽样分布武汉理工大学应用数学系模式分析研究室王展青1.1总体和样本一.总体与样本二.经验分布函数三.样本的数字特征四.统计量第一章样本与抽样分布一.总体与样本样本在总体X中抽取n个个体X1,X2,,Xn,n为样本容量,(X1,X2,,Xn)构成n维随机变量。1.总体和个体总体:研究对象的全体,用随机变量X表示。个体:总体的每个单元。2.样本与样本值样本值样本的取值,即样本的观察值x1,x2,,xn第一章样本与抽样分布样本的联合分布函数为F*(x1,x2,,xn),样本的联合概率密度函数为f*(x1,x2,,xn),简单随机样本(1)每个个体Xi与总体X同分布;(2)个体之间相互独立。且F*(x1,x2,,xn)=F(x1)F(x2)F(xn)f*(x1,x2,,xn)=f(x1)f(x2)f(xn)设总体X的分布函数为F(x),概率密度为f(x),则第一章样本与抽样分布二.经验分布函数1.经验分布函数将n个样本值按大小排成顺序x(1)x(2)x(n)记Fn(x)为不大于x的样本值出现的频率,则.,1,,,,0)()()1()()1(nkknxxxxxnkxxxF称Fn(x)为经验分布函数。第一章样本与抽样分布2.格列汶科定理设总体分布函数为F(x),经验分布函数为Fn(x),则10)()(suplimxFxFPnn即当n很大时,Fn(x)F(x)第一章样本与抽样分布三.样本的数字特征1.样本均值2.样本方差3.样本标准差niiXnX11niixnx11212)(11XXnSnii212)(11xxnsnii21)(11XXnSnii21)(11xxnsnii第一章样本与抽样分布4.样本的k阶原点矩5.样本的k阶中心矩nikikXnA11nikikxna11kniikXXnB)(11kniikxxnb)(11第一章样本与抽样分布由大数定律可知定理样本的数字特征依概率收敛到总体的数字特征样本均值总体均值E(X)Pn→∞样本方差总体方差D(X)Pn→∞样本矩总体矩Pn→∞第一章样本与抽样分布四.统计量设X1,X2,,Xn是总体X的样本,若函数g(X1,X2,,Xn)不含任何未知参数,则称函数g(X1,X2,,Xn)为一个统计量。如样本均值,样本方差,样本矩经验分布函数Fn(x)武汉理工大学应用数学系模式分析研究室王展青1.2抽样分布一.分布函数的分位点二.四大统计分布三.正态总体的抽样分布定理第一章样本与抽样分布F(u)uo一.分布函数的分位点分位点设统计量U服从某分布,如果对于(01)有P(UU)=则称U为该分布的上分位点。抽样分布统计量的分布。U面积=第一章样本与抽样分布二.四大统计分布1.正态分布u设X~N(μ,σ2),则U=(X-μ)/σ~N(0,1)uo记标准正态分布的分布函数为(u),分位点为uP(Uu)=P(U≤u)=1-=(u)1-例如求u0.05由于1-=0.95查表(1.645)=0.95所以u0.05=1.645第一章样本与抽样分布定义:设总体X~N(0,1),X1,X2,,Xn是X的样本统计量2定义为)1,0(~,222212NXXXXin称2服从自由度是n的卡方分布。2.2(卡方)分布0,0,0,)2(21)(2122xxexnxfxnn概率密度为第一章样本与抽样分布②2分布的可加性若12~2(n1),22~2(n2)且相互独立,则12+22~2(n1+n2)2分布的性质①E(2(n))=n,D(2(n))=2n③当n=1时,2(n)为分布,当n=2时,2(n)为指数分布。第一章样本与抽样分布②当n>45时,利用以下近似公式计算2分布的分位数计算2xo2(n)①当n≤45时,可直接查表求出如20.1(25)=34.32822)12(21)(nun221.67)99645.1(21)50(205.02如第一章样本与抽样分布定义:设X~N(0,1),Y~2(n),且X,Y相互独立,2121)2()21()(nntnnntf3.t分布nYXT/则称T服从自由度是n的t分布概率密度为(2)当n→∞时,t分布的极限为标准正态分布t分布的性质(1)f(t)关于t=0(纵轴)对称。第一章样本与抽样分布t分布的分位数计算②当n>45时,利用以下近似公式计算t(n)u①当n≤45时,可直接查表求出如t0.005(8)=3.3554t1-(n)=-t(n)txot(n)如t0.025(52)u0.025=1.96t1-(n)第一章样本与抽样分布定义:设U~2(n1),V~2(n2)且U,V相互独立,0,00,1)2()2()2()(2211221212121211xxxnnxnnnnnnnnxfnnn4.F分布21//nVnUF则称F服从自由度是(n1,n2)的F分布.概率密度为第一章样本与抽样分布F分布的分位数计算定理若X~F(n1,n2)分布,则1/X~F(n2,n1)由此可知F(n1,n2)=1/F1-(n2,n1)②当α>0.5时,利用上述公式计算①当α≤0.5时,可直接查表求出如F0.005(9,9)=6.54如F0.995(9,9)=1/F0.005(9,9)=1/6.54=0.153fxoF(n1,n2)第一章样本与抽样分布三.正态总体的抽样分布定理设总体X~N(,2),X1,X2,,Xn是其样本),(~2nNX1)1,0(~/NnX2样本方差为S2记样本均值为X则有以下结论(1)~(5)第一章样本与抽样分布结论1,2的证明niiXnX11是n个独立的正态随机变量的线性组合,故服从正态分布niiXEnXE1)(1)(nXDnXDnii212)(1)(),(~2nNX)1,0(~/NnX12)1,0(~/NnXU);1(~)1(222nSnV)1(~1ntnVU且U与V独立,根据t分布的定义可知第一章样本与抽样分布)(~212nXnii3)1(~)1(21222nXXSnnii4)1(~/ntnSX5且独立与,2SX第一章样本与抽样分布设有两个独立正态总体X~N(1,12),Y~N(2,22)X的样本为X1,X2,,Xn1,Y的样本为Y1,Y2,,Yn2,它们的样本均值及样本方差分别为2112111,1njiniiYnYXnX212222112)(11,)(11211YYnSXXnSnjjnii第一章样本与抽样分布)1,0(~)()(),(~2221212122212121NnnYXnnNYX6则有以下结论2)1()1()(),2(~11)()(212222112221212121nnSnSnSnntnnSYXWw其中7第一章样本与抽样分布)1,1(~2122212122nnFSS8)1,1(~212221nnFSS特别当2221时