第五章数理统计的基本概念总体和样本几个常用的分布和抽样分布概率论中,随机变量及其概率分布全面描述了随机现象的统计规律.概率分布已知如:某养鸡厂母鸡的年产蛋量300~PX如:某校学生身高状况210,160~NY数理统计数理统计中,概率分布未知或不完全知道.通过对所研究的随机变量进行重复独立的观察,采集数据,分析数据,从而对变量的分布做出估计或推断.1.某养鸡厂母鸡的年产蛋量PX~2.某校学生身高状况2,~NY3.某厂生产的灯泡的使用寿命eY~5.1总体和样本从本质上讲,总体就是所研究的随机变量或随机变量的分布。即一个具有确定概率分布的随机变量。一、总体在数理统计中,把所研究的对象的全体称为总体。通常指研究对象的某项数量指标,一般记为X。把总体的每一个基本单位称为个体。如全体在校生的身高X,某批灯泡的寿命Y。对不同的个体,X的取值是不同的。X是一个随机变量或随机向量。X或Y的分布也就完全描述了我们所关心的指标,即总体的分布。为方便起见,我们将X的可能取值的全体组成的集合称为总体,或直接称X为总体。X的分布也就是总体的分布。二、随机样本从总体X中抽出若干个个体称为样本,一般记为(X1,X2,…,Xn)。n称为样本容量。而对这n个个体的一次具体的观察结果——(x1,x2,…,xn)是完全确定的一组数值,但它又随着每次抽样观察而改变。(x1,x2,…,xn)称为样本观察值。如果样本(X1,X2,…,Xn)满足(1)代表性:样本的每个分量Xi与X有相同的分布;(2)独立性:X1,X2,…,Xn是相互独立的随机变量,则称样本(X1,X2,…,Xn)为简单随机样本。总体、样本、样本观察值的关系总体样本样本观察值理论分布统计是从手中已有的资料——样本观察值,去推断总体的情况——总体分布。样本是联系两者的桥梁。总体分布决定了样本取值的概率规律,也就是样本取到样本观察值的规律,因而可以用样本观察值去推断总体。设总体X的分布为F(x),则样本(X1,X2,…,Xn)的联合分布为),,(),,,(221121nnnxXxXxXPxxxF)()()(2211nnxXPxXPxXPniinxFxFxFxF121)()()()(iipxXP)(样本的联合分布律为1()niiPXx当总体X是连续型时,X~f(x),则样本的联合密度为niinxfxxxf121)(),,,(当总体X是离散型时,其分布律为)()()(),,(22112211nnnnxXPxXPxXPxXxXxXP例5.1设),(~2NX(X1,X2,…,Xn)为X的一个样本,求(X1,X2,…,Xn)的密度。解(X1,X2,…,Xn)为X的一个样本,故),(~2NXiniinxfxxxf121)(),,,(nixie12)(2221niixne122)(2121ni,,2,1例5.3某商场每天客流量X服从参数为λ的泊松分布,求其样本(X1,X2,…,Xn)的联合分布律。解exxXPx!)(,2,1,0x11221(,,,)()nnniiiPXxXxXxPXxniixexi1!nnxexxxnii!!!211三、统计量样本是我们进行分析和推断的起点,但实际上我们并不直接用样本进行推断,而需对样本进行“加工”和“提炼”,将分散于样本中的信息集中起来,为此引入统计量的概念。(X1,X2,…,Xn)g(X1,X2,…,Xn)其中g(x1,x2,…,xn)是(x1,x2,…,xn)的连续函数。如果g(X1,X2,…,Xn)中不含有未知参数,称g(X1,X2,…,Xn)为统计量。(不含未知参数的样本的函数)),(~2NX如2,未知,(X1,X2,…,Xn)为X的一个样本niiXnX11niiX12均为统计量X221iX不是统计量若μ已知,σ2未知,(X1,X2,…,X5)为X的一个样本521,,,maxXXXX几个常用的统计量(P131)样本均值niiXnX11样本方差niiXXnS122)(11样本均方差niiXXnS12)(11样本k阶原点矩nikikXnA11,2,1knikikXXnB1)(1,2,1k样本k阶中心矩样本均值的期望和方差:1111()()()nniiiiEXEXEXnn221111()()()nniiiiDXDXDXnnn样本方差的期望:(1,2,...,)iXin是X的样本,设2(),(),(1,2,...,)iiEXDXin222112222112222221211()(())(())1111((2))()1111(())(())11nniiiinniiiiiniiESEXXEXXnnEXXXXEXnXnnEXnEXnnnnnn5.3几个常用的分布和抽样分布(一)2—分布1、定义:设n个相互独立的X1,X2,…,Xn,Xi~N(0,1),i=1,2,…,n则一、常用分布2—分布、t—分布和F—分布。)(~2122nXnii称为自由度为n的2分布。n个相互独立的服从标准正态分布的随机变量的平方和服从2(n)。2—分布的密度函数f(y)曲线0,00,)(212)2/(212/yyeyyfynnn2、性质(1)nE)(2nD2)(2(2)2分布的可加性)(~121nX)(~222nXX1,X2相互独立,则X1+X2~2(n1+n2)例5.4),(~2NX(X1,X2,X3)为X的一个样本求232221XXX的分布。解因为(X1,X2,X3)为X的一个样本,i=1,2,3则)1,0(~NXii=1,2,3)3(~2232221XXX),(~2NXi3、2分布表及有关计算(1)构成P{2(n)λ}=p,已知n,p可查表(P298)求得λ;(2)有关计算λ2()Pn)(2n水平为的上侧分位数分位点peg1.求解:)10(295.020.95(10)3.9401、定义若X~N(0,1),Y~2(n),X与Y独立,则).(~ntnYXTt(n)称为自由度为n的t—分布。(二)t—分布例5.5),(~2NX(X1,X2,X3)为X的一个样本,求23221)()()(2XXX的分布),(~2NXi)1,0(~NXii=1,2,3)2(~22322XX)2(~223221tXXX)1,0(~1NX)2(~)()()(223221tXXXt(n)的概率密度为tntnnntfn,)1()2()21()(2122、基本性质:(1)f(t)关于t=0(纵轴)对称;(2)f(t)的极限为N(0,1)的密度函数,即3、t分布表(P296)及有关计算(1)构成:P{t(n)λ}=p(2)有关计算P{t(n)tp(n)}=p,tp(n)为水平p的上侧分位数xettftn,21)()(lim22p注:)()(1ntntpp)(1ntp)(ntp(三)F—分布1、定义若X~2(n1),Y~2(n2),X,Y独立,则),(~2121nnFnYnXF称为第一自由度为n1,第二自由度为n2的F—分布,其概率密度为0,00,)1)(2()()/)(2()(2/)(2122122/212121111yyynnnynnnnyhnnnnn例5.6(X1,X2,…,X5)为取自正态总体X~N(0,σ2)的样本求统计量)(2)(32524232221XXXXX的分布解),0(~2NXi)5,,2,1(i)1,0(~0NXXii)2(~22221XX)3(~2252423XXX)3,2(~322524232221FXXXXX)3,2(~)(2)(32524232221FXXXXX2、F分布表(P294)及有关计算(1)构成:P{F(n1,n2)λ}=p(2)有关计算P{F(n1,n2)λ}=pλ=Fp(n1,n2)性质:p11(,)(,)FmnFnm抽样分布总体分布类型已知,但含有未知参数.对总体的未知参数或总体的数字特征进行统计推断,称为参数统计推断.抽样分布:构造合适的统计量,使其服从或渐近服从已知分布,泛称统计量分布为抽样分布.小样本统计推断和大样本统计推断.二、正态总体的抽样分布定理)1,0(~NnXU证明niiXnX11组合,故服从正态分布。niiXEnXE1)(1)(nXDnXDnii212)(1)(),(~2nNX1、若),(~,,,221NXXXiidn则是n个独立的正态随机变量的线性)1,0(~NnXU2、设(X1,X2,…,Xn)是正态总体N(μ,σ2)的样本,则(1)(2)(3)X与S2独立P143~144定理1,2)1(~)1(222nSn222211()()niiXn例5.7.设X1,…,X10是取自N(2,16)的样本,求a及样本方差的期望与方差解:10122)(91iiXXS)9(~16922S95.0}409169{}25{22aSPaSP299{}0.051640940sPaa196.75a95.0}25{2aSP20.05(9)16.9193、设(X1,X2,…,Xn)是正态总体N(μ,σ2)的样本,则)1(~ntnSX证明(X1,X2,…,Xn)是正态总体N(μ,σ2)的样本,则由分布定理1、2可知)1,0(~NnX)1(~)1(222nSnX与S2独立且所以由t分布的定义,可知)1(~)1()1(22ntnSXnSnnX4、(双正态总体的抽样分布)设(X1,X2,…,Xn1)是N(μ1,σ12)的样本,(Y1,Y2,…,Yn2)是N(μ2,σ22)的样本,且相互独立,S12,S22是样本方差,则(1)(2))1,1(~2122222121nnFSSF称为混合样本方差。12221212()()~(0,1)XYUNnn*2212121212222112212()~(2)1/1/(1)(1)2wwXYTtnnSnnnSnSSnn(3)进称为样。一步,假定,就有,其中混合本方差例5.9设总体X~N(10,32),(X1,X2,…,X6)是它的一个样本,设61iiXZ(1)写出Z所服从的分布;(2)求P(Z11)。解因为(X1,X2,…,X6)是X~N(10,32)的一个样本,因此Xi~N(10,32),且Xi相互独立,i=1,2,…,6,所以)36,60(~261NXZiiP(Z11))11(1ZP3660111)668.6(11)668.6(