第6.1—6.2节数理统计学中的基本概念数理统计的任务:观察现象,收集资料,创建方法,分析推断。统计推断:伴随着一定概率的推测。其特点是:由“部分”推断“整体”。总体:研究对象的全体(整体)。个体:每一个研究对象。实际上是对总体的一次观察。有限总体无限总体第六章随机样本及抽样分布总体等同于相应的随机变量的全体研究对象体现为量指标值的全体研究对象的某项数可看作取值的全体某个随机变量样本:由部分个体构成的集合。经常说,来自(或取自)某总体的样本。样本具有二重性:在抽样前,它是随机向量,在抽样后,它是数值向量(随机向量的取值)。样本选择方式:(1)有放回抽样.(2)无放回抽样特别,样本容量总体数量时,无放回抽样可近似看作有放回抽样.简单随机样本(s.r.s):具有两个特点的样本:代表性(组成样本的每个个体与总体同分布),独立性(组成样本的个体间相互独立)。样本容量:样本中所含个体的个数。如,检验一批灯泡的质量,从中选择100只,则总体:这批灯泡(有限总体)个体:这批灯泡中的每一只样本:抽取的100只灯泡(简单随机样本)样本容量:100样本观测值:x1,x2,…,x100定义:设X为一随机变量,其分布函数为F(x),X1,X2,…,Xn是一组独立且与X同分布的随机变量,称X为总体;(X1,X2,…,Xn)为来自总体X(或分布函数F(x))的简单随机样本;n为样本容量在依次观测中,样本的具体观测值x1,x2,…,xn称为样本值XX1,X2,…,X100100样本值注意:样本是一组独立同总体分布相同的随机变量.总体选择个体样本观测样本样本观察值(数据)数据处理样本有关结论统计的一般步骤:推断总体性质统计量为了集中简单随机样本所带来的总体信息,考虑样本的函数,且不含任何未知参数,这样的“不含未知参数的样本的函数”称为统计量。是来自总体例6.2.1设nXXX,,,21),(2N未知,则()不是统计量。的s.r.s,其中已知,n2122221n1i2σμXn1n1i2in1n1i2in1n1iin1...XXX2[6]σXX[5])([4])X(X[3])(X[2]X[1]i统计量定义:设X1,X2,…,Xn是来自总体X的一个样本,g(X1,X2,…,Xn)是n维随机变量的函数,若g中除样本的函数外不含任何未知参数,则称g(X1,X2,…,Xn)为统计量.统计量的分布称为抽样分布.①样本均值常用统计量:②样本方差③样本标准差④样本k阶原点矩⑤样本k阶中心矩n1iiXn1Xn1i2i2)XX(1n1Sn1i2i)XX(1n1Sn1ikikXn1An1ikik)XX(n1B(6)顺序统计量与样本分布函数设X1,X2,…,Xn的观察值为x1,x2,…,xn,从小到大排序得到:x(1),x(2),…,x(n),定义X(k)=x(k),由此得到的(X(1),X(2),…,X(n))或它们的函数都称为顺序统计量.显然X(1)X(2)…X(n)且有X(1)=min(X(1),X(2),…,X(n)),X(n)=max(X(1),X(2),…,X(n))1)样本中位数为偶数为奇数nXXnXMdnnn,21,122)21(2)样本极差R=X(n)-X(1)样本分布函数(经验分布函数))()1()()1(,1)1,,2,1(,,,0)(nkknxxnkxxxnkxxxF}{),,(,)(xXPppnBxnFn这里服从二项分布是一个随机变量格里汶科定理:设总体X的分布是F(x),则下式成立10)()(suplimxFxFPnxn第6.3节抽样分布一、样本均值的分布定理:设X1,X2,…Xn是来自总体N(,2)的样本,X是样本均值,则有n,N~X2注:在大样本情况下,无论总体服从何种分布均有n,N~X2二、顺序统计量的分布1、(X(1),X(2)…X(n))的概率密度函数为其它!,0xxx,xfnx,,x,xgn21n1iin212、样本中位数的概率密度函数为xfxF1xF1]2n[n]2n[nxf1]2n[n]2n[Md!!!3、样本极差的概率密度函数为其它,00x,dttftxftFtxF1nnxf02nR其中xdttfxF)z(z1-α例6.3.1设X~N(0,1),分别为0.95,0.975,0.75,求X关于的100%分位数.Xφ(x)三、标准正态分布及其100%分位数定义:设X~N(0,1),对任意01,若P{Xλ}=,则称λ为标准正态分布的100%分位数,记为z解:=0.95时,95.0)z(95.0反查表得:z0.95=1.64类似可得:z0.975=1.96,z0.75=0.69-z分布及其性质21.定义:称n个相互独立同标准正态分布的随机变量的平方和X的分布为自由度为n的分布,记作2)n(~X2(2)X1,X2,…Xk独立,Xi~(ni),(i=1,2,…,k),则2)n...nn(~Xk212k1ii2.性质:(1)X1,X2,…Xn独立,Xi~N(0,1),(i=1,2,…,n),则)n(~X2n1i2i(3)X1,X2,…Xn为来自总体N(,2)的简单随机样本,则四、n~X2n1i2i(4)n2)n(D,n)n(E22例6.3.2设是来自总体的s.r.s,则服从()分布。nXXX,,,21),(2NniXi12)(例6.3.3设是取自总体N(0,4)的s.r.s,当a=,b=时,).2(~2X243221)43()2(XXbXXaX4321,,,XXXX解(1)服从)n(2(2)由题意得)1,0(N~)X4X3(b)1,0(N~)X2X(a43211)]X4X3(b[D1)]X2X(a[D4321a=1/20b=1/1003.的密度曲线)(2nXf(x)n=1n=4n=10随着n的增大,密度曲线逐渐趋于平缓,对称.4.分布的100%分位数2定义:设,对于给定的(01),若P{Xλ}=,则称λ为自由度为n的分布的100%分位数,记为)(~2nX2)(2nXf(x)1)n(2查表求100%分位数:(1)若P{Xλ}=,则)(2n(2)若P{Xλ}=,则)(21n例6.3.4.设X~(10),P{Xλ1}=0.025,P{Xλ2}=0.05,求λ1,λ2.2解:)10(2975.01查表得:483.201)10(205.02查表得:940.32五、t分布及其性质1.定义设随机变量,随机变量Y且它们互相独立,则称随机变量的分布为自由度是n的t分布,记作)1,0(N~X)n(~2).(~ntTnY/XT可以证明t分布的概率密度函数为)t()nt1()2n(n2)1n()t(h21n2特点:关于y轴对称;随着自由度的逐渐增大,密度曲线逐渐接近于标准正态密度曲线.2.t分布的密度曲线:Xf(x)3、t分布的性质2tn2e21)t(hlim(1)(2))2n(2nn)T(D,0)T(E(3)h(t)的图形关于Y轴对称)n(t4.t分布的100α%分位数:Xf(x)对于给定α(0α1),若P{t(n)λ}=α,则称λ为t分布的100α%分位数,记为:)n(t1-α例6.3.5.设t~t(15),求(1)α=0.995(2)α=0.005的100α%分位数;解:(1)λ=t0.995(15),查表得λ=2.9467(2)λ=t0.005(15),查表得λ=-2.9467注:)n(t)n(t1例6.3.6(974)设随机变量X和Y相互独立且都服从正态分布,而和分别是来自总体X和Y的s.r.s,则统计量服从()分布,参数为().)9,0(N91,,XX91,,YY292191YYXXUt9解:),1,0(N~X91X91ii)1,0(N~3Yi故)9(~91)3(2912912iiiiYYY与独立,YX所以)9(~9/tYXU六、F分布及其性质1.定义设随机变量随机变量且它们相互独立,则称随机变量的分布为自由度是的F分布。记作),n(~U12),n(~V2221n/Vn/UF)n,n(21)n,n(F~F21可以证明,)n,n(F21的概率密度函数为0y0,0y,nyn1)2n()2n(ynn2nn)y(2nn212112n2n212121112.F分布的概率密度曲线3.性质:)n,n(F~F1),n,n(F~X)1(1221则若25n,10n215,1021nnyO)(y则若),n,n(F~X)2(21)2n(2nn)F(E222)4n(4n2nn4n2n2n)F(D2222121224.F分布的100α%分位数Xf(x)设F~,对于给定α(0α1),若P{Fλ}=α,则称λ为F分布的100α%分位数,记为:),(21nnF)n,n(F211)n,n(F215.100α%分位数的计算(1)若P{Fλ}=α,则)n,n(F21(2)若P{Fλ}=α(α比较小),则P{1/F1/λ}=1-α,)]n,n(F~F[21)n,n(F1121故)n,n(F1121例6.3.7设F~F(24,15),分别求满足.025.0}F{P)3(;95.0}F{P)2(;025.0}F{P)1(的 解(1)λ=F0.975(24,15)=2.29(2)λ=F0.95(24,15)=2.70(3)α比较小,P{1/F1/λ}=0.97544.2)24,15(F1975.0所以λ=0.41七、抽样分布基本定理1、设是来自总体的s.r.s,表示样本均值,则nXXX,,,21),(2NX),(N~X2)1,0(N~n/X2、设X~N(μ1,σ12),Y~N(μ2,σ22),X,Y相互独立,从中分别抽取容量为n1,n2的样本,样本均值分别记为Y,X)n,(N~Y),n,(N~X22221211,)YX(E21222121nnYDXD)YX(D)nn,(N~YX22212121)1,0(N~nn)()YX(222121213、定理6.3.3设X1,X2,…,Xn是来自总体),(N2的样本,2S,X分别是样本均值和样本方差,则有)1n(~S)1n(.1222相互独立与2SX.2注:由)1n(2S)1n(D,1nS)1n(E2222可得1n2SD,SE42224、定理6.3.4设X1,X2,…,Xn是来自总体),(N2的样本,2S,X分别是样本均值和样本方差,则有)1n(t~nSX例6.3.8(993)设是来自正态总体X的s.r.s,91,,XXS)YY(297i22i2129873126161121Z,)YX(S),XXX(Y),XX(Y证明:统计量Z~t(2)5、定理6.3.5设1n21X,,X,X与2n21Y,,Y,Y分别是来自总体X,Y的样本且这两个样