第五章数理统计的基础知识5.1数理统计的基本概念习题一已知总体X服从[0,λ]上的均匀分布(λ未知),X1,X2,⋯,Xn为X的样本,则().(A)1n∑i=1nXi-λ2是一个统计量;(B)1n∑i=1nXi-E(X)是一个统计量;(C)X1+X2是一个统计量;(D)1n∑i=1nXi2-D(X)是一个统计量.解答:应选(C).由统计量的定义:样本的任一不含总体分布未知参数的函数称为该样本的统计量.(A)(B)(D)中均含未知参数.习题2观察一个连续型随机变量,抽到100株“豫农一号”玉米的穗位(单位:cm),得到如下表中所列的数据.按区间[70,80),[80,90),⋯,[150,160),将100个数据分成9个组,列出分组数据计表(包括频率和累积频率),并画出频率累积的直方图.解答:分组数据统计表组序号12345组限组中值组频率组频率%累计频率%70∼807533380∼9085991290∼10095131325100∼110105161661110∼120115262667组序号6789组限组中值组频率组频率%累计频率%120∼130125202087130∼1401357794140∼1501454498150∼16015522100频率直方图见图(a),累积频率直方图见图(b).习题3测得20个毛坯重量(单位:g),列成如下简表:毛坯重量185187192195200202205206频数11111211毛坯重量207208210214215216218227频数21112121将其按区间[183.5,192.5),⋯,[219.5,228.5)组,列出分组统计表,并画出频率直方图.解答:分组统计表见表组序号12345组限组中值组频数组频率/%183.5,∼192.5192.5,∼201.5201.5,∼210.5210.5,∼219.5219.5,∼228.518819720621522432861151040305频率直方图见下图习题4某地区抽样调查200个居民户的月人均收入,得如下统计资料:月人均收入(百元)5-66-77-88-99-1010-1111-12合计户数18357624191414200求样本容量n,样本均值X¯,样本方差S2.解答:对于抽到的每个居民户调查均收入,可见n=200.这里,没有给出原始数据,而是给出了整理过的资料(频率分布),我们首先计算各组的“组中值”,然后计算X¯和S2的近似值:月人均收入(百元)5-66-77-88-99-1010-1111-12合计组中值ak5.56.57.58.59.510.511.5-户数fk18357624191414200X¯=1n∑kakfk=1200(5.5×18+⋯+11.5×14)=7.945,S2≈1n-1∑k(ak-X¯)2fk=1n-1∑kak2fk-X¯2=1199(5.52×18+⋯+11.52×14)-7.9452≈66.0402-63.123025=2.917175.习题5设总体X服从二项分布B(10,3100),X1,X2,⋯,Xn为来自总体的简单随机样本,X¯=1n∑i=1nXi与Sn2=1n∑i=1n(Xi-X¯)2分别表示样本均值和样本二阶中心矩,试求E(X¯),E(S2).解答:由X∼B(10,3100),得E(X)=10×3100=310,D(X)=10×3100×97100=2911000,所以E(X¯)=E(X)=310,E(S2)=n-1nD(X)=291(n-1)1000n.习题6设某商店100天销售电视机的情况有如下统计资料日售出台数k23456合计天数fk2030102515100求样本容量n,经验分布函数Fn(x).解答:(1)样本容量n=100;(2)经验分布函数Fn(x)={0,x20.20,2≤x30.50,3≤x40.60,4≤x50.85,5≤x61,x≥6.习题7设总体X的分布函数为F(x),概率密度为f(x),X1,X2,⋯,Xn为来自总体X的一个样本,记X(1)=min1≤i≤n(Xi),X(n)=max1≤i≤n(Xi),试求X(1)和X(n)各自的分布函数和概率密度.解答:设X(1)的分布函数和概率密度分别为F1(x)和f1(x),X(n)的分布函数和概率密度分别为Fn(x)和fn(x),则Fn(X)=P{X(n)≤x}=P{X1≤x,⋯,X(n)≤x}=P{X1≤x}P{X2≤x}⋯P{Xn≤x}=[F(x)]n,fn(x)=F′n(x)=n[F(x)]n-1f(x),F1(x)=P{X(1)≤x}=1-P{X(1)x}=1-P{X1x,X2x,⋯,Xnx}=1-P{X1x}P{X2x}⋯P{Xnx}=1-[1-P{X1≤x}][1-P{X2≤x}]⋯[1-P{Xn≤x}]=1-[1-F(x)]n,F′1(x)=f1(x)=n[1-F(x)]n-1f(x).习题8设总体X服从指数分布e(λ),X1,X2是容量为2的样本,求X(1),X(2)的概率密度.解答:f(x)={λe-λx,x00,其它,F(x)={1-e-λx,x00,x≥0,X(2)的概率密度为f(2)(x)=2F(x)f(x)={2λe-λx(1-e-λx),x00,其它,又X(1)的概率密度为f(1)(x)=2[1-F(x)]f(x)={2λe-2λx,x00,其它.习题9设电子元件的寿命时间X(单位:h)服从参数λ=0.0015的指数分布,今独立测试n=6元件,记录它们的失效时间,求:(1)没有元件在800h之前失效的概率;(2)没有元件最后超过3000h的概率.解答:(1)总体X的概率密度f(x)={(0.0015)e-0.0015x,x00,其它,分布函数F(x)={1-e-0.0015x,x00,其它,{没有元件在800h前失效}={最小顺序统计量X(1)800},有P{X(1)800}=[P{X800}]6=[1-F(800)]6=exp(-0.0015×800×6)=exp(-7.2)≈0.000747.(2){没有元件最后超过3000h}={最大顺序统计量X(6)3000}P{X(6)3000}=[P{X3000}]6=[F(3000)]6=[1-exp{-0.0015×3000}]6=[1-exp{-4.5}]6≈0.93517.习题10设总体X任意,期望为μ,方差为σ2,若至少要以95%的概率保证∣X¯-μ∣0.1σ,问样本容量n应取多大?解答:因当n很大时,X¯-N(μ,σ2n),于是P{∣X¯-μ∣0.1σ}=P{μ-0.1σX¯μ+0.1σ}≈Φ(0.1σσ/n)-Φ(-0.1σσ/n)=2Φ(0.1n)-1≥0.95,则Φ(0.1n)≥0.975,查表得Φ(1.96)=0.975,因Φ(x)非减,故0.1n≥1.96,n≥384.16,故样本容量至少取385才能满足要求.5.2常用统计分布习题1对于给定的正数a(0a1),设za,χa2(n),ta(n),Fa(n1,n2)分别是标准正态分布,χ2(n),t(n),F(n1,n2)分布的上a分位点,则下面的结论中不正确的是().(A)z1-a(n)=-za(n);(B)χ1-a2(n)=-χa2(n);(C)t1-a(n)=-ta(n);(D)F1-a(n1,n2)=1Fa(n2,n1).解答:应选(B).因为标准正态分布和t分布的密度函数图形都有是关于y轴对称的,而χ2分布的密度大于等于零,所以(A)和(C)是对的.(B)是错的.对于F分布,若F∼F(n1,n2),则1-a=P{FF1-a(n1,n2)}=P{1F1F1-a(n1,n2)=1-P{1F1F1-a(n1,n2)由于1F∼F(n2,n1),所以P{1F1F1-a(n1,n2)=P{1FFa(n2,n1)=a,即F1-a(n1,n2)=1Fa(n2,n1).故(D)也是对的.习题2(1)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布?(1)X1-X2X32+X42;解答:因为Xi∼N(0,1),i=1,2,⋯,n,所以:X1-X2∼N(0,2),X1-X22∼N(0,1),X32+X42∼χ2(2),故X1-X2X32+X42=(X1-X2)/2X32+X422∼t(2).习题2(2)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布?(2)n-1X1X22+X32+⋯+Xn2;解答:因为Xi∼N(0,1),∑i=2nXi2∼χ2(n-1),所以n-1X1X22+X32+⋯+Xn2=X1∑i=2nXi2/(n-1)∼t(n-1).习题2(3)2.设总体X∼N(0,1),X1,X2,⋯,Xn为简单随机样本,问下列各统计量服从什么分布?(3)(n3-1)∑i=13Xi2/∑i=4nXi2.解答:因为∑i=13Xi2∼χ2(3),∑i=4nXi2∼χ2(n-3),所以:(n3-1)∑i=13Xi2/∑i=4nXi2=∑i=13Xi2/3∑i=4nXi2/(n-3)∼F(3,n-3).习题3设X1,X2,X3,X4是取自正态总体X∼N(0,22)的简单随机样本,且Y=a(X1-2X2)2+b(3X3-4X4)2,则a=?,b=?时,统计量Y服从χ2分布,其自由度是多少?解答:解法一Y=[a(X1-2X2)]2+[b(3X3-4X4)]2,令Y1=a(X1-2X2),Y2=b(3X3-4X4),则Y=Y12+Y22,为使Y∼χ2(2),必有Y1∼N(0,1),Y2∼N(0,1),因而E(Y1)=0,D(Y1)=1,E(Y2)=0,D(Y2)=1,注意到D(X1)=D(X2)=D(X3)=D(X4)=4,由D(Y1)=D[a(X1-2X2)]=aD(X1-X2)=a(D(X1)+22D(X2))=a(4+4×4)=20a=1,D(Y2)=D[b(3X3-4X4)]=bD(3X3-4X4)=b(9D(X3)+16D(X4))=b(4×9+16×4)=100b=1,分别得a=120,b=1100.这时Y∼χ2(2),自由度为n=2.解法二因Xi∼N(0,22)且相互独立,知X1-2X2=X1+(-2)X2∼N(0,20),3X3-4X4=3X3+(-4)X4∼N(0,100),故X1-2X220∼N(0,1),3X3-4X4100∼N(0,1),为使Y=(X1-2X21/a)2+(3X3-4X41/b)2∼χ2(2),必有X1-2X21/a∼N(0,1),3X3-4X41/b∼N(0,1),与上面两个服从标准正态分布的随机变量比较即是1a=20,1b=100,即a=120,b=1100.习题4设随机变量X和Y相互独立且都服从正态分布N(0,32).X1,X2,⋯,X9和Y1,Y2,⋯,Y9是分别取自总体X和Y的简单随机样本,试证统计量T=X1+X2+⋯+X9Y12+Y22+⋯+Y92服从自由度为9的t分布.解答:首先将Xi,Yi分别除以3,使之化为标准正态.令X′i=Xi3,Y′i=Yi3,i=1,2,⋯,9,则X′i∼N(0,1),Y′i∼N(0,1);再令X′=X′1+X′2+⋯+X′9,则X′∼N(0,9),X′3∼N(0,1),Y′2=Y′12+Y′22+⋯+Y′92,Y′2∼χ2(9).因此T=X1+X2+⋯+X9Y12+Y22+⋯+Y92=X1′+X2′+⋯+X9′Y′12+Y′22+⋯+Y′92=X′Y′2=X′/3Y′2/9∼t(9),注意到X′,Y′2相互独立.习题5设总体X∼N(0,4),而X1,X2,⋯,X15为取自该总体的样本,问随机变量Y=X12+X22+⋯+X1022(X112+X122+⋯+X152)服从什么分布?参数为多少?解答:因为Xi2∼N(0,1),故Xi24∼χ2(1),i=1,2,⋯,15,而X1,X2,⋯,X15独立,故X12+X22+⋯+X1024∼χ2(10),X112+X1