一、数理统计基础知识1.在一本书上我们随机地检查了10页,发现每页上的错误数为4560314214试计算样本均值、样本方差和样本标准差。解样本均值12454310nxxxxn样本方差222221114353433.7819niisxxn,样本标准差21.94ss2.设有容量为n的样本A,它的样本均值为Ax,样本标准差为As,样本极差为AR,样本中位数为Am。现对样本中每一个观测值施行如下变化yaxb如此得到样本B,试写出样本B的均值、标准差、极差和中位数。解不妨设样本A为12,,,nxxx,样本B为12,,,nyyy,且iiyaxb,1,2,,,in1212nnBAyyyaxbaxbaxbyaxbnn,222221111()()11nnBiBiAiisyyaxbaxbasnn,因而BAsas.111BAnnnRyyaxbaxbaxxaR,1212212nBnnymyy3.设1,,nxx是来自1,1U的样本,试求()Ex和()Varx。解均匀分布1,1U的均值和方差分别为0和13,该样本的容量为n,因而得()0Ex,1()3Varxn4.设116,,xx是来自(8,4)N的样本,试求下列概率(1)(16)(10)Px;(2)(1)(5)Px解(1)16(16)(16)11616(10)1(10)1(10)1081(())10.84130.93702PxPxPx(2)161616(1)(1)58(5)((5))(1())[(1.5)]0.33082PxPx。5.在总体(7.6,4)N中抽取容量为n的样本,如果要求样本均值落在(5.6,9.6)内的概率不小于0.95,则至少为多少?解样本均值4(7.6,)xNn,从而按题意可建立如下不等式5.67.67.69.67.6(5.69.6)()0.95444xPxPnnn,即2()10.95n,所有()0.975n,查表,(1.96)0.975,故1.96n或3.84n,即样本量n至少为4。6.设116,,xx是来自2(,)N的样本,经计算9x,25.32s,试求(||0.6)Px。解因为22||()/(1)(1)/(1)xnxntnsnsn,用15()tx表示服从(15)t的随机变量的分布函数,注意到t分布是对称的,故154(||)40.6(||0.6)()2(1.0405)1xPxptss。利用统计软件可计算上式,譬如,使用MATLAB软件在命令行中输入tcdf(1.0405,15)则给出0.8427,直接输入2*tcdf(1.0405,15)-1则给出0.6854。这里的(,)tcdfxk就表示自由度为k的t分布在x处的分布函数。于是有(||0.6)20.842710.6854Px。7.设1,,nxx是来自(,1)N的样本,试确定最小的常数c,使得对任意的0,有(||)Pxca。解由于1(,)xNn,所以(||)Pxca的值依赖于,它是的函数,记为()g,于是,()(||)()(())(())gPxcPcxcncnc,其导函数为()[(())(())]gnncnc其中()x表示(0,1)N的密度函数,由于0c,0,故||||cc,从而(())(())ncnc,这说明()0g,()g为减函数,并在0处取得最大值,即0max{(())(())}()()2()1ncncncncnc于是,只要2()1nca,即(1)/2(0)/acnu就保证对任意的0,有(||)Pxca。最大的常数为(1)/2/acnu。8.设12,xx是来自2(0,)N的样本,试求21212()xxYxx的分布。解由条件,212(0,2)xxN,212(0,2)xxN,故2212()(1)2xx,2212()(1)2xx又121212(,)()()0CovxxxxVarxVarx,且12xx与12xx服从二元正态分布,故12xx与12xx独立,于是22121221212(()/2)()(1,1)(()/2)xxxxYFxxxx。9.设总体为(0,1)N,12,xx为样本,试求常数k,使得212221212()()0.05()()xxPkxxxx。解由上题,21212()(1,1)xxYFxx,212221212()()()1xxYZxxxxY,由于Z取值于(0,1),故由题目所给要求有01k,从而()()()0.0511YkPZkPkPYYk。于是0.95(1,1)161.451kFk,这给出161.450.99381161.45k。10.设11,,,nnxxx是来自2(,)N的样本,则11niixxn,2211()1nninisxxn,试求常数c使得1nncnxxtcs服从t分布,并指出分布的自由度。解由条件:21~(,)nxN,2~(,)nxNn,222(1)~(1)nnsn,且1nx,nx,2ns相互独立,因而22211~(0,)(0,)nnnxxNNnn,故2112211()/()/)~(1)(1)/(1)nnnnnnnnxxxxnnttnsnsn。这说明当1ncn时,1~(1)nncnxxtctns,自由度为1n。二、点估计11.从一批电子元件中抽取8个进行寿命测试,得到如下数据(单位:h):1050,1100,1130,1040,1250,1300,1200,1080试对这批元件的平均寿命以及寿命分布的标准差给出矩估计。解样本均值10501100113010801143.758x,样本标准差8211()7iisxx221[(10501143.75)(10801143.75)]796.0562因此,元件的平均寿命和寿命分布的标准差的矩估计分别为1143.75和96.0652.12.设总体~(0,)XU,现从该总体中抽取容量为10的样本,样本值为0.5,1.3,0.6,1.7,2.2,1.2,0.8,1.5,2.0,1.6试对参数给出矩估计。解由于()/2EX,即2()EX,而样本均值0.51.31.61.3410x,故的矩估计为ˆ22.68x。13.设总体密度函数如下1,,nxx是样本,试求未知参数的矩估计。(1)22(;)(),0,0pxxx;(2)(;)(1),01,0pxxx;(3)1(;),01,0pxxx;(4)1(;,),,0xpxex。解(1)总体均值22200221()()()3EXxxdxxxdx,即3()EX,故参数的矩估计为ˆ3x。(2)总体均值101()(1)2EXxxdx,所以12()()1EXEX,从而参数的矩估计12ˆ1xx(3)由110()1EXxxdx,可得2()()1()EXEX,由此,参数的矩估计2ˆ()1xx。(4)先计算总体均值与方差00111()xttEXxedxtedtedt,222011()()xtEXxedxtedt220001112xtttedttedtedt2222,222()()(())VarXEXEX由此可以推出()VarX,()()EXVarX,从而参数,的矩估计为ˆs,ˆxs。14.甲、乙两个校对员彼此独立对同一本书的样稿进行校对,校完后,甲发现a个错字,乙发现b个错字,其中共同发现的错字有c个,试用矩估计法给出如下两个未知参数的估计:(1)该书样稿的总错字个数;(2)未被发现的错字数。解(1)设该书样稿中总错字的个数为,甲校对员识别出错字的概率为1p,乙校对员识别出的错字的概率为2p,由于甲、乙是彼此独立地进行校对,则同一错别字能被甲、乙同时识别的概率为12pp,根据频率替换思想有1212ˆˆ,,abcpppp。由独立性可得矩法方程abc,解之得ˆabc。(2)未被发现的错字数的估计等于总错字数的估计减去甲、乙发现的错字数,即ababcc。譬如,如设120,124,80abc,则该书样稿中错字总数的矩法估计为120124ˆ18680,而未被发现的错字个数的矩法估计为1861201248022个。15.设总体概率函数如下,1,,nxx是样本,试求未知参数的最大似然估计。(1)1(;),01,0pxxx;(2)(1)(;),,0pxcxxcc已故,1。解(1)似然函数为11()()()nnLxx,其对数试然函数为1()ln(1)(lnln)2nnlnLxx。将ln()L关于求异并令其为0即得到似然方程1ln()1(lnln)022nLnxx。解之得211ˆ(ln)niixn。由于42ˆ223/23ˆln(ln)ln()()0244iixxLnn,所以ˆ是的最大似然估计(2)似然函数为(1)1()()nnnLcxx,其对数似然函数为1ln()lnln(1)(lnln)nLnncxx。将ln()L关于求异并令其为0得到似然方程1ln()ln(lnln)0nLnncxx,解之可得111ˆ(lnln)niixcn。由于222ln()0Ln,这说明ˆ是的最大似然估计。16.设总体概率函数如下,1,,nxx是样本,试求未知参数的最大似然估计。(1)(1)(;)ccpxcx,,0,0xc已知;(2)1(;,),,0xpxex;(3)1(;)(),(1),0Pxkxk。解(1)样本1,,nxx的似然函数为(1)(1)1{0}()()nnccnxLcxxI。要使()L达到最大,首先示性函数应为1,其次是nc尽可能大。由于0c,故nc是的单调增函数,所以的取值应仅可能大,但示性函数的存在决定了的取值不能大于(1)x,由此给出的最大似然估计为(1)x。(2)此处的似然函数为111()()exp{()}nniiLx,(1)x。其对数似然函数为1()ln(,)lnniixLn由上式可以看出,ln(,)L是的单调增函数,要使其最大,的取值应该尽可能的大,由于限制(1)x,这给出的最大似然估计为(1)ˆx。将ln(,)L关于求异并令其为0得到关于的似然估计方程12()ln(,)0niixL