第二章数理统计的基本概念与抽样分布数理统计是研究大量随机现象统计规律的一门数学科学,以概率论为基础:(1)收集、整理和分析受到随机性影响的数据(2)为随机现象选择和检验数学模型(3)推断和预测随机现象的性质、特点和统计规律(4)为决策提供依据和建议具体内容:基本概念经验分布函数和直方图常用统计分布抽样分布顺序统计量与样本极差充分统计量§2.1数理统计的几个基本概念一、总体和样本总体:研究对象的全体个体:每一个研究对象总体的容量:总体中所含有的个体的总数N例:任何一个灯泡的寿命事先是不能确定的,而每一个灯泡都确实对应着一个寿命值,所以可以认为灯泡的寿命是一个随机变量。总体随机变量研究对象的某个指标抽样:在总体中抽取一定数量的个体进行观测抽样方法原则:1)总体中每个个体被抽到的机会均等2)抽取一个个体后总体的成分不改变简单随机样本(样本):.,,,)(21nXXXnX重复独立观测次进行随机变量在不变条件下对总体无限总体无放回抽样有限总体有放回抽样样本容量:抽样次数n很小Nn简单随机抽样的特点:(1)代表性;与总体有相同的分布每一个iX(2)独立性:是相互独立的nXXX,,,21样本值:样本抽定后的具体数据定理:的联合分布函数为的样本,则是来自总体若),,,()(),,,(2121nnXXXxFXXXniixF1)(例:写出下列样本的联合概率函数的样本为来自于总体),(,,,)1(221NXXXn的样本为来自于总体),1(,,,)2(21pBXXXn解:的联合概率密度函数为nXXX,,,)1(21niinxfxxxg121)(),,,(2212)(exp21inix2122)(exp21niinx的分布律为nXXX,,,)2(21niiinnxXPxXxXxXP12211)(),,,(nixxiipp11)1(niiniixnxpp11)1(knkpp)1(。的个数,中为观测值其中nkxxxkn,,1,01),,,(21二、统计量对数据进行加工、提炼和压缩,把样本中所含的有关信息集中起来。统计量:不含有任何未知参数的样本的函数设为来自总体的一个样本,nXX,1),(~2NX已知,未知其中2,问下列随机变量中那些是统..)(;)(;;2);,,,min(12211121nnXXXXnXXXXXXXnnnnn例:计量:抽样分布:统计量的分布常用统计量:niiXnX11样本均值:niiniiXnXnXXnS122122][11)(11样本方差:niiXXnSS122)(11样本标准差:,2,11)(1kXnAknikik矩:原点阶样本,2,1)(11kXXnknikik阶中心矩:样本§2.2经验分布函数和直方图出现的次数次独立重复观测中在表示随机事件nxXxvn}{)()).(,(~)(xFnBxvn一、经验分布函数经验频数经验分布函数:nxvxFnn)()(按值从小到大排序把样本值nxxx,,,21)()2()1(nxxx则1,,2,110)()()1()()1(nkxxxxxnkxxxFnkkn经验分布函数的性质:是分布函数)1()()()()]([:)()2(xFnxvExFnxvEnn样本函数随机变量依概率收敛01)()(lim)3(xFxFPnn)(1)()4(xFxFn布函数一致收敛于它的理论分以概率10|)()(|suplimxFxFPnxn(格里纹科定理)二、直方图离散型:iipaXPX)(布列为为离散型随机变量,分设总体的次数次重复独立观测中出现在表示事件令naXvii}{nviipPn1p2p3p4pnv1nv2nv3nv4连续型:为未知的度为连续型随机变量,密设总体)(xfXmabmba个子区间,其长度为,等分成对任一有限区间],[baaaaamm110中的个数区间中落在次重复独立观测得样本表示],(,,,121iiniaaXXXnv1)(}{1iiaaiidxxfaXaPnviP充分大时,当nm,mabafnvii)(定义函数:,,时,有当1,,1,0)(1miabmnvxfaxainii简称为直方图。上的频率直方图的图形为在区间称,),[),[)(babaxfn)()(xfxfn小区间个数:52)1(87.1nm§2.3常用统计分布一、分布2的样本,为来自于正态总体设)1,0(),(1NXXn2212nXX则称统计量:)(~222nn记为分布。的是所服从的分布为自由度定义1:常用的结论:的为来自,而若总体XXXXNXn),,,()1,0(~)1(21一个样本,则统计量)(~212nXnii的为来自,而若总体XXXXNXn),,,(),(~)2(212一个样本,则统计量)(~)(12122nXnii2222)21()()(~)3(nittn的特征函数为,则若。,并且nDnE222定理1:变量的分布密度为的自由度为2n000)2(21)(2122xxexnxfxnn函数。为其中)0()(01sdtetsts19n=2时,其密度函数为是参数为1/2的指数分布.21,02()0,0xexfxx定理2:)(2分布的可加性,则,为独立的随机变量,且若nknkkn,,2,1)(~,,,2222221.~1122nknkkkn定理3:。,则若随机变量)1,0(~2)(~222Nnnn定理4:(Fisher定理),则设)(~22n1222n-L)1,0(N.n21设X是一个取值于区间[a,b],具有概率密度f(x)的连续型随机变量;又设y=g(x)处处可导,且对于任意x,恒有或恒有;则Y=g(X)是一个连续型随机变量,它的概率密度为0)(xg0)(xg举例,先复习一个定理,0,Ydhyfhyyfydy其它22,0,Ydhyfhyyfydy其它min,maxaxbaxbgxgx其中,x=h(y)是y=g(x)的反函数定理(续)23例设总体,且()Xfx,0,()00,0.xexfxx其中2122()2(2)nTXXXnXn121,0,()20,0.xexfxx12X证明由:于的密度为为抽自总体X的样本,则12,,,nXXX22恰好是参数为的分布242122()2(2)nTXXXnXn得到212,,,nXXX又由独立同分布,根据分布的可加性25例:设总体,为来自总体的样本。令试确定C使CY服从分布,并指出其自由度。)4,0(~NX1021,,XXX2106251jjiiXXY226解:由已知条件有),20,0(~51NXii),20,0(~106NXii所以),1,0(~201511NXYii),1,0(~2011062NXYii12,YY且相互独立)2(~20122221YYY故二、t分布定义2:随机变量,则,独立,且,设)(~)1,0(~2nYNXYXnYXt。分布,记为称为变量,它所服从的分布的称为自由度为)(~nttttn注:独立,则,,且,若YXnYNX)(~),(~222).(~ntnYXt定理5:的分布函数为,则若tntt)(~2121221)(nnxnnnxf定理6:,则,其分布密度记作设)()(~)(xfnttnt.21)(lim2)(2xntnexf29lim(;)0tftn性质1:密度函数关于y轴对称,且221lim;e2tnftn性质2:中间高,两边低,左右对称,且0,(1),(2)2nETnDTnn;性质3:设T~t(n),则30例设X与Y相互独立,X~N(0,16),Y~N(0,9),X1,X2,…,X9与Y1,Y2,…,Y16分别是取自X与Y的简单随机样本,求统计量1292221216XXXYYY所服从的分布解129~(0,916)XXXN1291()~(0,1)12XXXN311~(0,1),1,2,,163iYNi216211~(16)3iiY12921611121316iiXXXY~(16)t1292221216XXXYYY从而三、F分布定义3:随机变量,则,独立,且,设)(~)(~22nYmXYXnYmXF).,(~),(nmFFFFnm分布,记为分布为变量,它所服从的的称为自由度为由定义可得:33性质1~(,),~(,)XFmnFnmX1则性质22~(),~(1,)TtnTFn设则定理7:的分布密度为),(nmF000)(222)(21222xxnmxxnmnmnmxfnmmnm四、分位数定义4:使得,若满足,实数的分布函数为设随机变量xxFX10)()()(xFxXP分位点。为此概率分布的则称x常用分布分位数的说明,有分位点记作的标准正态分布uNU)1,0(~)1(.1uu0)()()(~)2(2222nnn,的分位数记作,对于。,并且221221)(45nunn,有的分位点记作,对于)()()(~3ntntt)()(1ntnt。,有并且当untn)(450),(),(),(~)4(nmFnmFnmFF,的分位点记作,对于性质:),(1),(1mnFnmF证明:。,则若),(~1),(~mnFXnmFX),(1mnFXP由此.),(1mnFXP及分位数的定义得由),(~nmFX)),((1nmFXP即得.),(1),(1mnFnmF.),(1mnFXP§2.4抽样分布,则,相互独立,且设随机变量niNXXXXiiin,,2,1),(~,,,221).,(~12211niiiniiiniiikkNXk样本,则是它的一个,设总体nXXXNX,,,),(~212一、正态总体的样本均值和方差的分布定理1:推论1:).,(~12211niiniiniiikkNXk推论2:样本,则是它的一个,设总体nXXXNX,,,),(~212),(~2nNX推论3:为两个正态总体和设YX的样本,为,XXXXNXn1,,,),(~21211的样本,为,YYYYNYn2,,,),(~21222且这两个样本独立,则).,(~22212121nnNYX复习:多元正态分布的密度函数是则,,并且若YNYYYYmm0||),(~)',,,(21yyyfmm121'21exp21)(其中',,,21mEYEYEYmmija),cov(jiijYYa.,,2,1,mji结论:。,则,若)',(~),(~AAANZAYZNY定理4:的样本,则是来自于正态总体设),(),