河南理工大学精品课程概率论与数理统计总体与样本统计量χ2-分布,t-分布和F-分布关于正态总体的重要定理第六章数理统计的基本概念河南理工大学精品课程概率论与数理统计数理统计是以概率论的理论为基础、通过试验所得数据来研究随机现象的一门数学分支,应用广泛,内容丰富。简介我们仅介绍其有关参数估计与参数假设检验等基本内容。概率论是数理统计的理论基础,数理统计是概率论的重要应用。河南理工大学精品课程概率论与数理统计§1、随机样本定义1在数理统计中,将所研究对象的全体称为总体(母体),其中每个对象称为个体。由于通常关注的是研究对象的某些个数量指标,因此也称这些数量指标取值的全体为总体,其中每个元素称为个体.一、总体与个体例如,检验灯泡厂生产的灯泡寿命:受检的全体灯泡就是总体,每个灯泡就是个体。也可理解:全体灯泡寿命数值构成总体,每个灯泡的寿命数值为一个体。河南理工大学精品课程概率论与数理统计又如,调查工大男生身高情况:工大全体男生就是总体,每个工大男生就是一个个体。也可理解:全体工大男生身高数值构成总体,每个工大男生身高数值就是一个个体。灯泡的寿命检验是一个破坏性试验,即当得知一个灯泡寿命时,该灯泡的使用价值也就消失了.因此,不可能抽检每个灯泡!可以逐一测量每个工大男生的身高,但工作量大.而我们仅需对工大男生身高情况有个大致了解,因此,不必要抽测每个工大男生!河南理工大学精品课程概率论与数理统计做法从总体中随机地抽取若干个体(灯泡、工大男生),测试其所需数据(寿命、身高),最后对所得数据通过整理加工和分析来推断总体(这批灯泡寿命、工大男生身高)的分布情况,从而了解整体情况.一般,我们所研究的总体的某项数量指标X是一个随机变量,其取值在客观上有一定的分布.因此,对总体的研究,就是对相应的随机变量X的研究。今后,我们称X的分布函数和数字特征分别为总体的分布函数和数字特征,并不再区分总体与相应的随机变量X.对总体的称呼:总体,总体X与总体F.河南理工大学精品课程概率论与数理统计例如,当X~N(μ,σ2)时,称总体X为正态总体.正态总体有以下三种类型:①μ未知,但σ2已知;②σ2未知,但μ已知;③μ,σ2均未知.河南理工大学精品课程概率论与数理统计数理统计的基本任务就是通过对从总体中抽取的一部分个体(称为总体的样本)进行观察,根据所记录的数据(样本值)经整理与加工,以推断总体的某些性质.“从总体中抽取一个个体”就是对总体进行一次观察(试验),并记录其数据结果.在相同条件下对总体X进行n次独立、重复的观察,将n次试验结果依次记为,则称之为来自总体X的容量为n的一个简单随机样本;n次试验完成后所得样本的一组观察值称为样本值.nXXX,,,21nxxx,,,21二、样本与样本值河南理工大学精品课程概率论与数理统计定义2显然,若X的分布函数为F(x),则的联合分布函数为nXXX,,,21).(),,,(121*niinxFxxxF独立定义2设总体X的分布函数为F,若X1,X2,…,Xn是相互独立且具有相同分布函数F的n个随机变量,则称之是来自总体F(分布函数F,总体X)的容量为n的(简单随机)样本,其观察值称为样本值。nxxx,,,21特别的,若X的概率密度为f(x),则的联合概率密度为nXXX,,,21河南理工大学精品课程概率论与数理统计).(),,,(121*niinxfxxxf若X的概率分布为p(x),则的联合概率分布为nXXX,,,21).(),,,(121*niinxpxxxp河南理工大学精品课程概率论与数理统计样本来自总体,必然携带有反映总体性质的各种信息。后面介绍的内容仅限于有关总体参数的估计与推断,称为参数估计与参数假设检验。三、数理统计的基本任务数理统计的基本任务就是通过对样本的研究来对总体的未知参数或分布类型作出估计,对有关总体的假设作出推断。河南理工大学精品课程概率论与数理统计总体X样本X1,X2,…,Xn样本值x1,x2,…,xn随机抽样获得样本完成试验获得数据整理加工统计推断统计工作河南理工大学精品课程概率论与数理统计§2、抽样分布一、统计量样本是进行统计推断的依据。但在实际应用时,一般不是直接使用样本本身,而是对样本进行整理和加工,即针对具体问题构造适当的函数—统计量,利用这些函数来进行统计推断,揭示总体的统计特性.定义3设X1,X2,…,Xn是来自总体X的样本,x1,x2,…,xn为其样本值,则称不含任何总体分布中未知参数的连续函数为统计量,相应实数称为其观察值。),,,(21nXXXg),,,(21nxxxg河南理工大学精品课程概率论与数理统计常用统计量有:niiXnX11样本均值(修正)样本方差212)(11XXnSnii(修正)样本标准差212)(11XXnSSnii样本k阶原点矩),2,1(11kXnAnikik样本k阶中心矩),2,1()(11kXXnBnikik河南理工大学精品课程概率论与数理统计说明(修正)样本方差还可表示为][112122XnXnSnii212)(11XXnSnii]2[1112112nininiiiXXXXn]2[112122XnXnXnnii][11212XnXnnii【推导】)2(11212XXXXnniii河南理工大学精品课程概率论与数理统计样本方差212*)(1XXnSnii21Snn样本均值是样本一阶原点矩;样本方差是样本二阶中心矩。上述各统计量的观察值为niixnx11212)(11xxnsnii),2,1(11kxnanikik),2,1()(11kxxnbnikik河南理工大学精品课程概率论与数理统计重要结论:样本矩(的连续函数)依概率收敛于总体矩(的连续函数)[矩估计的理论基础]。),2,1()(kXEkk总体k阶(原点)矩总体的期望就是其一阶矩:1)(XE总体的方差:22221)]([)()(XEXEXD河南理工大学精品课程概率论与数理统计定义)0()(10xdttexxt性质);0()()1(xxxx;1)1()2(;!)1(nn);1(212102xxdttext.2212102dtet重要积分补充知识:Γ-函数河南理工大学精品课程概率论与数理统计完全由样本确定的函数就是统计量。定义设X1,X2,…,Xn是来自标准正态总体N(0,1)的样本,称统计量222212nXXX下面,介绍来自正态总体的几个重要统计量的分布.1、χ2-分布(卡方分布)服从自由度为n的χ2-分布,记为).(~22n二、抽样分布统计量是随机变量,它的分布称为抽样分布。河南理工大学精品课程概率论与数理统计-分布的概率密度为)(2n.,0,0,)2/(21)(2122/其它xexnxfxnnxO)(xf1n5n15n河南理工大学精品课程概率论与数理统计-分布的性质与数字特征)(2n-分布的可加性:)(2n)(~,),(~),(~2122212nnYXYXnYnX独立且-分布的期望与方差为:)(2n.2)(,)(22nDnE上α分位点(双侧α/2分位点)定义点为分布的上α分位点)(2n)(2n).10()}({22nP河南理工大学精品课程概率论与数理统计查附表5[P.443]:.156.2)10(,304.6)12(2995.029.0)(),(22/22/1nn双侧分位点查附表5:,262.6)15()15(,025.02,05.02975.022/1488.27)15()15(2025.022/河南理工大学精品课程概率论与数理统计2、t-分布定义设且X与Y独立,则称随机变量),(~),1,0(~2nYNXnYXt/服从自由度为n的t-分布,记为).(~nttt-分布的概率密度为122[(1)/2]()1()(/2)nnxfxxnnn河南理工大学精品课程概率论与数理统计t-分布的概率密度性质xO)(xf1n10nnt-分布的概率密度为偶函数,且以标准正态概率密度为其极限(n→∞)。河南理工大学精品课程概率论与数理统计上α分位点(双侧α/2分位点)定义点为分布的上α分位点)(nt)(nt).10()}({nttP查附表3[P.441]:.6041.4)4(,3060.2)8(005.0025.0tt河南理工大学精品课程概率论与数理统计xO)(xf)(2/nt2/)(2/1nt2/双侧α/2分位点:)(),(2/2/1ntnt显然,)()(2/2/1ntnt河南理工大学精品课程概率论与数理统计3、F-分布定义设且X与Y独立,则称随机变量),(~),(~2212nYnX21//nYnXF服从自由度为(n1,n2)的F-分布,记为).,(~21nnFFF-分布的概率密度为.,0,0,)]/(1)[2/()2/()/](2/)[()(2212112221212111其它xnxnnnxnnnnxfnnnn河南理工大学精品课程概率论与数理统计xO)(xf25,1021nn5,1021nnF-分布的性质),(~1),(~1221nnFFnnFF由F分布定义可得:河南理工大学精品课程概率论与数理统计xO)(xf),(21nnF上α分位点(双侧α/2分位点)定义点为分布的上α分位点),(21nnF),(21nnF).10()},({21nnFFP查附表5[P.447]:F分布上α分位点有如下性质:),(1),(12211nnFnnF357.080.21)12,9(1)9,12(05.095.0FF:分位点具有如下性质分布的上F.),(1),(12211nnFnnF证明)},({1211nnFFP所以),(11211nnFFP),(111211nnFFP,),(111211nnFFP),,(~21nnFF因为,),(11211nnFFP故),,(~112nnFF因为,),(112nnFFP所以,),(),(11221-1nnFnnF比较后得.),(1),(12211nnFnnF即)9,21(59.0F例)12,9(105.0F28.01.357.0.分位点的一些上用来求分布表中未列出河南理工大学精品课程概率论与数理统计三、样本均值与样本方差的分布设总体X有均值与方差:,)(,)(2XDXE是来自X(无论X服从何种分布!)的一个样本,则总有:nXXX,,,21.)(,)(2nXDXE).,(~2nNX特别的,当时,样本均值),(~2NX河南理工大学精品课程概率论与数理统计对于单正态总体N(μ,σ2)的均值与方差有:定理1设是来自正态总体N(μ,σ2)的样本,则nXXX,,,21);1(~)1(222nSn①、②、).,(~2nNX③、2,SX④、独立.);1(~/ntnSX注意:),1(~221nXXnii).(~221nXnii即2卡方分布定义).1(~/,,,),(,,,2221ntnSXSXNXXXn则有方差分别是样本均值和样本样本的是总体设证明),1,0(~/NnX因为),1(~)1(222nSn且两者独立,由t分布的定义知)1()1(