第六章样本及抽样分析总体与样本在实际问题中,往往并不知道是什么样分布,或者分布中的参数值是什么,这需要用数理统计的办法来解决。从全体研究对象中抽取部分个体(有限)进行试验,尽可能从中获取对研究对象统计规律作出精确可靠的推测-统计推断。统计学最关心的是:①如何抽取数据②如何从数据中提取信息③所得结论的可靠性--抽样问题--参数估计问题--假设检验问题统计学的研究对象:客观事物总体的数量特征和数量关系等。第六章样本及抽样分析总体与样本总体,母体(研究对象)个体(组成总体的元素)随机变量X可能取值的全体对总体X的一次观测表现为:某个指标表现为:一次观测值抽样—总体中抽取一部分个体的过程;样本—抽样得到X的一组数据;样本容量(大小)—样本中的个体数量第六章样本及抽样分析总体与样本从总体抽取容量为n的样本,即对随机变量X随机地、独立地进行n次观测,每个结果也看成一个随机变量:它们互相独立,且与总体X服从相同的分布。一次观测的结果:nXXX,,,21nnxXxXxX===,,,2211样本可看成n维随机变量(),则有nXXX,,,21)()()(),,,(nnxPxPxPxxxP2121=)()()(),,,(nnxfxfxfxxxf2121=或独立同分布178.4161.5174.9182.7171.0165.3172.8182.1180.2176.8181.7175.7177.3180.0179.4177.0181.3176.5176.0175.7168.1184.6169.1177.8175.1161.8174.3176.0163.7176.8177.3175.3180.2176.8181.9178.4181.5177.6179.9178.2174.7176.0175.7180.3166.2177.2171.9182.9176.8179.5167.0174.8182.7174.9178.1179.9175.4184.4175.1179.4173.2176.1177.6180.5164.3170.5177.5168.3173.0176.8173.9180.7166.5180.0165.6179.4182.2176.3177.4183.4167.9176.1177.4183.4176.9168.0179.0178.8173.1173.2162.2179.9178.2183.0174.0180.8173.1173.2176.8171.1169.0178.3171.6181.2167.6161.1166.0190.2180.3166.2174.9175.8176.5164.2173.0176.8170.5180.5177.3175.3163.7176.8171.1168.5171.2170.2177.1169.4175.7177.3183.2168.6175.1179.4169.1169.9168.5180.2174.9171.0171.0168.8177.7168.6176.6175.9176.8179.5174.3176.0身高总体第六章样本及抽样分析统计量--是样本的函数,用来对总体的未知参数进行推断,故其中不含有未知的总体参数。常用的统计量2SS其观测值用小写表示。2211SnnBXA统计量也是随机变量样本均值样本方差k阶原点矩k阶中心矩标准差∑nikikXXnB1)(1∑nikikXnA11∑niiXXnS122)(11nXXXXn)(21第六章样本及抽样分析例有一组样本观测值为(5,4,6,5),计算其样本均值、样本方差、2阶原点矩和3阶中心矩。4/102)5645(4122222a3/2)01)1(0(3122222s0)01)1(0(4133333b54)5645(x第六章样本及抽样分析2.设总体X~N(a,b),其中a已知,b未知。再设X1,X2,X3是取自总体X的一个样本。那么,函数(1)X1+X2+X3;(2)X2+2a;(3)X1;(4)max{X1,X2,X3};(5)∑Xi2/b中哪些是统计量?练习第六章样本及抽样分析4.设X~B(1,p),X的一组观察值为0,1,0,1,1,那么样本均值的观察值=,样本方差的观测值=。6.0)11010(515151iixx练习48.1)11010(416.045415122iix51225122)6.0(41)6.0(41iiiixxs3.0第六章样本及抽样分析抽样分布统计量是不含未知量的样本函数,也是随机变量。统计量的分布称抽样分布。当总体分布已知时,抽样分布也确定了,但这些分布很难求出。总体样本统计量概率抽样分布估计/推断抽样性质:可加性:期望与方差:E(Y)=n,D(Y)=2n第六章样本及抽样分析几种常用的统计量分布(一)分布设来自总体X~N(0,1)的样本,则称统计量为服从自由度n的分布。(自由度乃独立的随机变量的个数)即2nXXX,,,2122221nXXXY)(~)(~),(~21221222121nnYYnYnY则,独立2)(~2nYX1,X2,……,Xn来自标准正态总体X的样本,那么265243221)()()(XXXXXXY是否服从卡方分布?若kY~χ2(n),求k,n第六章样本及抽样分析抽样分布(二)t-分布相互独立,则称随机变量服从自由度为n的t-分布T~t(n)。YXnYNX,),(~),1,0(~2nYXT/第六章样本及抽样分析抽样分布性质:•对称性:•n→∞,密度函数趋向标准正态分布;)()(ntnt11-αα分位点查表抽样分布往往由α制成上分位点表α分位点(0α1)指将密度曲线下面的面积按比例α划分的点,有左(侧)分位点和右(侧)分位点,后者也称上分位点。深绿面积占整个面积的5分之一,那么点x称为5分之一右侧分位点,记为x0.2对给定的α(概率值),若则称为f(x)的α上分位点。)(xXPx)}()({22nnPnα=0.9950.990.9750.95……0.050.0250.010.005……………………………102.1562.5583.2473.940……18.30720.48323.20925.188112.6033.0533.8164.575……19.67521.92024.72526.757123.0743.571.4.4045.226……21.02623.33726.21728.299133.5654.1075.0095.892……22.36224.73627.68829.819144.0754.6605.6296.571……23.68526.11929.14130.319…………………………………………………………自由度右侧尾部概率上分位点如:查找自由度为12的卡方分布,关于右侧尾部概率0.05的上分位点?查表练习:求下列各式中的C值),20,10(),5,10(),9,4(.501.0)(),15(~.405.0)(),6(~.395.0)(),40(~.21.0)(),24(~.19.01.005.022FFFCYPtYCYPtYCYPYCYPY)()(ntnt1第六章样本及抽样分析正态总体统计量的分布来自正态总体的样本,其样本均值和样本方差的分布性质:nXXX,,,21),(2NniiniiXXnSXnX1221)(11,1),(~)(),,(~102NnXnNX)(~)(11222nSn相互独立2,SX)1(~ntnSX第六章样本及抽样分析正态总体统计量的分布),(~)(),,(~102NnXnNXnXnDXDXnEXENXniiniii211211)(,)(),,(~),(~nNX2关于统计量样本均值的分布)(~)(11222nSn2112222111)1(niiniiXXXXnnSn0111XnXXXniinii正态总体统计量的分布)1(~221nXXnii第六章样本及抽样分析只有n—1个独立的随机变量第六章样本及抽样分析正态总体统计量的分布)1(~1),1,0(~/2222nSnNnX)1(~ntnSX)1(~11)(222ntnSXnSnnX第六章样本及抽样分析1.设正态分布N(100,100)的有一个容量为10的样本,其样本均值服从______,样本方差乘以____后服从分布。2.已知来自正态总体的样本均值和样本方差,(1)查什么分布表可以确定的值?(2)服从什么分布?3.设总体有两个容量分别为10和15的两个样本均值比较两个概率大小。4.X~B(1,p),求5.X~N(15,2),有两个容量为10和15的两个样本,求其样本均值差的绝对值小于0.2的概率。)(92),(20N)|(|aXPSXn/),(~2NX),|(|),|(|.,221121XPpXPpXX)(,)(2SEXD第六章样本及抽样分析正态总体统计量的分布例1110kV电网的电压波动值V(单位:kV)服从正态分布N(110,5.52)。随机测试16次电压值,试问其样本均值与总体均值的偏差小于4kV的概率?)375.1,110(~),165.5,110(~,)5.5,110(~222NVNVNV解:91.2375.1110375.14375.1110}4|110{|VPVPVP996.01998.021)91.2(2第六章样本及抽样分析正态总体统计量的分布例2110kV电网的电压波动值V(单位:kV)服从正态分布。随机测试16次电压值,试问其样本均值与总体均值的偏差小于4kV的概率?)15(2191.291.291.2375.1375.14375.1}4|{|91.2tTPVPVPVP99.0005.021)15(2191.2t),1(~ntnSVT由解:若样本标准差S=5.5第六章样本及抽样分析正态总体统计量的分布例3已知一批螺栓的直径D(单位:cm)服从正态分布N(20,0.052)。从中任取36个,问其平均直径落在区间(19.98,20.02)内的概率?),3605.0,20(~,)05.0,20(~22NDND解:4.26/05.0206/05.002.06/05.020}02.2098.19{DPDPDP9836.019918.021)4.2(2第六章样本及抽样分析正态总体统计量的分布例4求证)(~)()()()()(22112121212122221121nntnnnnnnSnSnYXT),(~),,(~2221NYNX),(~),,(~),,(~221221222121nnNYXnNYnNX)1,0(~)/1/1()()(22121NnnYXU)(~),(~1111222222122121nSnnSn)2(~1121222222121nnSnSnV)(~)/(222121nntnnVUT证明:第七章参数估计参数估计区间估计点估计极大似然估计矩估计参数估计是对已知分布类型的总体,利用样本对其未知参数作出估计点估计用样本的统计量来估计总体的未知参数θ,就是点估计。(一)矩估计法用样本矩估计总体矩的方法),,,(ˆˆnXXX21原点矩总体矩样本矩一阶矩二阶矩