第三章应用数理统计抽样分布

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三章抽样分布一、抽样二、随机抽样三、抽样分布3.1抽样一、抽样的概念•如果所获得的数据是研究对象的全部,这组数据就构成一个总体•如果所获得的数据只是这一总体所构成的集合的某一个子集,它就是一个样本二、抽样的类别•判断性抽样:根据专家意见选择样本•随机抽样:概率抽样3.2随机抽样一、基本概念1.总体:试验的全部可能的观测值2.个体:试验的每一个观测值称为个体3.总体的容量:总体中所包含的个体数4.有限总体和无限总体:总体容量为有限的称有限总体,否则称为无限总体3.2随机抽样一、基本概念•对某个总体而言,个体的取值是按一定规律分布的,即总对应着一个随机变量X,对总体的研究实际上是对一个随机变量X的研究•一个总体就是一个具有确定概率分布的随机变量例:对某天生产的产品进行质量检验,以0表示正品,1表示次品。假设出现次品的概率为p(常数),则总体由0和1组成,这一总体对应一个参数为p的(0-1)分布的随机变量,即我们就将它看作是(0-1)分布总体,即总体中的观测值是(0-1)分布随机变量的可能取值。1,0,)1(1xppxXPxx3.2随机抽样二、随机抽样的定义1.抽样:从总体中抽取有限个个体对总体进行观测的过程2.样本:从总体中抽取一部分个体,根据获得的数据对总体分布进行推断,被抽出的部分个体叫总体的一个样本3.2随机抽样二、随机抽样的定义在相同的条件下我们对总体X进行n次重复的、都独立的观测,将n次观测结果按试验的次序记为X1,X2,…Xn,由于它们是对随机变量X观测的结果,且每次观测是在相同的条件下独立进行的,故可以认为X1,X2,…Xn是相互独立的,且都是与总体X具有相同分布的随机变量。这样得到的X1,X2,…Xn称为来自总体X的一个简单随机样本,n称为这个样本的容量。当n次观测结束后,我们得到一组实数x1,x2,…,xn,它们依次是随机变量X1,X2,…,Xn的观测值,称为样本值。3.2随机抽样二、随机抽样的定义•有限总体的简单随机抽样:假设总体容量为N(有限),样本容量为n(N),如果所有容量为n的样本都有相同的概率可以从总体中被抽取到,则称此方法为有限总体的简单随机抽样•常用做法:利用随机数表3.2随机抽样二、随机抽样的定义系统抽样,分层抽样和整群抽样-近似随机抽样•系统抽样:按一定原则或规律性进行抽样,如隔n天搜集一次数据等,适合于数据没有系统性或周期性变化的情况,在时间和费用上较节约•分层抽样:将总体分成许多阶层,每个阶层都是一个团体,要求做到每个团体内的个体差异较小,而各阶层之间的差异较大。然后在每个阶层内进行随机抽样,其样本容量可以按各阶层占总体比例的大小而定•整群抽样:总体分组后,从总体中随机抽取n组,这n组个体组成一个样本3.2随机抽样二、随机抽样的定义•一个样本中的每个个体必须取自同一个总体•取得任一个体的概率都不影响取得另外一个个体的概率3.3抽样分布一、统计量•设X1,X2,…,Xn是来自总体X的一个样本,g(X1,X2,…Xn)是X1,X2,…,Xn的函数(如均值,方差),若函数g(X1,X2,…Xn)不含有任何未知参数,则称g(X1,X2,…Xn)是一个统计量。如果x1,x2,…,xn是相应于样本X1,X2,…,Xn的样本值,则称g(x1,x2,…,xn)是统计量g(X1,X2,…Xn)的观测值•统计量也是一个随机变量3.3抽样分布•最常用的统计量:样本矩阶中心矩称为样本的统计量阶原点矩,称为样本的统计量为样本标准差,称统计量为样本方差,称统计量为样本均值,称统计量是这一样本的观测值,的一个样本,是来自总体设kkXXnkkXnXXnSXXnXnxxxkniiknikikniiniiniinn...3,2,)(1B,...3,2,1A)(11S)(11S1X,...,X,....XX,X112122121-21213.3抽样分布•这些统计量的观测值分别为:...3,2,)(1b,...3,2,1,1a)(11s)(11s1x112122121-kxxnkxnxxnsxxnxnkniiknikikniiniinii,,,,抽样分布的形成(samplingdistribution)总体计算样本统计量如:样本均值、比例、方差、矩样本从抽样推断总体的依据大数定理•一般意义:在随机试验过程中,虽然每次观察的结果不同,但大量重复观察出现的结果的平均值却几乎总是接近某个确定值。•实质:一般的规律性表现在大量的事实中。它依靠大量的观察,使个别的、偶然的差异性相互抵消,显现出总体的、必然的规律性,揭示了大量随机变量的平均趋势。•证明了抽样平均数将趋近于总体平均数,为抽样分析提供了科学依据。1.在重复选取容量为n的样本时,由样本均值的所有可能取值形成的相对频数分布2.一种理论概率分布3.推断总体均值的理论基础样本均值的抽样分布样本均值的抽样分布【例】设一个总体,含有4个元素(个体),即总体单位数N=4。4个个体分别为x1=1,x2=2,x3=3,x4=4。总体的均值、方差及分布如下总体分布14230.1.2.3均值和方差5.21NxNii25.1)(122NxNii样本均值的抽样分布现从总体中抽取n=2的简单随机样本,在重复抽样条件下,共有42=16个样本。所有样本的结果为•3,4•3,3•3,2•3,1•3•2,4•2,3•2,2•2,1•2•4,4•4,3•4,2•4,1•4•1,4•4•1,3•3•2•1•1,2•1,1•1•第二个观察值•第一个•观察值•所有可能的n=2的样本(共16个)样本均值的抽样分布计算出各样本的均值,如下表。并给出样本均值的抽样分布•3.5•3.0•2.5•2.0•3•3.0•2.5•2.0•1.5•2•4.0•3.5•3.0•2.5•4•2.5•4•2.0•3•2•1•1.5•1.0•1•第二个观察值•第一个•观察值•16个样本的均值(x)x样本均值的抽样分布1.000.10.20.3P(x)1.53.04.03.52.02.5样本均值的分布与总体分布的比较=2.5σ2=1.25总体分布14230.1.2.3抽样分布P(x)1.00.1.2.31.53.04.03.52.02.5x5.2x625.02x几个常用的抽样分布•正态分布•卡方分布•t分布•F分布•基于正态总体样本的均值与方差的分布正态分布•密度函数:正态分布是一个连续分布,形状呈钟型,中心为μ,两边对称,两个参数μ和σ2分别表示它的均值与离散程度。...14159.3,0,,])(21exp[21)(2xxxf式中,dezZPzz222222221)()(10NZ1(Z)0,E(Z)Z-XZXE(X)N:标准化正态变量的数值),(为为标准正态变量,简记称学期望和方差分别是:也是正态变量。它的数,则随机变量令)(,它的两个特征值是的正态分布。和方差)表示具有均值,(我们将用正态分布之曲线较陡峭大时,曲线较平缓,反轴为渐近线,当时,曲线以当处有拐点时对称,在处,曲线在点在在正态分布中,最大值xxxxxX中心极限定理=50=10X总体分布n=4抽样分布xn=165x50x5.2x当总体服从正态分布N(μ,σ2)时,来自该总体的所有容量为n的样本的均值x也服从正态分布,x的数学期望为μ,方差为σ2/n。即x~N(μ,σ2/n)中心极限定理当样本容量足够大时(n30),样本均值的抽样分布逐渐趋于正态分布nx中心极限定理:设从均值为,方差为2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为μ、方差为σ2/n的正态分布一个任意分布的总体xx中心极限定理x的分布趋于正态分布的过程抽样分布与总体分布的关系总体分布正态分布非正态分布大样本小样本正态分布正态分布非正态分布0,)2(210,02222222212212122)()()(~X...XX)1,0(,...,XyeynynnynnyfnnnNXX分布的密度函数为:分布,记为的服从自由度为的样本,则称统计量是来自总体设分布2图3.2.1值的,附表可查不同分位点分布的上为的数,称满足等式,且对于给定的数分布的上分位点、)(分布的数学期望和方差、)(~独立,则和,且设,设分布的可加性、分布的性质:)()45()()()()(1032)(,E2)(~)(~1222)(2222222122221222122221221222nnnndyyfnPnDnnnnnn分布的性质2图3.2.2分布t图3.2.3tntnnnntfntntttnnYXtnYNn,)1()2()21();()()(~YX),(~)1,0(~X2122分布的密度函数为:分布,记为的服从自由度为独立,则称统计量与且设,设分布t图3.2.4表格可供查阅分位点分布的上称为的数,称满足等式:,且对于给定的数。布分布近似于标准正态分充分大时,即当可以证明,独立,则称统计量与且设,设)()();()(10)1,0(21);(limYX),(~)1,0(~X)(222ntntdtntfnttPNtnentfnYNnttn分布F图3.2.50,)(1)2()2())(2(0,0212121212122122212121121212121),;(),(),(~),(/U/FVU)(~V),(~UynynnnynnnnynnnnnnyfnnFnnFFFnnnVnnn分布的密度函数为:分布,记为的服从自由度为独立,则称随机变量与且设设分布F图3.2.6表格可供查阅要性质:分位点,该点有如下重分布的上称为的数,称满足等式:,且对于给定的数),(F1),(F),(),(),;(),(101221-12121),(212121nnnnnnFnnFdynnyfnnFFPnnF几种分布的特征一览分布随机变量样本空间参数均值方差形状标准正态Z无01对称nn2n右偏tn0对称Fn1,n2右偏2)(2n)(nt),(21nnF),(),0(),(),0(2,2222nnn2,2nnn2,)4)(2()2(222212122nnnnnnn)1(~S/),(,...,3)1(~)1(),(,...,2),(),(,...,12221222222212221ntnXSXNXXXnSnSXSXNXXXnNXXNXXXnnn均值和样本方差,则分别为样本,的样本,是来自正态总体、设独立,且与均值和样本方差,则分别为样本,的样本,是来自正态总体、设~为样本均值,则的样本,是来自正态总体、设基于正态总体样本的均值与方差的分布22122221121212122221212221222121222211211211222211221121,2)1)1)2(~11)())2()1,1F(n~//1)(11,)(111,1),(),(,...,,,...,42121((其中,(时,当)则(方差,分别代表这两个样本的以均值,分别代表这两个样本的以相互独立。的样本,且这两个样本和是分别来自正态总体和、设基于正态总体样本的

1 / 37
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功