第二节抽样分布-仲恺农业工程学院

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二节抽样分布一.统计量1.定义6.2.1假定X1,…,Xn是来自总体X的一组样本,g(·)是一个完全已知的函数,则称g(X1,…,Xn)是一个统计量。当样本X1,…,Xn有了观察值x1,…,xn以后,统计量g(X1,…,Xn)的相应的观察值就是g(x1,…,xn)。统计量自身带有总体中未知参数的信息,但统计量的表达式中不能出现任何未知的参数。Remark把样本“加工”成统计量,含有“数据压缩”的意思{X1,…,Xn}→g(X1,…,Xn)对于要解决的不同的统计问题,必须构造出不同的统计量去处理。例6.2.1X1,X2,…,Xn是来自总体X~N(,02)的一组样本。其中是未知的参数,02已知。下面哪些是统计量?相应地又服从是什么分布?XknkkXn11nkkXn11Xk0—二.常用的统计量1.表示“平均”的统计量:样本均值、中位数、众数2.表示“变差”的统计量:样本方差(或标准差)、极差1.1样本均值(Samplemean)如两组样本数据:{2,4,6,8,10}与{4,5,6,7,8}样本均值都是6,即平均程度都相同。反映了样本这组数据的(算术)平均值nkkXXn111.2样本中位数(Median)1.3众数(Mode)样本按照取值大小排列后居中的那个样本。例如:n奇数:{2,1,6,4,3}3n偶数:{2,1,6,4,3,7}3+4/2=3.5样本数据中出现次数最多的样本,例如:{1,1,3,3,4,2,3,8}3(1).中位数比样本均值更为稳健,当二者相差不大时常采用样本均值表示数据平均,否则应该用中位数。Remark(2).样本的众数适用于离散的总体2.样本方差(Samplevariance)S称为是样本标准差(Standarddeviation),与样本均值量纲相同。反映了样本的离散程度。如两组样本数据:{2,4,6,8,10}与{4,5,6,7,8}样本均值都是6,但S12=10,S22=2.5;第二组数据相对于均值6更为集中。nkkSXXn2211()1(1).极差计算简单,但是不如样本标准差稳健。(2).对于大多数单峰对称分布,标准差大约等于极差的四分之一。(3).大多数情况下,数据基本上落在“均值±2个标准差”的区间内,否则这个数据就被认为是异常的大或异常的小。在绝大多数情况下,一组正常的数据基本上落在“均值±3个标准差”的区间内。Remark例6.2.2关于平均值的理解样本均值是人们采用最多的一种描述数据的方法,它反映了一组数据整体上的一些信息,然而容易掩盖一些极端的情况,所以有时候样本均值不一定合理。思考1.甲同学听说,有个身高1.75米的成年人在平均水深为1米的小河中淹死了,他觉得不可思议。这件事情是否是一个玩笑?思考2.一位统计学家把一只脚放进100℃的开水里,另一只脚放进冰水中。然后宣布:现在,在平均值的意义上,我感觉很舒服。例6.2.3乙同学毕业后求职于一家公司。总经理说,公司平均月薪是3000元。一个月后乙同学得到工资1000元,据了解,公司共有21人,和自己职位相同的业务员共有10人,每人的月薪都是1000元。应该如何理解乙同学的遭遇?总经理15,000;两个副总经理每人8,000;3个部门经理每人4000;5个财务等行政人员每人2000;10个业务员每人1000。一共21人,每月支出工资63,000。平均值3000,中位数2000,众数1000,极差14,000下面是某高速公路上发生的交通事故有关数据:速度km/h数量小于70大于18070~18012323丙同学由此得出结论说:统计数据显示,在高速公路上,汽车速度越高,也就越安全。实际上绝大多数的汽车行驶速度都在70~180,因此发生事故的次数也就多。例6.2.4关于正确解释统计数据三.统计学中的三大分布1.卡方分布1.1卡方分布的构造如果X1,…,Xn独立同分布于N(0,1),则称K2=X12+X22+…+Xn2~2(n)卡方分布具有“可加性”X、Y独立,X~2(n1),Y~2(n2)则X+Y~2(n1+n2)独立标准正态平方和的分布xokn(x)1.2卡方分布的上侧分位点假定X~2(n),给定:0<<1,如果一个数c满足:P{X>c}=,则称这个数c是自由度n的卡方分布的上侧分位点(数),记成2(n)。2(n)2.t分布2.1t分布的构造如果X、Y独立,并且X~N(0,1),Y~2(n);则称:服从自由度为n的t分布,记为T~t(n)。XTYn/独立标准正态与卡方商的分布2.2t分布的双侧分位点假定X~t(n),给定:0<<1,如果一个数c满足:P{|X|>c}=,则称这个数c是自由度n的t分布的双侧分位点(数),记成t/2(n)。/2oxtn(x)t/2(n)–t/2(n)/2对称分布的双侧分位点就是上侧/2分位点/2ox(x)u/2–u/2/2记为:u/2如:双侧0.05分位点u0.025=1.96标准正态分布N(0,1)的双侧分位点3.F分布3.1F分布的构造X、Y独立并且X~2(m),Y~2(n);则称F=———服从自由度(m,n)的F分布,记为F~F(m,n)X/mY/n两个独立卡方商的分布练习6.2.5如果T~t(n),证明T2~F(1,n)四.(正态总体)的抽样分布定理6.2.1样本均值与样本方差的分布假定X1,X2,…,Xn是来自总体X~N(,2)的一组简单随机样本;与S2分别是样本均值与样本方差。X(3)与S2独立。XnXN()(1)~(0,1)nSn222(1)(2)~(1)定理6.2.2一个正态总体的抽样分布对于一个方差未知的正态总体,可以用这个定理来构造区间估计或者检验与期望有关的假设。假定X1,X2,…,Xn是来自总体X~N(,2)的一组简单随机样本;与S2分别是样本均值与样本方差。则有:XnXtnS()~(1)

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功