4第五章(一)统计推断概述1抽样分布

jjyy1212
1 ℃
2020-01-30

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

1生物统计附试验设计BiostatisticsandExperimentalDesign畜牧、兽医专业2抽样分布参数估计简介假设检验的基本原理第五章（一）统计推断概述3统计推断概述内容1一统计推断的概念二抽样分布的概念三统计量的概率分布-抽样分布四正态总体样本平均数的抽样分布五参数估计4统计推断概述内容一统计推断的概念和内容5一统计推断的概念和内容统计推断：根据抽样分布规律和概率论，由样本统计量来推论总体参数；对未知总体的分布特征进行检验。内容：（1）参数估计（parameterestimation）：用样本统计量估计（点估计、区间估计）总体参数（平均数、方差）。（2）假设检验（hypothesistesting）:又称显著性检验，即利用样本统计量对所属总体的分布特征进行检验。6统计推断概述内容二抽样分布的概念7二抽样分布的概念1随机抽样（randomsampling）：是指总体中每一个个体都有同等的机会被抽取到样本中去，这种抽样方法叫随机抽样。2抽样分布（samplingdistribution）：从一个总体中独立、随机地抽取含量为n的样本，并由样本计算各种统计量，则由样本统计量相对应的随机变量的概率分布为抽样分布。8抽样分布的概念样本统计量的概率分布称为抽样分布样本是通过对总体的随机抽样获得的样本统计量是随机变量，有一定的概率分布若干统计量又组成不同于原总体的新总体，其概率分布为抽样分布简单随机样本抽样是完全随机的-总体中的每个个体都有相同的机会被抽中抽样是彼此独立的-每次抽样的结果都不会影响到其他抽样的结果9统计推断概述内容三统计量的概率分布-抽样分布10三统计量的概率分布-抽样分布原总体样本1样本2样本n1x2x2x新总体n统计量X2分布、F分布正态或t分布111、2(chi-square)分布定义（P156）设有n个随机变量X1,X2,,Xn，彼此独立且都服从标准正态分布N(0,1)，则称随机变量22()iixYXms-==邋服从自由度为n的2分布，记为)(~2nY122分布曲线132分布性质（1）2分布随机变量的取值范围为（0，）（2）2分布的可加性：若Y1~2(n)，Y2~2(m)，且相互独立，则：Y1±Y2~2(n±m)（3）2分布为非对称分布，其分布曲线的形状由自由度决定，自由度越大，分布越趋于对称当n，2(n)N(n,2n)142值表2分布上侧分位数表（P346）：对于Y-2（n），当给定其上侧（右侧）尾部的概率时，该分布在横坐标上的临界值为22()PXaca?15例：df=9，=0.05，查表得：20.05=16.9，意为大于16.9的概率（右侧）为0.05；162、t分布定义（P64）设随机变量Z~N(0,1)，Y~2(n)，且相互独立，则随机变量ZtYn=服从自由度为n的t分布，记为)(t~nt17t分布曲线18t分布性质（1）t分布与标准正态分布相似，是对称分布；关于t=0对称，只有一个峰，峰值在t=0（2）分布曲线受自由度影响，自由度越小，离散程度越大（3）当n，t(n)N(0,1)19t分布与正态分布的比较20t值表t分布双侧分位数表：P337，即对t--t(n)当上侧和下侧两尾概率之和为（每侧为/2）时，t分布在横坐标上的临界值的绝对值。记为：1()Ptttaaa--＃=213F分布定义（P99）若随机变量X~2(m)，Y~2(n)，且相互独立，则随机变量XmFYn=服从自由度为m（第一自由度）和n（第二自由度）的F分布，记为),(F~nmF22F分布曲线23F分布性质（1）F分布随机变量的取值范围为（0，）（2）F分布的分布曲线受两个自由度的影响（3）若F~F(m,n)，则1/F~F(n,m)（4）若t~t(n)，则t2~F(1,n)24F值表F分布的上侧分位数表：P339即对于F~F(m,n)，当给定其上侧概率为时，该分布在横坐标上的临界值，记为：()PFFaa?25例：df1=4，df2=20，上尾概率为的上侧分位数为F0.01（4,20）=4.4326统计推断概述内容四正态总体样本平均数的抽样分布27四正态总体样本平均数的抽样分布1样本平均数的期望和方差设样本来自均数为，方差为2的总体设样本为简单随机样本1ixxn=å281样本平均数的期望和方差期望121()()1()1()1xinExExnExxxnnnnmmmmmm===+++=+++==å291样本平均数的期望和方差212222222221()()1()1()1xinVarxVarxnVarxxxnnnnnssssss===+++=+++==å方差标准差xnss=（平均数的标准误）302正态总体样本平均数的分布设样本来自正态总体N(,2)，则样本平均数也服从正态分布，其总体均数为，方差为2/n。),(N~2X),(N~2nx2~N(0,1)xZnms-=31中心极限定理（1）无论样本所来自的总体是否服从正态分布，只要样本足够大，样本平均数就近似服从正态分布，样本越大，近似程度越好。（2）所需的样本含量随原总体的分布而异，但只要样本含量30，无论原总体是何分布，都足以满足近似的要求。（3）设原总体的期望为，方差为2，则样本平均数的期望为，方差为2/n.32正态总体样本方差的分布样本方差的期望和方差设样本来自均数为，方差为2的总体设样本为简单随机样本22()1ixxsn-=-å33正态总体样本方差的分布样本方差的分布22222222()()()~(1)iiixxxnxxxnnmmssmmcss----=骣骣--÷ç÷ç÷=--ç÷ç÷ç÷ç÷ç桫桫邋å222(1)~(1)nsncs--22()1ixxsn-=-å34统计推断概述内容五参数估计35五参数估计参数估计（Parameterestimation）：以样本统计量对总体参数进行估计。基本方法：点估计（pointestimation）区间估计（intervalestimation）36参数估计-区间估计以一定的置信度对参数(如总体平均数)可能取值范围的估计12()1Pttqa＃=-1-：置信度（置信水平）[t1,t2]：置信区间t1、t2：置信限（置信下限、置信上限）求统计量t1和t2，使得对于给定的(常用=0.05和=0.01)，如有：37正态总体平均数的区间估计),(~2nNx()1xxPuuaamas--＃=-()1xxPxuxuaasmsa-＃+=-1当2已知或为大样本时：标准正态分布两尾概率分位点~N(0,1)xxms-38正态总体平均数的区间估计2当2未知，为小样本时（P88）~N(0,1)xxms-222(1)~(1)nsncs--22(1)~t(1)(1)xxxxxnsnnssnmmmss----==--39正态总体平均数的区间估计()1xxPttsaama--＃=-t分布两尾概率分位点()1xxPxtsxtsaama-＃+=-对于t分布来说,对于给定的置信度1-ɑ和自由度,可以查得两尾概率为ɑ的临界tɑ值40正态总体方差的区间估计222(1)~(1)nsncs--2221222(1)()1nsPaaccas--＃=-22222122(1)(1)()1nsnsPaasacc---＃=-2分布上尾概率分位点41正态总体方差的区间估计/2/21-22212ac-42统计推断概述内容1小节一统计推断的概念二抽样分布的概念三统计量的概率分布-抽样分布四正态总体样本平均数的抽样分布五参数估计