1生物统计附试验设计BiostatisticsandExperimentalDesign畜牧、兽医专业2抽样分布参数估计简介假设检验的基本原理第五章(一)统计推断概述3统计推断概述内容1一统计推断的概念二抽样分布的概念三统计量的概率分布-抽样分布四正态总体样本平均数的抽样分布五参数估计4统计推断概述内容一统计推断的概念和内容5一统计推断的概念和内容统计推断:根据抽样分布规律和概率论,由样本统计量来推论总体参数;对未知总体的分布特征进行检验。内容:(1)参数估计(parameterestimation):用样本统计量估计(点估计、区间估计)总体参数(平均数、方差)。(2)假设检验(hypothesistesting):又称显著性检验,即利用样本统计量对所属总体的分布特征进行检验。6统计推断概述内容二抽样分布的概念7二抽样分布的概念1随机抽样(randomsampling):是指总体中每一个个体都有同等的机会被抽取到样本中去,这种抽样方法叫随机抽样。2抽样分布(samplingdistribution):从一个总体中独立、随机地抽取含量为n的样本,并由样本计算各种统计量,则由样本统计量相对应的随机变量的概率分布为抽样分布。8抽样分布的概念样本统计量的概率分布称为抽样分布样本是通过对总体的随机抽样获得的样本统计量是随机变量,有一定的概率分布若干统计量又组成不同于原总体的新总体,其概率分布为抽样分布简单随机样本抽样是完全随机的-总体中的每个个体都有相同的机会被抽中抽样是彼此独立的-每次抽样的结果都不会影响到其他抽样的结果9统计推断概述内容三统计量的概率分布-抽样分布10三统计量的概率分布-抽样分布原总体样本1样本2样本n1x2x2x新总体n统计量X2分布、F分布正态或t分布111、2(chi-square)分布定义(P156)设有n个随机变量X1,X2,,Xn,彼此独立且都服从标准正态分布N(0,1),则称随机变量22()iixYXms-==邋服从自由度为n的2分布,记为)(~2nY122分布曲线132分布性质(1)2分布随机变量的取值范围为(0,)(2)2分布的可加性:若Y1~2(n),Y2~2(m),且相互独立,则:Y1±Y2~2(n±m)(3)2分布为非对称分布,其分布曲线的形状由自由度决定,自由度越大,分布越趋于对称当n,2(n)N(n,2n)142值表2分布上侧分位数表(P346):对于Y-2(n),当给定其上侧(右侧)尾部的概率时,该分布在横坐标上的临界值为22()PXaca?15例:df=9,=0.05,查表得:20.05=16.9,意为大于16.9的概率(右侧)为0.05;162、t分布定义(P64)设随机变量Z~N(0,1),Y~2(n),且相互独立,则随机变量ZtYn=服从自由度为n的t分布,记为)(t~nt17t分布曲线18t分布性质(1)t分布与标准正态分布相似,是对称分布;关于t=0对称,只有一个峰,峰值在t=0(2)分布曲线受自由度影响,自由度越小,离散程度越大(3)当n,t(n)N(0,1)19t分布与正态分布的比较20t值表t分布双侧分位数表:P337,即对t--t(n)当上侧和下侧两尾概率之和为(每侧为/2)时,t分布在横坐标上的临界值的绝对值。记为:1()Ptttaaa--#=213F分布定义(P99)若随机变量X~2(m),Y~2(n),且相互独立,则随机变量XmFYn=服从自由度为m(第一自由度)和n(第二自由度)的F分布,记为),(F~nmF22F分布曲线23F分布性质(1)F分布随机变量的取值范围为(0,)(2)F分布的分布曲线受两个自由度的影响(3)若F~F(m,n),则1/F~F(n,m)(4)若t~t(n),则t2~F(1,n)24F值表F分布的上侧分位数表:P339即对于F~F(m,n),当给定其上侧概率为时,该分布在横坐标上的临界值,记为:()PFFaa?25例:df1=4,df2=20,上尾概率为的上侧分位数为F0.01(4,20)=4.4326统计推断概述内容四正态总体样本平均数的抽样分布27四正态总体样本平均数的抽样分布1样本平均数的期望和方差设样本来自均数为,方差为2的总体设样本为简单随机样本1ixxn=å281样本平均数的期望和方差期望121()()1()1()1xinExExnExxxnnnnmmmmmm===+++=+++==å291样本平均数的期望和方差212222222221()()1()1()1xinVarxVarxnVarxxxnnnnnssssss===+++=+++==å方差标准差xnss=(平均数的标准误)302正态总体样本平均数的分布设样本来自正态总体N(,2),则样本平均数也服从正态分布,其总体均数为,方差为2/n。),(N~2X),(N~2nx2~N(0,1)xZnms-=31中心极限定理(1)无论样本所来自的总体是否服从正态分布,只要样本足够大,样本平均数就近似服从正态分布,样本越大,近似程度越好。(2)所需的样本含量随原总体的分布而异,但只要样本含量30,无论原总体是何分布,都足以满足近似的要求。(3)设原总体的期望为,方差为2,则样本平均数的期望为,方差为2/n.32正态总体样本方差的分布样本方差的期望和方差设样本来自均数为,方差为2的总体设样本为简单随机样本22()1ixxsn-=-å33正态总体样本方差的分布样本方差的分布22222222()()()~(1)iiixxxnxxxnnmmssmmcss----=骣骣--÷ç÷ç÷=--ç÷ç÷ç÷ç÷ç桫桫邋å222(1)~(1)nsncs--22()1ixxsn-=-å34统计推断概述内容五参数估计35五参数估计参数估计(Parameterestimation):以样本统计量对总体参数进行估计。基本方法:点估计(pointestimation)区间估计(intervalestimation)36参数估计-区间估计以一定的置信度对参数(如总体平均数)可能取值范围的估计12()1Pttqa#=-1-:置信度(置信水平)[t1,t2]:置信区间t1、t2:置信限(置信下限、置信上限)求统计量t1和t2,使得对于给定的(常用=0.05和=0.01),如有:37正态总体平均数的区间估计),(~2nNx()1xxPuuaamas--#=-()1xxPxuxuaasmsa-#+=-1当2已知或为大样本时:标准正态分布两尾概率分位点~N(0,1)xxms-38正态总体平均数的区间估计2当2未知,为小样本时(P88)~N(0,1)xxms-222(1)~(1)nsncs--22(1)~t(1)(1)xxxxxnsnnssnmmmss----==--39正态总体平均数的区间估计()1xxPttsaama--#=-t分布两尾概率分位点()1xxPxtsxtsaama-#+=-对于t分布来说,对于给定的置信度1-ɑ和自由度,可以查得两尾概率为ɑ的临界tɑ值40正态总体方差的区间估计222(1)~(1)nsncs--2221222(1)()1nsPaaccas--#=-22222122(1)(1)()1nsnsPaasacc---#=-2分布上尾概率分位点41正态总体方差的区间估计/2/21-22212ac-42统计推断概述内容1小节一统计推断的概念二抽样分布的概念三统计量的概率分布-抽样分布四正态总体样本平均数的抽样分布五参数估计