4第五章(一)统计推断概述1抽样分布

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1生物统计附试验设计BiostatisticsandExperimentalDesign畜牧、兽医专业2抽样分布参数估计简介假设检验的基本原理第五章(一)统计推断概述3统计推断概述内容1一统计推断的概念二抽样分布的概念三统计量的概率分布-抽样分布四正态总体样本平均数的抽样分布五参数估计4统计推断概述内容一统计推断的概念和内容5一统计推断的概念和内容统计推断:根据抽样分布规律和概率论,由样本统计量来推论总体参数;对未知总体的分布特征进行检验。内容:(1)参数估计(parameterestimation):用样本统计量估计(点估计、区间估计)总体参数(平均数、方差)。(2)假设检验(hypothesistesting):又称显著性检验,即利用样本统计量对所属总体的分布特征进行检验。6统计推断概述内容二抽样分布的概念7二抽样分布的概念1随机抽样(randomsampling):是指总体中每一个个体都有同等的机会被抽取到样本中去,这种抽样方法叫随机抽样。2抽样分布(samplingdistribution):从一个总体中独立、随机地抽取含量为n的样本,并由样本计算各种统计量,则由样本统计量相对应的随机变量的概率分布为抽样分布。8抽样分布的概念样本统计量的概率分布称为抽样分布样本是通过对总体的随机抽样获得的样本统计量是随机变量,有一定的概率分布若干统计量又组成不同于原总体的新总体,其概率分布为抽样分布简单随机样本抽样是完全随机的-总体中的每个个体都有相同的机会被抽中抽样是彼此独立的-每次抽样的结果都不会影响到其他抽样的结果9统计推断概述内容三统计量的概率分布-抽样分布10三统计量的概率分布-抽样分布原总体样本1样本2样本n1x2x2x新总体n统计量X2分布、F分布正态或t分布111、2(chi-square)分布定义(P156)设有n个随机变量X1,X2,,Xn,彼此独立且都服从标准正态分布N(0,1),则称随机变量22()iixYXms-==邋服从自由度为n的2分布,记为)(~2nY122分布曲线132分布性质(1)2分布随机变量的取值范围为(0,)(2)2分布的可加性:若Y1~2(n),Y2~2(m),且相互独立,则:Y1±Y2~2(n±m)(3)2分布为非对称分布,其分布曲线的形状由自由度决定,自由度越大,分布越趋于对称当n,2(n)N(n,2n)142值表2分布上侧分位数表(P346):对于Y-2(n),当给定其上侧(右侧)尾部的概率时,该分布在横坐标上的临界值为22()PXaca?15例:df=9,=0.05,查表得:20.05=16.9,意为大于16.9的概率(右侧)为0.05;162、t分布定义(P64)设随机变量Z~N(0,1),Y~2(n),且相互独立,则随机变量ZtYn=服从自由度为n的t分布,记为)(t~nt17t分布曲线18t分布性质(1)t分布与标准正态分布相似,是对称分布;关于t=0对称,只有一个峰,峰值在t=0(2)分布曲线受自由度影响,自由度越小,离散程度越大(3)当n,t(n)N(0,1)19t分布与正态分布的比较20t值表t分布双侧分位数表:P337,即对t--t(n)当上侧和下侧两尾概率之和为(每侧为/2)时,t分布在横坐标上的临界值的绝对值。记为:1()Ptttaaa--#=213F分布定义(P99)若随机变量X~2(m),Y~2(n),且相互独立,则随机变量XmFYn=服从自由度为m(第一自由度)和n(第二自由度)的F分布,记为),(F~nmF22F分布曲线23F分布性质(1)F分布随机变量的取值范围为(0,)(2)F分布的分布曲线受两个自由度的影响(3)若F~F(m,n),则1/F~F(n,m)(4)若t~t(n),则t2~F(1,n)24F值表F分布的上侧分位数表:P339即对于F~F(m,n),当给定其上侧概率为时,该分布在横坐标上的临界值,记为:()PFFaa?25例:df1=4,df2=20,上尾概率为的上侧分位数为F0.01(4,20)=4.4326统计推断概述内容四正态总体样本平均数的抽样分布27四正态总体样本平均数的抽样分布1样本平均数的期望和方差设样本来自均数为,方差为2的总体设样本为简单随机样本1ixxn=å281样本平均数的期望和方差期望121()()1()1()1xinExExnExxxnnnnmmmmmm===+++=+++==å291样本平均数的期望和方差212222222221()()1()1()1xinVarxVarxnVarxxxnnnnnssssss===+++=+++==å方差标准差xnss=(平均数的标准误)302正态总体样本平均数的分布设样本来自正态总体N(,2),则样本平均数也服从正态分布,其总体均数为,方差为2/n。),(N~2X),(N~2nx2~N(0,1)xZnms-=31中心极限定理(1)无论样本所来自的总体是否服从正态分布,只要样本足够大,样本平均数就近似服从正态分布,样本越大,近似程度越好。(2)所需的样本含量随原总体的分布而异,但只要样本含量30,无论原总体是何分布,都足以满足近似的要求。(3)设原总体的期望为,方差为2,则样本平均数的期望为,方差为2/n.32正态总体样本方差的分布样本方差的期望和方差设样本来自均数为,方差为2的总体设样本为简单随机样本22()1ixxsn-=-å33正态总体样本方差的分布样本方差的分布22222222()()()~(1)iiixxxnxxxnnmmssmmcss----=骣骣--÷ç÷ç÷=--ç÷ç÷ç÷ç÷ç桫桫邋å222(1)~(1)nsncs--22()1ixxsn-=-å34统计推断概述内容五参数估计35五参数估计参数估计(Parameterestimation):以样本统计量对总体参数进行估计。基本方法:点估计(pointestimation)区间估计(intervalestimation)36参数估计-区间估计以一定的置信度对参数(如总体平均数)可能取值范围的估计12()1Pttqa#=-1-:置信度(置信水平)[t1,t2]:置信区间t1、t2:置信限(置信下限、置信上限)求统计量t1和t2,使得对于给定的(常用=0.05和=0.01),如有:37正态总体平均数的区间估计),(~2nNx()1xxPuuaamas--#=-()1xxPxuxuaasmsa-#+=-1当2已知或为大样本时:标准正态分布两尾概率分位点~N(0,1)xxms-38正态总体平均数的区间估计2当2未知,为小样本时(P88)~N(0,1)xxms-222(1)~(1)nsncs--22(1)~t(1)(1)xxxxxnsnnssnmmmss----==--39正态总体平均数的区间估计()1xxPttsaama--#=-t分布两尾概率分位点()1xxPxtsxtsaama-#+=-对于t分布来说,对于给定的置信度1-ɑ和自由度,可以查得两尾概率为ɑ的临界tɑ值40正态总体方差的区间估计222(1)~(1)nsncs--2221222(1)()1nsPaaccas--#=-22222122(1)(1)()1nsnsPaasacc---#=-2分布上尾概率分位点41正态总体方差的区间估计/2/21-22212ac-42统计推断概述内容1小节一统计推断的概念二抽样分布的概念三统计量的概率分布-抽样分布四正态总体样本平均数的抽样分布五参数估计

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功