田间试验设计与统计分析孔秋生Review♣离均差(deviationfrommean)☻离均差的代数和等于零☻离均差的平方和最小1xx2xxnxx田间试验设计与统计分析孔秋生Review离均差平方和(Sumofsquare,SS)2()iSSyy2()iSSy样本总体田间试验设计与统计分析孔秋生Review平均的离均差平方,称为均方或方差(variance)样本总体221()NNniySS221()11niyySSsnn田间试验设计与统计分析孔秋生Review标准差(standarddeviation)样本总体2yN21yySn(n-1)为自由度(degreeoffreedom)田间试验设计与统计分析孔秋生Review100%sCVyChapter4理论分布和抽样分布田间试验设计与统计分析第一节事件、概率和随机变量田间试验设计与统计分析田间试验设计与统计分析孔秋生1、事件和事件的概率♣频率和概率:☻概率(Probability)记作P►表示事件发生可能性大小的数值►Dealswiththerelativelikelihoodthatacertaineventwillorwillnotoccur,relativetosomeotherevents☻频数:►事件在若干次试验中出现的次数☻频率:►频数与所进行的试验总次数之比田间试验设计与统计分析孔秋生1、事件和事件的概率♣频率和概率:☻概率的统计定义(statisticsprobability):►随着试验次数n的逐渐增大,事件A的频率愈来愈稳定的接近定值P,于是定义P为事件A的概率►TheprobabilityofaneventistheproportionoftimestheeventoccursinmanyrepeatedtrialsofarandomphenomenonnaPnlimA)(田间试验设计与统计分析孔秋生1、事件和事件的概率♣频率和概率:☻概率是一个常数,是理论值☻频率则是一具体数字,即经验值☻Chancebehaviorisunpredictableintheshortrunbuthasaregularandpredictablepatterninthelongrun田间试验设计与统计分析孔秋生1、事件和事件的概率♣频率和概率:☻实质上是统计数与参数的关系☻大数定律说明,样本容量越大或试验次数越多,统计数与参数之间的误差就越小☻Lowoflargenumbers►Drawobservationsatrandomfromanypopulationwithfinitemeanμ.Asthenumberofobservationsdrawnincreases,themeanoftheobservedvaluesgetscloserandclosertomeanμofpopulationx田间试验设计与统计分析孔秋生1、事件和事件的概率♣小概率事件实际不可能性原理:☻随机事件的概率表现了事件的客观统计规律性,它反映了事件在一次试验中发生可能性的大小,概率大表示事件发生的可能性大,概率小表示事件发生的可能性小。☻若事件A发生的概率较小,如小于0.05或0.01,则认为事件A在一次试验中不太可能发生,这称为小概率事件实际不可能性原理,简称小概率原理。►这里的0.05或0.01称为小概率标准,农业试验研究中通常使用这两个小概率标准田间试验设计与统计分析孔秋生1、事件和事件的概率♣小概率事件实际不可能性原理☻事件发生的可能性与试验结果是不同的►事件发生的可能性:事件可能发生的概率►试验结果:特定试验结果☻实际结果可能是概率大的事件发生了,也可能概率小的事件发生了☻请用“小概率原理”分析彩民的心态及投注策略田间试验设计与统计分析孔秋生1、事件和事件的概率第二节二项分布田间试验设计与统计分析田间试验设计与统计分析孔秋生1二项总体及二项分布一般地,设一次试验有两种对立的结果A与,其中P(A)=p,P()=q=1-p如果独立地重复进行n次该试验,事件A发生的次数X是一个随机变量,其取值的范围是0,1,2,……,n(n+1个值)每个取值对应的概率值可由二项式(p+q)n的展开式中相应项求得,故X的概率分布叫做二项分布(贝努利分布)。变量X也称为服从二项分布的随机变量,简称二项变量.AA田间试验设计与统计分析孔秋生1二项总体及二项分布♣二项总体(binarypopulation):☻整个总体可以根据某种性状的出现与否分成两项,即非此即彼的两项,他们所构成的总体称为二项总体♣二项分布(binomialdistribution):☻二项总体中的变量和其概率构成的一个分布,称之为二项概率分布,简称二项分布,是计数资料的一种最主要的理论分布田间试验设计与统计分析孔秋生1二项总体及二项分布♣Thebinomialsetting(assumptions):☻Thereareafixednumbernofobservations☻Thenobservationsareallindependent☻Eachobservationfallsintooneoftwocategories,whichforconveniencewecall“success”and“failure”☻Theprobabilityofasuccess,callitp,isthesameforeachobservation►Payattentiontothebinomialsetting,becausenotallcountshavebinominaldistribution田间试验设计与统计分析孔秋生2二项分布的概率计算!()()!()!xxnxxnxnnfxPXxCpqpqxnx二项变量取值的概率计算通式(二项分布的概率函数式)田间试验设计与统计分析孔秋生2二项分布的概率计算例:红果番茄与黄果番茄杂交,根据孟德尔遗传理论,F2中红果与黄果的比率为3∶1。求某F2中10株番茄,有7株为红果的概率。根据题意,n=10,p=3/4=0.75,q=1/4=0.25。设10株番茄中红果为x株,则x为服从二项分布B(10,0.75)的随机变量F2中10株番茄,有7株为红果的概率为:773731010!(7)0.750.250.750.250.25037!3!PxC田间试验设计与统计分析孔秋生2二项分布的概率计算♣EXCEL函数☻BINOMDIST(number_s,trials,probability_s,cumulative)田间试验设计与统计分析孔秋生3二项分布的参数和形状♣二项分布由n和p两个参数决定。☻n称为离散参数,只能取正整数☻p是连续参数,它能取0与1之间的任何数值。☻当p值较小且n不大时,分布是偏倚的。但随着n的增大,分布逐渐趋于对称。☻当p值趋于0.5时,分布趋于对称田间试验设计与统计分析孔秋生3二项分布的参数和形状♣服从二项分布B(n,p)的随机变量之平均数μ、标准差σ与参数n、p有如下关系npqnp田间试验设计与统计分析孔秋生3二项分布的参数和形状♣做B(10,0.3)、B(10,0.5)、B(10,0.8)的概率分布图♣做B(10,0.1)、B(50,0.1)、B(100,0.1)的概率分布图田间试验设计与统计分析孔秋生3二项分布的参数和形状n=10,p不同的二项分布的分布图00.050.10.150.20.250.30.350.40.451234567891011yp=0.3p=0.5p=0.9田间试验设计与统计分析孔秋生3二项分布的参数和形状p=0.1,n不同的二项分布00.050.10.150.20.250.30.350.40.45135791113151719yPn=10n=50n=100田间试验设计与统计分析孔秋生3二项分布的参数和形状p一定,图形随n而变化n大,图形顶点向中间移n小,图形偏度大。n→∞,不论p为何值,图形都对称可证,当n→∞,p不过小,且np、nq>5,且数值接近时,二项分布→正态分布。田间试验设计与统计分析孔秋生4泊松分布(Poissondistribution)在二项分布中,当一个概率如p或q相当小(如小如0.1),另一方面n又相当大二项分布的的一种极限分布,称之为泊松分布泊松分布在生物学的研究中经常遇到!()!()!rnrnPrpqrnrn0p()!mremPyrr注np=m田间试验设计与统计分析孔秋生4泊松分布(Poissondistribution)泊松分布通常是极为偏斜的泊松分布的主要用途在农业上有好多小概率事件,其发生概率p往往0.1,甚至0.01。二项分布当P0.1和nP5时,可用泊松分布近似分析田间试验设计与统计分析孔秋生4泊松分布(Poissondistribution)♣EXCEL函数☻POISSON(x,mean,cumulative)►X事件数。►Mean期望值。►Cumulative为一逻辑值,确定所返回的概率分布形式第三节正态分布田间试验设计与统计分析田间试验设计与统计分析孔秋生正态分布♣正态分布(normaldistribution),是连续性变数的理论分布☻客观世界中许多现象的数据服从正态分布☻在适当条件下,它可用来做二项分布及其它间断性或连续性变数分布的似近分布☻虽然有些总体并不做正态分布,但从总体中抽出的样本平均数及其它一些统计数的分布,在样本容量适当大时仍然趋近正态分布田间试验设计与统计分析孔秋生1二项分布的极限-正态分布♣二项分布的极限曲线属于连续性变数分布曲线。这一曲线一般称之为正态分布曲线或正态概率密度曲线。♣正态分布的概率密度函数为:eyfyN22121)(euu22121)(N(0,1)田间试验设计与统计分析孔秋生2正态分布曲线特征Symmetric,single-peaked,bell-shaped正态分布曲线围绕算术平均数向左右两侧作对称分布,所以它是一条对称曲线。正态分布的算术平均数、中数及众数三者合一,都位于点。正态曲线在-=1处有拐点田间试验设计与统计分析孔秋生2正态分布曲线特征正态分布的多数观察值集中于算术平均数的附近,离平均数愈远,相应的次数愈少,在-≥3以外,次数极少。正态分布曲线的形状完全取决于μ和σ两个参数,μ确定正态分布在X轴上的中心位置,σ确定正态分布的变异度正态曲线与横轴之间的总面积等于1田间试验设计与统计分析孔秋生2正态分布曲线特征()()1NPyfy田间试验设计与统计分析孔秋生2正态分布曲线特征♣EXCEL函数☻NORMDIST(x,mean,standard_dev,cumulative)☻返回指定平均值和标准偏差的正态分布函数田间试验设计与统计分析孔秋生2正态分布曲线特征♣绘制N(-1,1),N(0,1),N(1,1)的概率分布图♣绘制N(0,1),N(0,1.5),N(0,2)的概率分布图田间试验设计与统计分析孔秋生2正态分布曲线特征Normaldistributionswithdifferentμandthesameσ00.10.20.30.40.5-3-2-10123456xPμ=0μ=1μ=2田间试验设计与统计分析孔秋生2正态分布曲线特征Thenormaldistributionswiththesameμanddifferentσ00.10.20.30.40.5-6-5-4-3-2-10123456xPσ=1σ=1.5σ=2田间试验设计与统计分析孔秋生2正态分布曲线特征μ-3μ+3μ-2μ+2μ-μ+0.68270.95450.9973田间试验设计与统计分析孔秋生2正态分布曲线特征正态分布的一些常用区间及其对应的概率值区间概率μ1σ0.6826μ2σ0.9545μ3σ0.9973μ1.96σ0.9500μ