统计一、基本知识概要:1.三种常用抽样方法:(1)简单随机抽样:设一个总体的个数为N。如果通过逐个抽取的方法从中抽取一个样本,且每次抽取时各个个体被抽到的概率相等,就称这样的抽样为简单随机抽样。简单随机抽样的常用方法:①抽签法,②随机数表法用随机数表进行抽样的步骤:①将总体中的个体编号;②选定开始号码;③获取样本号码。(2)系统抽样(也称为机械抽样):当总体的个数较多时,采用简单随机抽样较为费事。这时可将总体分成均衡的几个部分,然后按照预先定出的规则,从每一部分抽取一个个体,得到所需要的样本,这种抽样叫做系统抽样(也称为机械抽样)。系统抽样的步骤:①采用随机的方式将总体中的个体编号;②整个的编号分段(即分成几个部分),要确定分段的间隔k。当N/n(N为总体中的个体的个数,n为样本容量)是整数时,k=N/n;当N/n不是整数时,通过从总体中剔除一些个体使剩下的总体中个体的个数N‘能被n整除,这时k=N′/n;③在第一段用简单随机抽样确定起始的个体编号1;④按照事先确定的规则抽取样本(通常是将1加上间隔k得到第2个编号1+k,第3个编号1+2k,这样继续下去,直到获取整个样本)。(3)分层抽样:当已知总体由差异明显的几部分组成时,为了使样本更充分地反映总体的情况,常将总体分成几个部分,然后按照各部分所占的比例进行抽样,这种抽样叫做“分层抽样”,其中所分成的各部分叫做“层”。三种抽样方法的比较类别共同点各自特点简单随机抽样抽样过程中每个个体被抽取的概率相等从总体中逐个抽取系统抽样将总体均分成几部分,按事先确定的规则分别在各部分中抽取分层抽样将总体分成几层,分层进行抽取三种抽样方法的比较类别相互联系适用范围简单随机抽样总体中的个数较少系统抽样在起始部分抽样时采用简单随机抽样总体中的个数较多分层抽样各层抽样时采用简单随机抽样或系统抽样总体由差异明显的几部分组成一、基本知识概要:2、总体分布的估计:随着试验次数的不断增加,试验结果的频率值在相应的概率值附近摆动.当试验次数无限增大时,频率值就变成相应的概率了.此时随着样本容量无限增大其频率分布也就会排除抽样误差,精确地反映总体取的概率分布规律,通常称为总体分布。用样本的频率分布去估计总体分布:由于总体分布通常不易知道,我们往往用样本的频率分布去估计总体分布,一般地,样本容量越大,估计越精确.总体分布的估计的两种方式(1)频率分布表;(2)频率分布直方图。一、基本知识概要:3、正态分布的概念及主要性质:①正态分布的概念:如果连续型随机变量ξ的概率密度曲线为,其中为常数,并且,则称ξ服从正态分布,简记为。222)(21)(xex,0),(~N②正态分布的期望与方差:若,。),(~N2,DE③正态分布的主要性质:Ⅰ)曲线在x轴上方,并且关于直线x=μ对称;Ⅱ)曲线在x=μ时处于最高点,由这一点向左右延伸时,曲线逐渐降低;Ⅲ)曲线的对称轴位置由μ确定;曲线的形状由σ确定,σ越大,曲线越:“矮胖”;反之曲线越“高瘦”。④标准正态分布:当μ=0,σ=1时,可以写成,这时称ξ服从标准正态分布,简记为。)(x2221)(xex)1,0(~N⑤标准正态分布的函数表:由于标准正态分布应用十分广泛,已制成专门的标准正态函数表,供人们查阅。在标准正态分布表中,相应于每一个的函数值Φ是指总体取小于的值的概率(函数Φ实际上是正态总体N(0,1)的累积分布函数),即Φ=。φ0x)(0x0x)(0x)(0x)(0xxP)(xF)(x⑥若,则,),(~N)1,0(~N①)()()(abbxaP②一、基本知识概要:4、线性回归:(1)相关关系:自变量取值一定时,因变量的取值带有一定随机性的两个变量之间的关系。注:与函数关系不同,相关关系是一种非确定性关系。(2)回归分析:对具有相关关系的两个变量进行统计分析的方法。(4)回归直线方程:,其中,。相应的直线叫回归直线,对两个变量所进行的上述统计叫做回归分析。abxyxbyaxnxyxnyxbniiniii2121niixnx11(3)散点图:表示具有相关关系的两个变量的一组数据的图形。(5)相关系数:)()(21221211ynyxnxyxnyxrniiniiniii相关系数的性质:(1)|r|≤1。(2)|r|越接近于1,相关程度越大;|r|越接近于0,相关程度越小二、例题:例1:某批零件共160个,其中一级品有48个,二级品64个,三级品32个,等外品16个.从中抽取一个容量为20的样本.请说明分别用简单随机抽样、系统抽样、分层抽样法抽取时总体中的每个个体被取到的概率相同.说明:三种抽样方法的共同点就是每个个体被抽到的概率相同,这样样本的抽取体现了公平性和客观性。例2:将温度调节器放置在贮存着某种液体的容器内,调节器设定在,液体的温度(单位:)是一个随机变量,且。CdC)5.0,(~2dN(1)若,求的概率90d89(2)若要保持液体的温度至少为的概率不低于0.99,问至少是多少?(其中若)。80d,)1,0(~N9772.0)2()2(P则01.0)327.2()327.2(P剖析:(1)要求P()=F(89),因为不是标准正态分布,而给出的是,故需转化为标准正态分布的数值。89)5.0,(~dN)327.2(),2((2)转化为标准正态分布下的数值求概率,再利用p.99.0dp解(1)若).1,0(~),1,0(~NN则(2)标准正态分布的密度函数是偶函数,时,为增函数,时,为减函数。)(xf0x)(xf0x)(xf说明:例3:已知测量误差,必须进行多少次测量,才能使至少有一次测量误差的绝对值不超过的频率大于0.9?))(100,2(~cmNcm8例4:有一个容量为100的样本,数据的分组及各组的频数如下:;6,5.15,5.12;16,5.18,5.15;18,5.21,5.18;22,5.24,5.21;20,5.27,5.24;10,5.30,5.278,5.33,5.30(1)列出样本的频率分布表;(2)画出频率分布直方图;(3)估计数据小于30.5的概率。例5:一个工厂在某年里每月产品的总成本y(万元)与该月产量x(万件)之间有如下一组数据:x1.081.121.191.281.361.48y2.252.372.402.552.642.75(1)画出散点图(2)求月成本与月产量之间的回归直线方程。1.591.681.801.871.982.072.923.033.143.263.363.50说明:求线性回归直线方程的步骤:(1)画散点图观察相关性(2)列出表格,求出某些数据(3)代入公式求得a,b,进而得到直线方程。三.课堂小结:1、理解三种抽样方法的特点;2、用样本的频率去估计总体分布;3、正态分布的意义、主要性质及应用;4、了解线性回归的方法,会求线性回归方程。四、作业布置:教材P197页闯关训练。