概率与统计初步总复习一随机事件及其概率随机事件及其概率概念必然事件:在一定条件下必然要发生的事件叫必然事件。不可能事件:在一定条件下不可能发生的事件叫不可能事件。必然事件用Ω表示。不可能事件用ø表示。(一)事件定义:确定事件如:Ω={木柴燃烧,能产生热量。}如:ø={煮熟的鸭子,还能跑。}随机事件:在一定条件下可能发生也可能不发生的事件叫随机事件。随机事件统称为事件,一般用大写字母A,B,C…表示。如:A={某人射击一次,中靶。}事件随机事件及其概率概念(二)概率定义:注:事件A的概率:(1)频率m/n总在P(A)附近摆动,当n越大时,摆动幅度越小。(2)概率的取值范围0≤P(A)≤1,不可能事件的概率为0,必然事件为1,随机事件的概率大于0而小于1。一般地,在大量重复进行同一试验时,事件A发生的频率总是接近于某个常数,在它附近摆动。这个常数叫做事件A的概率,记作P(A)。nm二概率的简单性质概率的简单性质概念(一)互斥事件的定义:不可能同时发生的两个事件叫做互斥事件.如果A且B为不可能事件(记:A∩B=Φ),那么称事件A与事件B互斥,其含义是:事件A与事件B在任何一次试验中不会同时发生。如:抛掷一骰子出现事件A={出现1点}和事件B={出现2点}。AB概念(二)互逆事件的定义:AB若A且B为不可能事件,A或B为必然事件(记:A∪B=Ω),那么称A事件与事件B互为对立事件,其含义是:事件A和事件B必有一个且仅有一个发生。如:抛掷一骰子出现事件A={出现的点数为偶数}和事件B={出现的点数为奇数}。两个互斥事件中必有一个发生,则这两个互斥事件叫做互逆事件,(又称为对立事件)。事件A的互逆事件记为A.概率的简单性质概念(三)独立事件的定义:这就是说,事件是否发生对事件发生的概率没有影响,这样的两个事件叫做相互独立事件.AB如:甲坛子里有3个白球,2个黑球;乙坛子里有2白球,2个黑球.设从甲坛子里摸出一个球,得到白球叫做事件A,从乙坛子里摸出一个球,得到白球叫做事件B.乙甲概率的简单性质概念(四)概率的简单性质:概率的简单性质性质1:事件A的概率满足0()1PA性质2:必然事件Ω的概率为1()1P性质3:不可能事件Ø的概率为0()0P概念(四)概率的简单性质:概率的简单性质性质4:事件A与事件B互斥,则有()()()PABPAPB性质5:事件A与事件A的互逆事件A的概率关系()1()PAPA()0PAB概念(四)概率的简单性质:概率的简单性质性质6:事件A与事件B互相独立,则有(1)()()()PABPAPB(2)()1()PABPAB1()()PAPB11())(1())PAPB(()+()()()PAPBPAPB三等可能事件的概率等可能事件的概率概念(一)等可能事件的定义:如果一个随机试验可能出现的结果只有有限个,即基本事件总数是有限的,并且每一个基本事件发生的可能性相同,那么称这样的随机事件为等可能事件。注意:①试验中所有可能出现的基本事件只有有限个;②每个基本事件出现的可能性相同。等可能事件的概率概念(二)等可能事件的概率:一般地,如果一个试验有n种等可能事件,事件A包含其中的m个基本事件,那么事件A发生的概率为:事件A的结果数可能的结果总数()mPAn概率事件A四抽样方法抽样方法概念1、总体定义:作为我们所要考察对象的全体叫做总体。总体中每一个考察的对象叫做个体。2、个体定义:如:生产的整批灯泡。如:生产的每一个灯泡。(一)总体与个体的定义:抽样方法概念3、样本定义:一般地,为了考察总体,从总体中抽取n个个体来进行试验或观察,这n个个体称为来自总体的一个样本,n为样本容量。对来自总体的容量为n的一个样本进行一次观察,所得的一组数据x1,x2,…,xn。称为样本观察值.4、样本观察值定义:如:抽取出10个灯泡的寿命,10为样本容量。如:抽取出10灯泡的寿命:1203,980,1120,903,1010,995,1530,990,1002,1340。(一)总体与个体的定义:抽样方法概念(二)简单随机抽样定义:一般地,设一个总体含有N个个体,从中逐个不放回的抽取n个个体作为样本(n≤N),如果每次抽取时总体内的每个个体被抽到的机会相等,就称这种抽样方法为简单随机抽样.用这种方法抽得的样本叫做简单随机样本.注意:(1)总体中的每个个体都有被抽到的可能;(2)每个个体被抽到的机会都是相等的.简单随机抽样的常用方法:I.抽签法:II.随机数法:抽样方法概念Ⅰ.抽签法:一般地,用抽签法从个体数为N的总体中抽取一个容量为k的样本的步骤为:(1)将总体中的N个个体编号;(2)将这N个号码写在形状、大小相同的号签上;(3)将号签放在同一箱中,并搅拌均匀;(4)从箱中每次抽出1个号签,连续抽取k次;(5)将总体中与抽到的号签编号一致的k个个体取出.抽样方法概念Ⅱ.随机数表法:制作一个表,其中的每个数都是用随机方法产生的(称“随机数”)这样的表称为随机数表.于是我们只要按一定的规则到随机数表中选取号码就可以了.这种抽样方法叫做随机数表法.用随机数表法抽取样本的步骤是:(1)将总体中的个体编号(每个号码位数一致).(2)在随机数表中任选一个数作为开始.(3)从选定的数开始按一定的方向读下去,若得到的号码在编号中,则取出;若得到的号码不在编号中或前面已经取出,则跳过,如此继续下去,直到取满为止.(4)根据选定的号码抽取样本.抽样方法概念将总体平均分成几个部分,然后按照一定的规则,从每个部分中抽取一个个体作为样本,这样的抽样方法称为系统抽样。系统抽样也称作等距抽样或机械抽样.(三)系统抽样定义:给总体中的每一个个体按顺序编号,即制定出抽样框。1计算出抽样间距。计算方法是用总体的规模除以样本的规模。假设总体规模为N,样本规模为n,那么抽样间距K就由下列公式导出:K=N/n2在最前面的K个个体中,采用简单随机抽样的方法抽取一个个体,记下这个个体的编号A,称为随机起点。3在抽样框中,自A开始,每隔K个个体抽取一个个体,即所抽取个个体编号分别为A,A+K,A+2K,﹍,A+(n-1)K。4将这n个个体合起来,就构成了该总体的一个样本。5具体步骤抽样方法概念(四)分层抽样定义:一般地,当总体由差异明显的几个部分组成时,为了使样本更客观地反映总体情况,将总体中的个体按不同的特点分成层次比较分明的几部分,然后按各部分在总体中所占的比例实施抽样,这种抽样方法叫分层抽样,所分成的各个部分称为“层”.将总体按一定标准分层;1计算各层的个体数与总体的个体数的比;2按各层个体数占总体的个体数的比例确定各层应抽取的样本容量;3在每一层进行抽样(可用简单随机抽样或系统抽样)。4具体步骤联系与区别类别各自特点相互联系适用范围简单随机抽样系统抽样分层抽样共同点从总体中逐个抽取将总体均分成几部分,按事先确定的规则在各部分抽取将总体分成几层,分层进行抽取在起始部分抽样时采用简单随机抽样各层抽样时采用简单随机抽样或系统抽样总体中的个体数较少总体中的个体数较多等可能抽取;不放回抽样;总体由差异明显的几部分组成抽样方法五总体分布的估计总体分布的估计概念(一)频率分布表的定义:当总体很大或不便于获得时,可以用样本的频率分布估计总体的频率分布.我们把反映总体频率分布的表格称为频率分布表.制作列频率分布表的一般步骤:第1步:计算极差R;极差R=最大值-最小值组数=极差组距第4步:登记频数,计算频率,列频率分布表;第3步:分组,决定起点及各组范围;第2步:决定组距与组数;常分为5~12组。总体分布的估计概念(二)频率分布直方图的定义:在直角坐标系中,用横轴表示随机变量的取值,横轴上的每个小区间对应一个组的组距,作为小矩形的底边;纵轴表示频率与组距的比值,并用它作小矩形的高,以这种小矩形构成的一组图称为频率直方图。第5步:画频率直方图;(1)确定横坐标;纵轴表示(每个矩形的面积为该组的频率)频率组距(2)确定纵坐标;(3)确定点,画频率直方图;制作列频率分布直方图的一般步骤:总体分布的估计概念制作列频率分布直方图的一般步骤:第1步:计算极差R;极差R=最大值-最小值第2步:决定组距与组数、;常分为5~12组。组数=极差组距第4步:登记频数,计算频率,列频率分布表;第3步:分组,决定起点及各组范围;第5步:画频率直方图;(1)确定横坐标;纵轴表示(每个矩形的面积为该组的频率)频率组距(2)确定纵坐标;(3)确定点,画频率直方图;六总体特征值的估计总体特征值的估计概念一组数据中出现次数最多的那个数据叫做这组数的众数(mode).(一)众数的定义如:从某市某年参加毕业考试的学生中,随机抽查了20名学生的数学成绩,分数如下:90848486879873829093689584717861948877100该样本数据中的众数为84。注意:用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便。概念将一组数据按大小依次排列,把处在最中间位置的一个数据(或最中间两个数据的平均数)叫做这组数据的中位数(median).(二)中位数的定义如:从某市某年参加毕业考试的学生中,随机抽查了20名学生的数学成绩,分数如下:9084848687987382909368958471786194887710061687173777882848484868788909093949598100该样本数据中的中位数为85。注意:中位数仅需把数据按顺序排列后即可确定;不易受数据中极端数值的影响。总体特征值的估计概念算术平均数是指数据中各观测值的总和除以观测值个数所得的商,简称平均数或均数(arithmeticmean).(三)平均数的定义如:从某市某年参加毕业考试的学生中,随机抽查了20名学生的数学成绩,分数如下:90848486879873829093689584717861948877100niinxxxxnnx1211184.151008490201x总体特征值的估计概念算术平均数是指数据中各观测值的总和除以观测值个数所得的商,简称平均数或均数(arithmeticmean).(三)平均数的定义niinxxxxnnx12111注意:平均数需要全组所有数据来计算;易受数据中极端数值的影响,会因每一个数据的变化而变化。总体特征值的估计概念一般地,若取值为x1,x2,…,xn的频率分别为p1,p2,…,pn,则其平均数为x1p1+x2p2+…+xnpn,因此这个平均数称加权平均数(weightmean).(四)加权平均数的定义注意:加权平均数的大小不仅取决于总体中各单位的数值(变量值)的大小,而且取决于各数值出现的次数(频数),由于各数值出现的次数对其在平均数中的影响起着权衡轻重的作用。11221nnniiixxpxpxpxp总体特征值的估计概念极差:一组数据的最大值与最小值的差极差越大,数据越分散,越不稳定极差越小,数据越集中,越稳定极差体现了数据的离散程度离散程度(五)加权平均数的定义总体特征值的估计方差与标准差概念(六)方差的定义样本中各数据与样本平均数的差的平方和的平均数叫做样本方差。方差(标准差的平方)公式为:])()()[(1222212xxxxxxnsn假设样本数据是,,,21nxxxx平均数是方差与标准差概念(七)标准差的定义样本方差的算术平方根叫做样本标准差。假设样本数据是,,,21nxxxx平均数是])()()[(122221xxxxxxnsn标准差公式为:方差与标准差概念方差、标准差是样本数据到平均数的一种平均距离。它用来描述样本数据的分散程度。在实际应用中,标准差常被理解为稳定性。方差越大,说明数据的波动越大,越不稳定.方差用来衡量一批数据的波动大小.1、对方差的有何理解?2、求方差的步骤怎样?先求平均数,再求方差.方差越小,说明数据的波动越小,越稳定.七综合运用概率与统计初步综合运用B概率与统计初步综合运用B概率与统计初步