应用数理统计一、概率论复习二、数理统计课程安排教学安排:教材与参考书:吴群英等,应用数理统计,天津大学出版社邰淑彩等,应用数理统计(第二版),武汉大学出版社,2005张忠占等,应用数理统计,机械工业出版社茆诗松,概率论与数理统计,中国统计出版社共54学时内容概率论的基本概念随机变(向)量及其分布随机变量函数的分布数字特征及其特征函数大数定理及中心极限定理概率论第一章概率论知识第二章数理统计的基本概念第三章参数估计第四章假设检验数理统计第五章方差分析第六章回归分析第七章正交实验设计法第一章概率论补充知识1.概率空间2.随机变(向)量及其分布3.随机变量的独立性4.随机变量函数的分布5.数字特征与特征函数6.多元正态分布极其性质7.极限定理第一节概率空间一、样本空间与事件域例如在几何概型中就不能把不可度量的子集作为事件。定义1设是样本空间,F是由的一些子集构成的集类,如果满足下列条件:因此我们可以理解,事件是中满足某些条件的子集。为此下面介绍事件域的概念。事件是样本空间的一个子集,反之未必成立。F)(1;,)2(FAFA则若.,...,3,2,1,)3(1FAiFAiii则若则称F为事件域,F中的元素称为事件,称为必然事件。一般对满足上述条件的集类称为-域,所以事件域是一个-域。它具有下列性质:.)1(F空集.,为不可能事件我们称事件这是因为F.,...,2,1,)2(1FAiFAiii则若定理知事实上,由MorganA.De.11FAAiiii则若,...,2,1,)3(iFAiFAnii1,1FAnii.,3121即得)中取的(在定义nnAA.,221即得)中取在性质(nnAA.,)4(FBAFBA则,若FBABA)知,这是因为由性质(3.,,,,,21域是容易验证,AAFF二、概率的定义及性质定义2;1)(2P)()(1iiAP(可列可加性)设是给定的样本空间,个事件域,是定义在F上一个实值集函数,如果它满足条件:)(FAAP)(,,2,1,)3(1iFA若;0)(,)1(APFA有对任一事件F是中的一,,jiAAji且则有1)(iiAP(非负性)(规范性)则称P(A)是事件A的概率(简称为概率).描述一个随机实验的三个基本组成部分:样本空间事件域F概率P概率空间),,(PF;0)(1P)(设是概率空间,概率P有如下性质:),,(PF,,2,1,)2(1niFA若有限可加性,,jiAAji且)(1niiAP;niiAP1)(则;有)(1)(APAP则有,设,)3(FA(4),,,AFBFAB设若则)()()(BPAPBAP;)()(BPAP)()()()(ABPBPAPBAP则设加法公式,,)5(FBFA)()()(BPAPBAP这个结论可推广为:则若,,,2,1,niFAi)(1niiAP1)(iiAP定义)()()|(APABPABP性质为在事件发生的条件下,事件A2);1)|(AP1(|)iiPBA)|(1ABPii3)设互不相容,,,21BB(|)0;PBAB发生的条件概率.设是两个随机事件,且则称0)(APBA,1)对于任一事件,B4))|(ABP).|(1ABP三、条件概率与事件的独立性1、条件概率)()|()(APABPABP得推广)()|(BPBAP()PABC()()PCPBC,,BA设,0)(AP当()(|)()PABPBAPA)(1nAAP)|(11nnAAAP)|(211nnAAAP312(|)PAAA)|(12AAP)(1AP(1)乘法公式(|)PABC,由A(2)全概率公式0)(iBP且1122()(|)()(|)()PAPABPBPABPB定理),,2,1(ni12,,,nBBB(|)()nnPABPB1B2B3BnB为的一个划分,设随机试验的样本空间为E为的任意一事件,AE理论和实用意义:在较复杂情况下直接计算P(A)不易,但A总是伴随着某些出现,适当地去构造这一组往往可以使问题简化。iBiB(3)贝叶斯公式引例2311红4白?任取一箱子,再从中任取一球,发现是红球,求该球取自一号箱的概率.解设=“球取自号箱”iAiB=“取得红球”求)|(1BAP运用全概率公式计算)()(1BPBAP31)(kkAP)|()(11ABPAP)(kABP|已知“结果”求“原因”贝叶斯公式1(|)PAB()PB贝叶斯公式nBBB,,,21,0)(AP0)(iBP1,,in)|(ABPi)()(APABPi则niiiBPBAP1)()|()()|(iiBPBAP,A为的一个划分,设随机试验的样本空间为,E它是在观察到事件A已发生的条件下,寻找导致A发生的每个原因的概率。2事件的相互独立性1)掷一颗均匀的骰子两次,)(ABP可知61)(BP2)掷甲乙两枚骰子,)(BAP可知)(AP)(BAP)(AP)0)((AP={甲掷出偶数点}A={乙掷出偶数点}B={第一次掷出6点}A={第二次掷出6点}B一般地()()()PABPAPB定义)()()(BPAPABP例1从一副不含大小王的扑克牌中任取一张,解)(AP;524)(BP;5226)(ABP252()()()PABPAPB设是两个事件,如果如下等式成立,AB则称事件相互独立。,AB记={抽到},={抽到的牌是黑色的}ABK问事件A,B是否相互独立?即事件A,B相互独立多个事件的独立性)()()(BPAPABP,,,三个事件对于CBA若下面四个等式同时成立)()()(CPAPACP)()()()(CPBPAPABCP)()()(CPBPBCP相互独立则称CBA,,两两独立则称CBA,,实质:任何事件发生的概率都不受其它事件发生与否的影响两两独立相互独立定义)2(,,,21nkknAAAn个事件,若对任意的是设都有和任意一组,121niiik)()()()(2121kkiiiiiiAPAPAPAAAP成立,则称n个事件nAAA,,,21相互独立.,,对事件序列nAAA,,,21若它们之中的任意有限个事件独立,则称事件序列,,nAAA,,,21独立.2nC12nn3nCnnC包含等式总数为:独立,则若nAAA,,,21事件独立的性质;,,,)1('''2'1kkknAAAAAA或独立,其中组(不重不漏),分成将事件kAAAn,,,)2(21经过并、组内的分别由第设ikAkBBB,,2,1,,,21.,,,21独立得,则积、差、求余等运算所kBBB一、随机变量及其分布二、随机向量及其分布三、边际分布四、条件分布第二节随机变(向)量及其分布为了更方便地从数量方面研究随机现象的统计规律,引入随机变量的概念,即将随机试验的结果与实数对应起来,将随机试验的结果数量化一、随机变量及其分布定义设随机试验的样本空间例1抛一枚均匀硬币,观察正反面情况。设一、随机变量的定义)(为随机变量出现结果为反面,)(},{称为随机变量。上的实值单值函数,是定义在样本空间},{TH试验结果的出现是随机的,故的取值也是随机的。)(.,0,,1TH5.01HPP5.00TPP2)随机变量函数的取值在试验之前无法确定,且取值有一定的概率;而普通函数却没有。随机变量和普通函数的区别1)定义域不同e.也可以不是数;而普通函数是定义在实数域上。随机变量定义在样本空间上,定义域可以是数)(eXR随机变量通常用大写字母X,Y,Z或希腊字母ζ,η等表示而表示随机变量所取的值时,一般采用小写字母等.zyx,,随机变量的分类例如:“抽验一批产品中次品的个数”,“电话交换台在一定时间内收到的呼叫次数”等1)离散型随机变量2)连续型随机变量所有取值可以逐个一一列举例如:“电视机的寿命”,实际中常遇到的“测量误差”等.全部可能取值有无穷多,充满一个或几个区间二、分布函数的概念)(x定义1设是一个随机变量,Xx是任意实数,称函数为的分布函数。X上的概率.)()(12xFxF}{21xXxP}{}{12xXPxXP}{)(xXPxFxxX分布函数)(xF],(x的值就表示落在区间X分布函数的性质⑴单调不减性:⑶右(左)连续性:⑵,且,则上述三条性质,也可以理解为判别函数是否是分布函数的充要条件。).()(lim)0(0xFyFxFxy).()(lim)0(0xFyFxFxy4.几个常用的概率公式}{bXaP}{}{00xXPxXP}{0xXP}{0xXP}{}{aXPbXP)()(aFbF1.2.}{0xXP3.4.}{10xXP)(1}{100xFxXP(2)分布函数是一个普通实值函数(1)分布函数完整描述了随机变量的统计规律性)0()(00xFxF)0(10xF定义若随机变量X的全部可能取值是有限个或可列无限多个,则称此随机变量是离散型随机变量。例(1)扔一均匀硬币三次,出现正面的次数}3,2,1,0{)(XeX(2)某一时间段进入商场的人数},3,2,1,0{X离散型随机变量离散型随机变量灯泡的寿命}0|{ttX非离散型随机变量1、离散型随机变量及其分布分布律也可用如下表格的形式表示),2,1(k定义设随机变量X的所有可能取值为,kx取各个可能值的概率为X,}{kkpxXP满足kp;0)1(kp1(2)1;kkp判断分布律的条件则称pk为离散型随机变量X的概率分布或分布律。Xkp1x2x1p2pkxkp二、常用的离散型随机变量1.(0—1)分布定义若随机变量X的分布律为1,0,)1(}{1kppkXPkk)10(p)分布。为参数的(服从以则称10pX01X只能取两个值:,(0—1)分布的分布律也可写成Xkp01p1p01~1Xpp注意服从(0-1)分布的随机变量很多。如果涉及的试验只有两个互斥的结果:都可在样本空间上定义一个服从(0-1)分布的随机变量:例如检查某产品的质量是否合格;抛一枚硬币观察其正反面;一次试验是否成功。不发生,发生AAX0,1AA,容易验证由二项式定理X定义:如果的分布律为}{kXPknCknkpp)1(nk,,2,1,0的二项分布服从参数为称pnX,),(~pnbX记为,1,10pqp2二项分布kkppkXP1)1(}{1n特别,二项分布为),1(~)10(pbX分布,常记为这就是二项分布描述的是n重贝努里试验中出现“成功”次数X的概率分布.~(,)Xbnp3.泊松分布{}PXk==X称服从参数为的泊松分布,记为其中是常数,0,2,1,0k若随机变量的分布律Xekk!X~()P泊松分布在管理科学、运筹学以及自然科学的某些问题中都占有重要的地位。泊松分布的应用①排队问题:在一段时间内窗口等待服务的顾客人数②生物存活的个数③放射的粒子数X~()PX~()PX~()P思考题:两个分布函数之和仍为分布函数吗?不是设)(),(21xFxF为两个分布函数,)()()(21xFxFxF211则)()()(21FFF2连续型随机变量及其分布一、定义其中被积函数,0)(tf称为概率密度函数或概率密度。)(tfxdttfxF)()(如果随机变量的分布函数为X则称为连续型随机变量X二.概率密度的性质1.0)(xf2.1)(dxxf面积为1