下回停第一节基本概念二、总体与个体三、随机样本的定义四、统计量一、问题的提出一、问题的提出概率论中的一个最基本的假设就是:而在实际中,我们往往不知道随机变量研究对象的分布已知.的确切分布,这就是数理统计所讨论问题的应用背景,它需要用已有的部分信息去推断整体情况.数理统计研究内容十分广泛,其中一类重要的问题便是统计推断.例如:某车站在旅游旺季的旅客到来人统计推断是利用试验数据对研究对象的性质作出推断,其中的一个重要方面就是参数估计问题.数服从Poisson分布,这样车站就需要知道该分布的具体参数,从而合理的安排车辆调度。但是在实际中,车站往往不知道分布的具体参数情况,仅仅知道一些往年旺季的车辆调度数据.对于这个问题,由概率论的知识可知,类似上述这类问题被称为——参数估计.调度分布.的均值,以其均值来代替直观粗略的想法就是计算出往年旺季汽车调度分布的参数Poisson()是其均值,那么一个,从而得到汽车的例如某电子元件企业为了提高该厂元器件统计推断的另一个重要问题是假设检验.的装箱出厂率,需要对元器件的合格率加以确定,而实际中决策人员只知道平时的次品率在1%附近,而且可以知道最近一批产品的装箱合格率.而我们现在想确认次品率是否为1%?对于这个问题,我们的一个想法就是在货类似的问题被称为——假设检验.们就认为该厂的元器件次品率为1%.占抽样总箱数的比例非常高,那么在实际中我行逐箱检验,如果次品率小于等于1%的箱数物中随机提取若干箱,然后对每箱的元器件进概括地讲,数理统计研究以有效的方式统计推断:研究如何加工、处理数据,从而试验设计数理统计参数估计统计推断假设检验采集、整理察的问题做出推断和预测,直至提供依据和建议.和分析受到随机因素影响的数据,并对所考对所考察对象的性质做出尽可能精确和可靠的推断.二、总体与个体总体:在数理统计中,把研究对象的全体个体:总体中每个研究对象称为个体.例如,在考察我校某届本科生学习质量时,称为总体(或母体).该届本科生的全体称为一个总体,每一个本科生称为一个个体.总体个体例1考察某批电视机的寿命质量时,这批电视机的全体称为一个总体,每台电视机称为一个个体.当我们说到总体,就是指一个具有确定概在实际中,我们并不关心总体的各个方面,率分布的随机变量.这时,每个个体具有的数量指标的全体就是总体.而往往关心它的某项或几项数量指标.因此,在理论上可以把总体与概率分布等通常,我们用随机变量ZYX,,等表示总体.同起来.三、随机样本的定义1.样本的定义样本中所包含个体的总数n称为样本容量.从总体X中,随机地抽取n个个体:nXXX,,,21称为总体X的一个样本,记为注12(,,,)nXXX.),,,(21维随机变量是一个样本nXXXn例2解(1)总体是该地区2006届数学本科毕(3)样本容量是100.为了了解数学专业本科毕业生的月薪情况,调查了某地区100名2006届数学专业的本科生的月薪情况,试问(1)什么是总体?(2)什么是样本?(3)样本容量是多少?业生的月薪;业生的月薪;(2)样本是被调查的100名2006届数学本科毕2.样本值),,,(21nxxx),,,(21nXXX每一次抽取nXXX,,,21所得到的n个确定的具体数值,记为称为样本的一个样本值(观察值).数理统计的基本任务是:根据从总体中抽取的样本,利用样本的信息推断总体的性质.■3.简单随机样本则称X两个特征:获得简单随机样本的抽样方法称为简单随机抽样.(1)代表性:(2)独立性:若来自总体X的样本),,,(21nXXX具有下列nXXX,,,21中每一个与总体有相同的分布.nXXX,,,21是相互独立的随机变量.12(,,,)nXXX为n的简单随机样本.设人的身高服从正态分布,现考察某地区100021,,,XXX1000人的身高.其身高记为100021,,,XXX则称为来自于正态总体容量又如,某实验室对200只灯泡作寿命试验,并且规定当有60只灯泡失效时停止试验,如此取得的寿命样本就不是简单随机样本.例3为1000的简单随机样本.X一个随机变量或者其相应的分布函数总体和样本的严格数学定义:1(),XFxX设随机变量的分布函数为,若且相互独是具有同一分布函数),(,,2xFXXn的为来自总体立的随机变量,则称XXXXn,,,21.样本的简单随机样本,简称容量为n.)(称为一个总体xF定义5.1定义5.24.样本的分布定理5.1则样本的分布密度为若总体),()2(xpX.),,,(21的样本为来自总体设XXXXn则样本的分布函数为若总体),()1(xFXniinxFXXX121)(),,(的分布函数为niinxpXXX121)(),,,(的分布密度为注熟记以上三种不同情形下样本的联合概率分布的具体形式是解决问题的关键!!(3)()()(1,,)iiXPXxpxin若总体的分布律为121(,,,)().nniiXXXpx则样本的分布律为例4的指数分布,来自于参数为设kkλX)且相互独立,求(nXXXnk,,,,,,2,1210,1)(kxkXxexFkkk所以的联合分布函数.解的指数分布,来自于参数为由于kkX由独立性有:nkiXnXXxFxxxFin121),,()(),,,(1.,,2,1,0,)1(1nkxeknkxλkk例5试求密度函数为,,11π1)(2xxxp.),,(321的联合概率密度XXX,其是来自柯西分布的样本设321,,XXX解的密度函数是自于柯西分布,所以因为iiXX的联合概率密度是:所以),,(321XXX31321),,()(),,(321iiXXXXxpxxxpi)3,2,1(,11π1)(2ixxxpiiiXi123322212311,,,π(1)(1)(1)xxxRxxxX服从参数为),,,(21nXXX是来自于总体的样本,求此样本的联合分布律.解总体X的分布律为,1,0,!)(kekkXPk所以),,,(21nXXX的联合分布律为因为nXXX,,,21独立同分布,设总体例6的Poisson分布niiinnkXPkXkXP111)(),,(nikekkkekinnkkniikni,,2,1,,2,1,0!!!!2111此即样本的联合分布律四、统计量的一个是来自总体设XXXXn),,(21的函是样本,nnXXXXXXf,,,),,,(2121的未知参数,中不含任何关于总体数,若Xf由样本推断总体情况,需要对样本值进行1.统计量定义5.3本中所含的信息集中起来.“加工”,这就需要构造一些样本的函数,它把样.),,,(21是一个统计量则称nXXXf注是随机变量;统计量),,,(121nXXXf2°统计量用于统计推断,故不应含任何关3º统计量是样本的函数,它是一个随机变),,,(),,,(2121nnXXXxxx是样本设是则称),,,(21nxxxf),,,(21nXXXf的观察值于总体X的未知参数;量,统计量的分布称为抽样分布.的观察值X服从参数为的Poisson分布nXXX,,,21为来自总体的样本,判断下列那些是统计量?),,min(11nXXT其他,0,1112niiXTnXXT/13设总体例7是不是是解直接利用统计量定义判别统计量回顾统计量是样本的函数,完全由样本决定,不含任何关于总体X的未知参数.2.几个常用统计量的定义,,,,21是来自总体的一个样本设nXXX1)样本均值;11niiXnX.11niixnx其观察值(1)样本矩可用于推断:E(X)..,,,21是这一样本的观察值nxxx它反映了总体均值的信息2)样本方差niinXXnS122)(1.1122niiXnXn其观察值niinxxns122)(1它反映了总体方差的信息可用于推断:D(X).3)样本标准差;1122niinnXXnSS其观察值.)(112niinxxns4)修正样本方差niinXXnS122*)(11.)(11122niiXnXn其观察值niinxxns12*)(112.)(11122niixnxn样本方差与修正样本方差的关系:niinXXnS122)(1.12*nSnn注1°当n较大时,差别微小;与22*nnSS2°当n较小时,.22*有更好的统计性质比nnSS5)样本k阶(原点)矩;,2,1,11kXnAnikik其观察值.,,,2111kxnanikik6)样本k阶中心矩;,3,2,)(11kXXnBnikik其观察值.,3,2,)(11kxxnbnikik特例:XA1特例:22nSB样本矩具有下列性质:,,2DXEXX方差的期望设总体性质5.1请熟记此结论!!!的样本,则有为来自总体XXXXn),,,(21)()1(XE;1)()2(2nXD;1)()3(22nnSEn.)()4(2*2nSE证)()1(XE)1()(1niiXnEXE)(11niiXEnnin1121)()2(nXD)1()(1niiXnDXD.11)(1212212nnXDnninii]1[)(1222niinXXnESE]))(()([]))(()([1221XEXDXEXDninii222221111()().ninnnn221)()3(nnSEn)()(1212XEXEnnii221212*)()()()4(nnnnnnnSESESE例8nppDXnXD)1(1X),1(pB服从两点分布),,,(21nXXX是来自于总体分布的样本,是样本均值与修正样本方差,试计算:2SX和.,2ESXDXE和解利用样本矩的性质得pEXXE设对总体)1(,ppDXpEX由两点分布知).1(2ppDXES证,,,,21同分布独立且与因为XXXXn,,,,21同分布独立且与所以kknkkXXXX.)()()(21kknkkXEXEXE故有再根据第四章辛钦定理,即性质5.21..,nkrvsXXEX若独立同分布,且则0}1{lim01nniiXnP有存在,阶矩的若总体kkXEkX)(,1,2,.PkknAk则当时,由第四章关于依概率收敛的序列的性质知),,,,(),,,(2121kPkgAAAg.是连续函数其中g;,2,1),(,11knXnAkPnikik注性质5.2是下一章矩估计法的理论根据.由上述定理可得,),,,(21中抽取的一个样本是从总体设XXXXn将观测值按由小是其一个观测值,),,,(21nxxx到大的次序重新排列为)()2()1(nxxx(2)次序统计量定义时取值为当,),,(),,,(2121nnxxxXXX由此得到取值为),,2,1()()(nkxXkk),,,()()2()1(nXXX称为样本),,,(21nXXX的次序统计量.的函数,都是样本由于每个),,,(21)(nkXXXX.min1)1(称为最小次序统计量iniXX.max1)(称为最大次序统计量ininXX.),,()()2()1(称为其观测值对应的nxxx.),,,(:21)(个次序统计量的第样本kXXXXnk注也是随机变量,但它们所以,)()2()1(,,,nXXX.一般不相互独立特别地,定理5.2).()]([)(1)(xpxFnxpnXn或分布函的分布密度为设总体)((xpX则有的次序统计量