第七章数理统计的基本概念1在终极的分析中,一切知识都是历史.在抽象的意义下,一切科学都是数学.在理性的世界里,所有的判断都是统计学.----C.R.劳7.1数理统计学的基本概念7.1.1引例7.1.2统计与数理统计概述7.1.3总体与样本7.1.4统计量3引例:某工厂生产大批电子元件.在实际应用中,我们可以提出许多感兴趣的问题1.这批元件的平均寿命如何?2.这批元件的寿命服从什么分布?3.如果你是使用单位.要求平均寿命能达到某个指定的数,例如5000小时.问这批元件可否被接受?4.如何获得所需要的数据?7.1.1引例47.1.2统计和数理统计学概述统计学:在日常生活中.”统计”相当于”计数”.小至一个家庭,单位,大至国家,都有许多计数即统计的工作.丹麦统计史学家哈尔德认为,”统计学”和”统计学家”词出于意大利语:统计学即国情学,对象是国务活动家感兴趣的事实,而统计学家则是”处理国务的人”一、统计浅谈5数理统计:它是使用概率论和数学的方法,研究怎样用有效的方法收集(通过试验或观察)带有随机误差的数据,并在设定的模型(统计模型)之下,对这种数据进行分析(统计分析)以对所研究的问题作出推断(统计推断).1.数据必须带有随机性的影响,才能成为数理统计学的研究对象数据随机性的来源:国家:State.统计学Statistics6Example1.全国人口抽样调查Example2.比较两种小麦品种的优良(1)是问题中所涉及的研究对象为数很大,我们不可能全部加以研究,而只能用“一定的方式”挑选其中一部分去考察。(2)数据随机性的另一种来源是试验的随机误差,这是指那种在试验过程中未加控制,无法控制,甚至不了解的因素所引起的误差。72.所谓有效的方法(1)是可以建立一个在数学上可以处理并尽可能简单方便的模型来描述所得的数据;(2)数据中要包含尽可能多的,与研究的问题有关的信息.8——从部分推断整体的性质,是一种在对有关信息缺乏完全掌握的情况下进行推断的方法——统计规律是关于群体的规律,“统计规律”这个提法的启示是:教人看问题不可绝对化,因而有思想方法上的意义.统计规律未必蕴涵因果关系.数理统计的特点归纳与演绎统计规律与因果关系二、数理统计的特点:9Example2:吸烟与肺癌的关系•吸烟增加患肺癌,其他癌症以及诸如心脏病等严重疾病的危险.•1948-1949,英国学者多尔与希尔从伦敦20家医院中收集了709名肺癌病人以及对照组-另709名患肺癌者的吸烟情况的资料,按吸烟斗还是纸烟,男或女,将烟吞进肺里与否等指标分类.Example1.设想有一枚价值高的钻石,想用一架天平尽可能准确地称出它的重量有多少?10统计结论:吸烟与患肺癌呈明显的正相关.如何理解这个统计规律的意义?首先,统计规律是关于群体的规律。可能会有疑问:群体是抽象的,每件事都必须落实到具体的个体,患不患肺癌是每个人的事,这样关于群体中的趋势的规律有何意义?1.这种规律反映了某种客观存在的现实,有科学和认识意义。2.对个体有警戒作用。11统计应用实例:1.孟德尔遗传定律的发现;2.中国患SARS的病人的死亡率是多少;3.太阳黑子的活动有周期性的规律吗?124.股票分析系统5.经济统计分析总体选择个体样本观测样本样本观察值(数据)数据处理样本有关结论推断总体性质统计量为了集中简单随机样本所带来的总体信息,考虑样本的函数,且不含任何未知参数,这样的“不含未知参数的样本的函数”称为统计量。统计量的分布称为抽样分布.15——对随机现象进行观测、试验,以取得有代表性的观测值——对已取得的观测值进行整理、分析,作出推断、决策,从而找出所研究的对象的规律性数理统计的分类描述统计学推断统计学16参数估计假设检验回归分析方差分析推断统计学推断统计学17总体——研究对象全体元素组成的集合所研究的对象的某个(或某些)数量指标,是一个随机变量或多维随机变量.若为一个随机变量,可记为X.例如,某钢铁厂生产的钢锭的强度.X的分布函数和数字特征称为总体的分布函数和数字特征.总体和样本§7.1.3基本概念18抽样——做随机试验并记录其结果样本——从总体中抽取的部分个体进行观测.称为总体X的一个容量为n的样本观测值,或称样本的一个实现.),,,(21nxxx),,,(21nXXX用表示样本,n为样本容量.样本空间——样本所有可能取值的集合.个体——组成总体的每一个元素个体的数量指标,可以看作随机变量X的某个取值.用表示.iX19设是来自总体X的一个样本,它满足:),,,(21nXXX一般地,对有限总体,采用放回抽样所得到的样本为简单随机样本,但使用不方便,常用不放回抽样代替.当总体中个体的数目N与样本容量n之比N/n10时,可将不放回抽样近似地看作放回抽样.nXXX,,,21(1)与X有相同的分布nXXX,,,21(2)独立性:相互独立),,,(21nXXX则称为简单随机样本.简单随机样本20设总体X的分布函数为F(x),为总体X的简单随机样本,),,,(21nXXXniinxFxxxF121)(),,,(总若总体X的概率密度函数为f(x),则niinxfxxxf121)(),,,(总),,,(21nXXX的联合概率密度函数为),,,(21nXXX则的联合分布函数为21设是取自总体X的一个样本,),,,(21nXXX),,,(21nrrrg),,,(21nxxxg为一实值连续函数,且不含有未知参数,),,,(21nXXXg则称随机变量为统计量.),,,(21nxxx若是一个样本值,称),,,(21nXXXg的一个样本值为统计量定义统计量22例是未知参数,22,,),(~NX但niiX1221不是统计量.是一样本,),,,(21nXXXniiniiXXnSXnX1221111是统计量,其中),(~2NXi则若,已知,则为统计量23常用的统计量niiXnX11)1(为样本均值niiXXnS12211)2(为样本方差niiXXnS1211为样本标准差),,,(21nXXX设是来自总体X的容量为n的样本,称统计量24nikikXnA11)3(为样本的k阶原点矩nikikXXnB11)4(为样本的k阶中心矩222122211111ninininiBXXSnnSXXSnn25例如1AX(5)顺序统计量设),,,(21nXXX为样本,),,,(21nxxx为样本值,且**2*1nxxx当),,,(21nXXX取值为),,,(21nxxx时,定义随机变量nkxXkk,,2,1,*)(则称统计量)()2()1(,,,nXXX为顺序统计量.其中,}{max},{min1)(1)1(knknknkXXXX26样本方差与样本二阶中心矩的关系niniiniiXXXX12112222122XnXnXnii212XnXnii)(22XAn故221nnSSn据定义显然。222BAXniiiniiXXXXXX12212)2()(证明:22222,1nnnSAXSSn1)272nS2S推导设2)(,)(XDXE则niiXnEXE1121nXD2)221)(nnSEn22)(SE222()()nESEAEXXEXDXnEnii212122221n21nn221)(nSnnESE221nESnn28例1从一批机器零件毛坯中随机地抽取10件,测得其重量为(单位:公斤):210,243,185,240,215,228,196,235,200,199求这组样本值的均值、方差、二阶原点矩与二阶中心矩.解),,,(1021xxx令),,,,,,,,,(1992002351962282152401852432102943.433)(9110122iixxs101225.47522101iixA0.390)(101109101222iixxsB19.217)199200235196228215240185243230(101x则30例2设总体X的概率密度函数为101)(xxxxf为总体的样本,求),,,(5021XXX(1)X的数学期望与方差(2))(2SE(3))02.0(XP解(1)0d)()(11xxxXEXE1001d2501)(501)(501)(1022xxxXEXDXD318414.02.0Φ121.0002.012)02.0(1)02.0(ΦXPXP)1001,0(~NX(近似),(3)由中心极限定理(2)21)()()(22XEXDSE32§7.3统计量的分布确定统计量的分布——抽样分布,是数理统计的基本问题之一.由于正态总体是最常见的总体,故本节介绍的几个抽样分布均对正态总体而言.问题:计算往往很复杂方法:求随机向量的函数的分布可得到抽样分布.33(1)正态分布则niiiniiiniiiaaNXa12211,~特别地,nNXnXnii21,~1则统计中常用分布nXXX,,,21),(~2NXi若i.i.d.~若nXXX,,,21),(2iiNi.i.d.~34(2))(2n分布(n为自由度)定义设nXXX,,,21相互独立,且都服从标准正态分布N(0,1),则niinX122)(~n=1时,其密度函数为0,00,21)(221xxexxfx2468100.20.40.60.811.235n=2时,其密度函数为0,00,21)(2xxexfx为参数为1/2的指数分布.2468100.10.20.30.4360,00,)(21)(12222xxxexfnxnn一般地,其中,01)(dtetxtx在x0时收敛,称为函数,具有性质)(!)1()2/1(,1)1(),()1(Nnnnxxx)(2n的密度函数为自由度为n的37n=2n=3n=5n=10n=1538nnDnnE2)(,)(122)(,),(),(22122121222121nnXXXXnXnX+~+则相互独立,若正态分布时,)(32nn分位数有表可查分布的)(42n分布的性质)(2n39nXXX,,,21相互独立,证1设niiiniNXXn122,,2,1)1,0(~)(则1)(,1)(,0)(2iiiXEXDXEnXEnEnii122)(3d21)(2244xexXExi2)()()(2242iiiXEXEXDnXDnDnii2)(12240作业习题七1,2,341