数理统计学是一门应用性很强的学科.它是研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出推断和预测.分析这些数据的方法.概括起来可以归纳成两大类:参数估计──根据数据,对分布的未知参数进行估计.假设检验──根据数据,用一些方法对分布的未知参数进行检验.它们构成了统计推断的两种基本形式.这两种推断方法渗透到了数理统计的每个分支.总体与样本实际上,我们真正关心的并不是总体或个体的本身,而是它们的某项数量指标.因此,我们应该把总体理解为那些研究对象上的某项数量指标的全体.说明一、总体在统计学中,将我们研究的问题所涉及的对象的全体称为总体,而把总体中的每个元素称为个体.例如:我们想要研究一家工厂的某种产品的废品率.这种产品的全体就是我们的总体,而每件产品则是个体.对一个总体,如果我们用X表示它的数量指标,如果我们随机地抽取个体,则X的值也就随着抽取的个体的不同而不同.所以X是一个随机变量,称为表征总体的随机变量二、总体的分布X的分布函数和数字特征分别称为总体的分布函数和数字特征.根据X的不同可分为离散型总体和连续型总体.总体所包含的个体总数称为总体容量,总体容量是有限的,则称该总体为有限总体.如果总体所包含的个体数量是无限的,则称该总体为无限总体.三、有限总体与无限总体通常在总体所含个体数量比较大时,我们就把它近似地视为无限总体二、简单随机样本随机现象的统计规律性必须通过大量重复试验才能体现出来.试验完全试验:部分试验:因成本大,可能具有破坏性故不可取抽样抽样——从总体中抽取的部分个体的过程.样本——抽样得到的一组试验数据.样本容量——样本中所含个体的数量由于是根据样本取值来估计总体分布,因此自然要求样本它具有代表性随机性:每个个体被抽到的机会均等独立性:抽取后总体分布不变满足以上条件的抽样称为简单随机抽样实现方式:有限总体:采取有放回的方式无限总体:可采取无放回的方式抽样——从总体中抽取的部分个体的过程.抽出的个体称为样本称为总体X的一个容量为n的样本观测值.),,,(21nxxx),,,(21nXXX用表示,n为样本容量.总结:若总体X的样本满足:),,,(21nXXXnXXX,,,21(1)与X有相同的分布nXXX,,,21(2)相互独立简单随机样本简称样本为简单随机样本则称,),,,(21nXXX简称样本值值测称为样本的观察的确切数值得到样本观测后进行一次具体的抽样并在对总体,)(x,x,,,,,n2121xXXXXn设总体X的分布为F(x),则样本(X1,X2,…,Xn)的联合分布为),,(),,,(221121nnnxXxXxXPxxxF)()()(2211nnxXPxXPxXPniinxFxFxFxF121)()()()((1)当总体X是离散型时,其分布律为iipxXP)(,2,1i样本的联合分布律为)()()(),,(22112211nnnnxXPxXPxXPxXxXxXPniixXP1)((2)当总体X是连续型时,X~f(x),则样本的联合密度为niinxfxxxf121)(),,,(设总体X的分布函数为F(x),则样本niinxFxxxF121)(),,,(总若总体X的密度函数为f(x),则样本niinxfxxxf121)(),,,(总的联合概率密度为),,,(21nXXX的联合分布函数为例设),(~2NX(X1,X2,…,Xn)为X的一个样本,求(X1,X2,…,Xn)的密度。解(X1,X2,…,Xn)为X的一个样本,故),(~2NXiniinxfxxxf121)(),,,(nixie12)(2221niixne122)(2121ni,,2,1例设某电子产品的寿命X服从指数分布,密度函数000)(xxexfx(X1,X2,…,Xn)为X的一个样本,求其密度函数。解因为(X1,X2,…,Xn)为X的一个样本,)(~iixfXniinxfxxxf121)(),,,(其他0),,2,1(01nixeinixi其他0),,2,1(01nixeixnnii例某商场每天客流量X服从参数为λ的泊松分布,求其样本(X1,X2,…,Xn)的联合分布律。解exxXPx!)(,2,1,0xniinntXPtXtXtXP12211)(),,,(niiteti1!nntetttnii!!!211统计量定义:设X1,X2,…,Xn是来自总体X的一个样本,g(X1,X2,…,Xn)是n维随机变量的函数,称为样本函数),,,(21nxxx若是一个样本值,称),,,(21nxxxg),,,(21nXXXg的一个样本值为统计量若g中不含任何未知参数,则称为统计量.),,,(21nXXXg总体选择个体样本观测样本样本观察值(数据)数据处理样本有关结论统计的一般步骤:推断总体性质统计量“不含未知参数的样本的函数”称为统计量。常用的统计量niiXnX11)1(为样本均值niiXXnS12211)2(为样本方差niiXXnS1211为样本标准差),,,(21nXXX设是来自总体X的容量为n的样本,称统计量结论设2)(,)(XDXE则niiXnEXE1121nXD2}11{)()2(122niiXXnESE(1)}11{122niiXnXnEnikikXnA11)3(为样本的k阶原点矩nikikXXnB11)4(为样本的k阶中心矩例如,一阶样本原点矩就是样本均值而样本方差与样本二阶中心矩不同关系式221SnnB(5)样本最大值与样本最小值设),,,(21nXXX为样本,当),,,(21nXXX取值为),,,(21nxxx时,}{max},{min1)(1)1(knknknkxXxX分别称为样本最大值与样本最小值nnnnxFxXPxXPxXPxXxXxXPxXXXPxFxF)()()()(),,()),(max()(),(212121max则设总体的分布函数为nnnnnxFxXPxXPxXPxXxXxXPxXXXPxXXXPxFxF)(11)()()(1),,(1)),(min(1)),(min()(),(21212121min则设总体的分布函数为几个常用的统计量样本均值niiXnX11样本方差niiXXnS122)(11样本均方差niiXXnS12)(11样本k阶原点矩nikikXnA11,2,1knikikXXnM1)(1,2,1k样本k阶中心矩例从一批机器零件毛坯中随机地抽取10件,测得其重量为(单位:公斤):210,243,185,240,215,228,196,235,200,199求这组样本值的均值、方差、二阶原点矩与二阶中心矩.解),,,(1021xxx令)199,200,235,196,228,215,240,185,243,210(例119.217)199200235196228215240185243230(101x43.433)(9110122iixxs101225.47522101iixA0.390)(101109101222iixxsB二、正态总体的抽样分布定理)1,0(~/NnXU证明niiXnX11组合,故服从正态分布。niiXEnXE1)(1)(nXDnXDnii212)(1)(),(~2nNX1、若),(~,,,221NXXXn则是n个独立的正态随机变量的线性)1,0(~NnXU例在总体中,随机抽取一个容量为36的样本,求样本均值落在50.8到53.8之间的概率.)3.6,52(2NX解)36/3.6,52(~2NX故6/3.6528.506/3.6528.53)8.538.50(XP8239.0)1429.1()7143.1(例26/3.6528.536/3.6526/3.6528.50XP