概率论与数理统计(王明慈第二版)第5章数理统计的基本知识1-3节

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2020/6/251数理统计是概率论的应用;概率论是数理统计的理论基础.前言2.数理统计学的基本内容(1)有效地收集数据;(2)对数据初步处理;运用数理统计推断方法对(3)分析数据的信息,总体进行推断和预测,得出合理的结论.1.概率论与数理统计的关系2020/6/2523.数理统计与计算机的结合国内外著名的统计软件包:SPSS,SAS,Matlab,可以让你快速、简便地进行数据处理这大大普及了数理统计的应用.提供了强有力的技术支持.计算机的诞生与发展为统计方法(数据处理)R、Stata等,和分析,2020/6/253概率论中的一个最基本的假设——在实际中,我们往往不知道随机变量X确切分布,研究对象X这就是数理统计所讨论问题的应用背景.它需要用数理统计研究内容十分广泛,其中一类重要问题便是统计推断.4.实际案例的提出已有的部分信息去推断整体情况.的分布已知.2020/6/254比如:产前筛查(唐氏综合征)课题数据来源:温州市二医产前筛查中心实验室血清学指标:AFP,hCG等分析:以AFP为例,据大量的医学统计研究表明AFP服从或近似服从正态分布,其中分布的参数未知.要分析研究此课题,首先应利用AFP的数据(20054例)对参数进行估计——参数估计(第6章).2020/6/255一、总体与样本二、样本分布函数与直方图三、样本函数与统计量四、分布、t分布、F分布五、正态总体统计量的分布2第五章数理统计的基本知识基本内容:2020/6/256第一节总体与样本基本内容:一、总体与个体二、(简单)随机样本★样本的分布2020/6/257一、总体与个体总体:把研究对象的全体称为总体(或母体).个体:总体中每个研究对象称为个体.例如,考察温医07届本科生的学习质量.温医的该届本科生的全体称为一个总体;其中的每一个本科生称为一个个体.2020/6/258总体个体例1.考察某批电视机的寿命质量,的全体称为一个总体,这批电视机每台电视机称为一个个体.2020/6/259总体(指标)是指一个随机变量,随机变量的一个取值.通常,我们用随机变量X,Y,Z等表示总体.因此,在理论上可以把总体与概率分布等同起来.每个个体是注:实际上,我们常关注总体的某项或几项指标.2020/6/2510二、随机样本维随机变量.)是一个样本(n,X,,XXn211.样本的定义样本中所包含个体的数量n称为样本容量.从总体X中,随机地抽取n个个体:nXXX,,,21称为总体X的一个样本,记为注:),,,(21nXXX2020/6/2511(2)样本是被调查的100名08届该专业本科毕业例2.(1)总体是该地区08届该专业本科毕业生月薪;(3)样本容量是100.为了了解生命与科学专业本科毕业生的月薪情况,本科生的月薪情况,试问(1)什么是总体?(2)什么是样本?(3)样本容量是多少?生的月薪;调查了某地区100名2008届该专业的解:2020/6/25122.样本值),,,(21nxxx),,,(21nXXX每一次抽取nXXX,,,21所得到的n个确定的具体数值,记为称为样本的一个样本值(观察值).★数理统计的基本任务是:根据从总体中抽取的样本,利用样本的信息推断或预测总体的情况.2020/6/25133.简单随机样本两个特征:获得简单随机样本的抽样方法称为简单随机抽样.(1)代表性:(2)独立性:若来自总体X的样本),,,(21nXXX具有下列nXXX,,,21中每一个与总体X有相同的分布.nXXX,,,21是相互独立的随机变量.12(,,,)nXXX为容量n的简单随机样本.则称注:今后,凡提到样本都是指简单随机样本.2020/6/2514实际中,怎么样抽取简单随机样本?一般情况下总体都是有限总体.总体中个体总数不是太大时,可得到简单随机样本,当总体中个体总数比样本容量大得多时,采用不放回抽样方式,可近似得到简单随机样本.对于有限总体,采取放回抽样方式,2020/6/2515补充:随机变量的独立性)()(),(yYPxXPyYxXP定义:设X与Y是两个随机变量,若对于任意的实数x与y,有即)()(),(yFxFyxFYX则称X与Y是相互独立的.2020/6/2516(1)离散随机变量X与Y相互独立(X,Y)的联合概率函数p(x,y)=pX(x)pY(y);(2)连续随机变量X与Y相互独立(X,Y)的联合概率密度函数f(x,y)=fX(x)fY(y).随机变量的独立性可以扩充到n个随机变量的情形.2020/6/2517定理4.样本的分布;)(),,,(121niinxFXXX的分布函数为则样本的概率密度函数为若总体),(X)2(xf.),,,(21的样本为来自总体设XXXXn则样本的分布函数为若总体),()1(xFX;)(),,,(121niinxfXXX的概率密度函数为2020/6/2518注:熟记以上三种不同情形下样本的联合概率分布的具体形式是解决问题的关键!!),2,1,0(),()3(xxpX的概率函数为若总体;)(),,,(121niinxpXXX的概率函数为则样本2020/6/2519设总体X服从参数为),,,(21nXXX是来自于总体的样本,的联合概率函数.解:总体X的概率函数为所以),,,(21nXXX的联合概率函数为因为nXXX,,,21独立同分布,例4.2,1,0,!)(xexxpx)!(1exniixi的Poisson分布,求此样本,n1iix!xλn1iine),,,(21nxxxp且服从泊松分布..,,2,1,2,1,0nixi2020/6/2520.,,,21nXXX),,(2N),,,(21nXXX例5.),,(~2NXxexfx,21)(222)(),,,(21nXXX设总体X服从正态分布从总体X中抽取样本概率密度函数.求解:其概率密度为的联合概率密度函数为nixie12)(2221,)2(12122)(2/niixnne),,,(21nxxxf的联合nixi,,2,1,2020/6/2521用样本直方图来推断总体的概率密度函数用样本分布函数来推断总体的分布函数第二节直方图样本分布函数基本思路:2020/6/2522Step3:计算样本观测值落在各子区间的频数及频率;in/nnfiiStep2:适当选择边界点a、b,使b,ttta1l21bxxan**1,把区间(a,b)分成l个子区间);()()()(b,t,t,t,t,t,ta,1li1i211,,Step1:找出);,,,(),,,,(21*21*1nnnxxxmaxxxxxminx直方图的具体步骤:Step4:画直方图:以每个子区间长为底,以相应的为高作长方形,这一系列长方形构成样本频率直方图.1iiittΔt)(1iiitt/f一、直方图(histogram)和分点(8≤l≤15):2020/6/2523某工厂测量100个自动车床的质量,459362624542509584433748815505612452434982640742565706593680926653164487734608428115359384452755251378147438882453886265977585975549697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851例6.如下:得到样本观测值2020/6/2524SPSS软件中,画出自动车床质量X的直方图:2020/6/2525是来自总体X中样本)设(n21x,,x,x)(n21X,,X,X把观测值从小到大排列:,xxxn21)()(()则样本分布函数11,2,10)()()()((1)ni,xx,xxx,nixx,xFn1iin)(1x)(2x)(ix)(1ix)(nxx)(xFn1的观测值,二、样本分布函数2020/6/2526样本分布函数Fn(x)的性质且;1)(0)2(xFn;1)(,0)(nnFF;是非减函数)()1(xFn)()()3()()(xFxxxFniin点是处是右连续的在每个观测值,.1))()((limxFxFPnn,0.的跳跃间断点样本分布函数Fn(x)近似于总体分布函数F(x)当n→∞时,2020/6/2527第三节样本函数与统计量基本内容:一、统计量的定义二、常用统计量及其性质2020/6/2528一、统计量,的一个样本是来自总体设XXXXn),,,(21,的未知参数不含任何关于若样本函数XX,,Xgn1)(由样本推断总体情况,需要对样本进行“加工”,定义.信息集中起来.这就需要构造一些样本的函数,它把样本中所含的是一个则称),,,(21nXXXg统计量.2020/6/2529注:2°统计量用于统计推断,3º统计量是样本的函数,的观测值,是样本设),,,(),,,(2121nnXXXxxx是则称),,,(21nxxxg.),,,(21的观测值nXXXg总体X的未知参数;统计量的分布称为抽样分布.故不应含任何关于它是一个随机变量,;是随机变量统计量),,,(n21XXXgo12020/6/2530(未知)的Poisson分布,nXXX,,,21为来自总体的样本,判断下列那些是统计量?)((1)n11X,,XminT其他,λX,Tn1ii201(2)1n/XXT13(3)设总体X服从参数为例7.是不是是2020/6/2531例8.;312)(.iiXB其中已知,未知,设X1,X2,X3来自正态总体X~(,2)的样本,问下列哪些是统计量?()A.(X1+X2+X3)/3;;)(.312iiXCD.X1;E.Max{X1,X2,X3}.ABDE2020/6/2532,,,,21的一个样本是来自总体设XXXXn(1)样本均值;11niiXnX.11niixnx其观测值1.样本矩的定义可用于推断:总体均值E(X)..,,,21是这一样本的观测值nxxx它反映了总体均值的信息二、几个常用统计量2020/6/2533其观测值可用于推断:总体方差D(X).(2)样本方差)(11122niXnXninii)X(XnS12211niixxns122)(11.11122niixnxn它反映了总体方差的信息2020/6/2534niiXXn12)(11.11122niiXnXn2SS(3)样本标准差其观测值niixxn12)(11.11122niixnxn2ss2020/6/2535其观测值(5)样本k阶中心矩其观测值(4)样本k阶原点矩)21(1,,k,XnVn1ikiknikikxnv11)21()(1,,k,XXnUn1ikiknikikxxnu1)(1比较总体k阶原点矩E(Xk)比较总体k阶中心矩E[X-E(X)]k2020/6/25362.样本矩的性质;μ,,2DXEXX方差的期望设总体则有的样本为来自总体,XXXXn),,,(21)XE(o1)(2oXD)(3o2SE;12σn.σ22020/6/2537例8.nppDXnXD)1(1设总体X服从两点分布B(1,p),),,,(21nXXX是来自于总体分布的样本,是样本均值与样本方差,试计算:2SX和

1 / 45
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功