计量经济学的统计学基础知识.ppt

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第二章统计学基础知识第一节常用的统计量——平均数、方差第二节常用的概率分布复习:什么是计量经济学?计量经济学与其他学科有什么关系?计量经济学研究现实问题的程序是什么?第一节常用的统计量——平均数、方差一、算术平均算术平均(arithmeticmean)就是我们日常生活中使用的普通的平均数,其定义如下式:nXnXXXXn21二、加权算术平均加权平均(weightedarithmeticmean)是将各数据先乘以反映其重要性的权数(w),再求平均的方法。其定义如下式:wX212211三、变化率变化率的定义如下式:),3,2(11ntXXXttt四、几何平均几何平均(geometricmean)是n个数据连乘积的n次方根,其定义如下式:nnXXXG21五、移动平均所谓移动平均(movingaverage),就是对时间序列数据的前后数据求平均,将不必要的变动(循环变动、季节变动和不规则变动)平滑(smoothing),也即剔除这些变动,从而发现长期变化方向的一种方法。通常,移动平均大多用简单的奇数项来计算,下面是3项移动平均和5项移动平均的定义。3项移动平均:311ttttXXXX5项移动平均:52112ttttttXXXXXXEXCEL演示三项移动平均五项移动平均六、方差与标准差为了了解数据的结构,有必要考察数据的集中趋势和分散的程度。对于集中的趋势,我们从前面学习过的算术平均中已经大体有所了解,而对于分散的程度,通过对方差(variance)与标准差(standarddeviation),以及下一节将要介绍的变动系数的计算,能够得到很多信息。方差的计算方法是,先将每个数据与算术平均数之差(即离差)的平方相加求和,再除于样本数减一。而标准差是方差的正的平方根。由于方差是通过平方计算的,它与原数据的次数有所不同,而标准差由于是方差的平方根,因而又与原数据的次数相同。因此,标准差与原数据的单位相同,而方差则不附加单位。方差S2的定义分别如下式(样本):1)()()(222212nXXXXXXsn2)(11XXni标准差S的的定义分别如下式:2SS方差七、变动系数变动系数(coefficientofvariation)又称变异系数,它用标准差S除于算术平均数的商来表示。变动系数CV的定义如下式:XSCV算术平均数标准差八、标准化变量标准差变量(standardizedvariable),又称基准化变量,它是用来测量某个数据的数值与算术平均数的偏离程度,是标准差s的多少倍。借此可以看出该数据在全体数据所处的位置。标准化变量z的定义如下式:sXXXz标准差算术平均数九、相关系数所谓相关系数(correlationcoefficient)是用来测量诸如收入与消费、气温和啤酒的消费量、汇率与牛肉的进口价格等两个变量X、Y之间的相互关系的大小和方向(正或负)的系数。通过计算相关系数,可以知道X与Y之间具有多大程度的线性(linear)关系。相关系数R的定义如下式:22)()())((YYXXYYXXR2222)()(YYnXXnYXXYn相关系数的R的取值范围为,R的取值具有以下的不同含义:(1)R=1完全正相关(perfectpositivecorrelation)(2)R0正相关(positivecorrelation)(3)R=0不相关(nocorrelation)(4)R0负相关(negativecorrelation)(5)R=-1完全负相关(perfectnegativecorrelation)为什么会有上述结果?请结合公式思考。第二节常用的概率分布经济计量模型研究具有随机性特征的经济变量关系。本节将对数理统计中常用的随机变量分布及一些概念作一简单回顾。一、概率分布二、总体与样本三、正态分布四、抽样分布一、概率分布随机变量在各个可能值上出现的概率的大小的情况,叫概率分布。概率分布可用概率函数描述。离散性随机变量X的可能取值为xi,P为概率,则概率函数为P(X=xi)i=1,2,3,…n概率函数满足P(X=xi)≥0;1)(1niixXP一、概率分布连续性的随机变量概率函数1)(0)()()(dxxfxfxfxdxxfbXaPbaba;函数满足条件为概率密度函数。密度其中)(dxxfxXPxFxXPxFxFxxXxixxii)()()()()(.连续性随机变量,离散性随机变量,)(的函数,记为值的累积概率是取小于某个随机变量率的累积,即数表示。分布函数是概概率分布还可用分布函二、总体与样本数理统计中把所研究对象的全部单位所组成的集合,叫做总体。从总体中抽出的部分单位所组成的集合,叫做样本。三、正态分布当连续的随机变量的概率密度函数形式为时,称X的分布为正态分布,记为X~,密度函数中和是X的数学期望和方差。222)(21)(xexf),(2N2三、正态分布(总体分布)当和时,称X服从标准正态分布,记为X~。对于非标准正态分布的X,总可以作如下变换,,使Z服从标准正态分布。012),(10NXZ-4-3-2-101234四、抽样分布1、分布2、t分布3、F分布注:正态母体子样分布性质:2iiiiiaUDaUEXaUX22)()(子样是来自正态母体的随机1、分布22niiX122)(统计量定义为Xi符从正态分布。xi服从标准正态分布,服从自由度为n的卡方分布,卡方分布其实就是残差平方和。niix12222000)()2(21)(2212222222当当nnnneng分布的密度函数为:nnE22)(nnD22)(22其数学期望其方差为,2S2统计量的条件,所以服从自由度为n-1的分布。2S2样本方差符合N=4N=15如果随机变量X服从标准正态分布N(0,1);随机变量服从自由度为n、方差为2n的分布。并且X和相互独立,则统计量:222nXt2服从t分布(注:可以将分子理解为符合正态分布的参数,分母看作其标准差。2、t分布t分布的密度函数为212)1()2()21()(nnntnnntf其数学期望E(t)=0,方差22nnt分布的特点是:左右对称;当n很大时,非常接近正态分布。对于从标准正态分布中的总体中抽的容量为n的简单随机样本,其样本均值与样本标准差S构成如下统计量。x1/nSxt服从自由度为n-1的t分布,记为t~t(n-1)。注意:这里的分母是子样标准差除以自由度,实际上是子样均值的标准差!只有这样才与分子保持一致性。分子被平均了,分母当然也要平均!t分布在小样本(n30)统计推断中占有重要的地位。T分布图形:正态分布相当于标准差为1的t分布。而t分布的标准差多小于1。因而出现这种尾部肥大的现象。正态分布T分布如果随机变量Xi(i=1,2,3,…n),Yi(i=1,2,3,…n)是相互独立的,而且服从相同的正态分布。令3、F分布),(2N222212213,2,1,)(3,2,1,)(niYYSniXXSii)1/()1/(222121nSnSF11n12n11n12n则统计量服从第一自由度、第二自由度的F分布。记为F~F(,)3、F分布注:F分布在方差分析中有着重要的作用。例如判断两个正态分布总体的方差是否有显著差异,需要利用F分布。其分子与分母其实是两个方差,在进行回归检验时正是利用F函数这个特点。F分布图形例1:正态分布检验设甲、乙两台机床生产同类型产品,其产品重量分别服从方差为70克()与90克()的正态分布。从甲机床中随机地取出35件,其平均重量是137克,独立地从乙机床随机取出45件,其平均重量130克,问在显著性为0.01时,两台机床的产品就重量而言有无显著差异?2122解:理论:1222221102211212211212221112112102211222111}{)1,0(~,)1,0(~)(),(~),(~),,(~:;:,),(~),(~H,uU,uuUPNnnYXUrightHifNnnYXUnnNYXnYnNXHHifNYNX则接受如果查附表知已知0005.0222211,58.25.358.2,01.05.34590357013013790,130,4570,137,35Huuynxn拒绝例2:比较两种安眠药A、B的疗效,以10个患者为实验对象,数据如下:患者12345678910X1.90.81.10.1-0.14.45.51.64.63.4Y0.7-1.6-0.2-1.2-0.13.43.70.802z=x-y1.22.41.31.3011.80.84.61.4问:在显著性水平为0.01时,两种药的疗效是否相同?(T分布)解:由于患者相同,可以建立z变量,然后假设z的均值是0,对其进行t单侧检验即两种药效不同接受拒绝,062.425.3)9(062.439.058.11/,01.00:0:),(~1001.0102H,HtnsztHHNzYXz25.3)9(001.0t062.41/2nszt例3(卡方分布):设已知维尼纶纤度在正常生产条件下服从正态分布N(1.405,0.002304)。在生产某段时间,抽取了5根纤维,测得其纤度为1.32,1.55,1.36,1.4,1.44.问该段时间母体方差是否正常?(显著性水平是0.1)解:纤度方差有变化拒绝,HxxnsxnHi22020295.02295.0205.02202202222020048.0:)4(488.9)4(,711.0)4(5.13048.00312.0)(414.1,5048.0:9.4913.5例4(F):甲乙两台机床加工同一种轴。从这两台机床加工的轴中随机抽取若干根,没得直径(单位为毫米)为:假定各台机床加工轴的直径分别服从正态分布,试比较甲乙两台机床加工的精度有无显著差异。显著性取0.05(拒绝原假设水平)。如果是单侧检验呢?机床甲20.519.719.820.420.1201919.9机床乙`9.720.820.519.819.420.619.2解:0025.0025.012*22*1212*22*22*2212*1122210),7,6(17.5)7,6(84.1216.0397.01,)1,1(~397.0,20,7216.0,93.19,8:HFFFssFFbecausennFssFsxnsxnH接受F分布图形17.5)7,6(025.0F84.1216.0397.012*22*ssF作业:例2:显著性改为0.02时,问两种药的疗效是否相同;例4:显著性取0.01时,两种机床的加工精度有无区别?重点理解什么是显著性?显著性解释数理统计中的显著性是划分原假设与备择假设界线,一般是原假设成立是1-;在软件中给出的显著性可以看作是原假设成立的概率。显著性越小,即原假设正确的错误的概率越小。

1 / 50
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功