定量分析方法PPT课件

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

定量分析方法2一、定量分析方法概述二、定量分析的一般方法三、定量分析方法使用一、定量分析方法概述1.什么是定量分析方法2.定量分析方法的分类3.定量分析方法的一般程序4.数据分布的一般特征1.1什么是定量分析方法早期的公共管理推荐经验科学的研究方法,把观测、实验、对比、抽样、案例、访谈、调查等方法,作为主要方法。20世纪40年代以后,开始引入运筹学,控制论,系统工程、系统分析、损益分析,计算机模拟等定量分析方法。定量分析的定义:借助于经济学,数学,计算机科学、统计学,概率论以及帮助决策的决策理论来进行逻辑分析和推论。1.2定量分析方法的分类回归分析法时间序列分析法层次分析法决策法优化方法投入产出分析法数据整理与鉴别经过数据搜集得到的数据通常是杂乱无章的,同时由于数据来源的广泛性、渠道的多样性,使得其真实性和可靠性很难保证。这些数据还远远不能达到使用的要求,必须对其进行鉴别和整理之后,才能在此基础上进行更深入的研究。数据整理是属于数据的初加工,一般流程可用下图表示:形式整理:将众多数据进行形式上的排序,不涉及数据具体内容,而是凭借某一外在依据进行分门别类的处理。(外在依据:学科,使用方向,内容要点。)内容整理:在形式整理得基础上进一步深化,从内容角度对数据再处理。简单举例:国民经济数据,可能得到的一手资料就非常纷繁,那可能的一种整理方式,首先形式整理分为第一产业、第二产业、第三产业;内容整理再有可能对第一产业数据进一步分解,比如按季度划分,分别统计报表,提炼增长趋势等观点。1.4数据分布的一般特征集中趋势的测度找出一组数据的中心或中间位置。相关概念:众数(频此出现最多的数,分单众数、复众数、无众数)、中位数(排序了的顺序数据的中间那个数)、分位数(特殊的中位数)、平均数、加权平均数;离散趋势的测度极差(全距,衡量一组数据跨度的系数);平均差;方差和标准差;两者需要结合来看:数据的离散程度越大,集中趋势的测度值对该组数据的代表性就越差;离散程度越小,其代表性越好。以两组数据为例:0、50、100;48,50,52二、定量分析的一般方法1.回归分析法2.时间序列分析法3.层次分析法4.决策法5.优化分析方法2.1回归分析法回归分析法:是运用数理统计方法从事务已知状态预测未来状况的一种定量研究方法。它的基本功能是从涉及多因素相互交织的复杂现象中寻找规律,推断出有意义的结论。回归分析法着眼于研究变量之间的互相关系,把其中一些因素作为控制的变量,而把另一些随机变量作为因变量,利用适当的数学模型尽可能趋向于趋势变化的均值描述它们的关系的分析基本步骤:搜集数据是后续所有工作的基础。设定回归方程就是明确自变量和因变量关系的过程。因变量是果,是我们待预测的因素;自变量是因,它的发展规律将影响因变量的趋势,选择什么自变量,要能够代表预测对象的发展变化,特征参数的选择将直接影响到预测结果的准确性。注意趋势的延续性。2.1回归分析法1回归分析方法概述2一元线性回归分析3多元线性回归分析4一元非线性回归分析5多重线性回归6Excel的函数使用2.1.1回归分析方法概述一种建立统计观测值之间的数学关系的方法通过自变量的变化来解释因变量的变化,从而由自变量的取值预测因变量的可能值自变量与因变量的相关关系a.Y与Xk正线性相关b.Y与Xk负线性相关c.Y与Xk不相关XkYYYXkXk2.1.1.1最小二乘法原理:因变量估计值与观测值之间均方误差极小(使残差平方和最小的方法)在实际操作中,可以通过Matlab或者Excel种的回归分析工具计算系数a和bniyiniyixiyxiniiiniiMYMYMXbbMMaYbXanYYnMSE1212121')())(()极小()(1)(12.1.1.2回归模型的检验判定系数R2用来判断回归方程的拟合优度。通常可以认为当R2大于0.9时,所得到的回归直线拟合得较好,而当R2小于0.5时,所得到的回归直线很难说明变量之间的依赖关系。t统计量如果对于某个自变量,其t统计量的P值小于显著水平(或称置信度、置信水平),则可认为该自变量与因变量是相关的。F统计如果F统计量的P值小于显著水平(或称置信度、置信水平),则可认为方程的回归效果显著。2.1.1.3回归预测的步骤第一步,获取自变量和因变量的观测值。第二步,绘制XY散点图。第三步,写出带未知参数的回归方程。第四步,确定回归方程中参数值第五步,判断回归方程的拟合优度。第六步,进行预测2.1.2一元线性回归【例5-1】“阿曼德匹萨”是一个制作和外卖意大利匹萨的餐饮连锁店,其主要客户群是在校大学生。为了研究各店铺销售额与店铺附近地区大学生人数之间的关系,随机抽取了十个分店的样本,得到的数据如下:试根据这些数据建立回归模型。然后再进一步根据回归方程预测一个区内大学生人数为1.6万的店铺的季度销售额。2.1.2一元线性回归求回归系数a和b的方法规划求解斜率:SLOPE()截距:INTERCEPT()LINEST()函数回归分析报告散点图添加趋势线求判定系数R2的方法拟合度:RSQ()函数回归分析报告趋势线2.1.3多元线性回归多元线性回归模型的一般形式多元线性回归预测步骤第一步,获得候选自变量和因变量的观测值。第二步,从候选自变量中选择合适的自变量。有几种常用的方法:最优子集法(R2最接近1)向前增选法等第三步,确定回归系数,判断回归方程的拟合优度。第四步,根据回归方程进行预测。kkXaXaXaaY...221102.1.4一元非线性回归用一条曲线来拟合因变量对于自变量的依赖关系通过变量替换把问题转化为一元或多元线性回归问题后,用线性回归分析的方法建立回归模型,并进行预测(即化非线性回归为线性回归)对于更复杂的情况,现在有很多拟合工具可以使用,如Origin、Matlab等2.1.4.1幂函数曲线拟合XYa1b-1b-1(b0)01XYab1b1(b0)OObUaVXbaaXYYaXYln)两边取对数(lnln)ln(ln)lnV、XlnU(设:bb2.1.4.2指数函数曲线拟合bXaVbXaaYYVaYbXbXln)两边取对数(ln)eln(ln)ln(e设:XYa(b0)XYa(b0)OO2.1.4.3对数函数曲线拟合bUaYXUXbaY)ln(ln设:XY(b0)XY(b0)OO2.1.4.4双曲线函数拟合bUaYXUXbaY)1(1设:XY(b0)XY(b0)OOaa2.1.4.5二次多项式及三次多项式32121dXcXbXaYcXbXaYXY(c0)XY(c0)OOXYO2.1.4.6S型(Logistic)曲线拟合xAyyKyyKAeyAeyKAeyAeKyxxxxln)ln()1(1设:2.1.4.7回归分析的步骤回归分析步骤观察XY散点图,确定拟合曲线类型(对数曲线),写出带未知参数的回归方程确定参数值,方法有:回归分析规划求解变量替换添加趋势线用回归方程进行预测(注:在拟合曲线类型不能确定时,可选不同类型进行尝试,比较结果)XbaYln如:2.1.4.8回归分析举例某企业想了解公司某种产品的产量与收益之间有何关系,为此收集整理了历年的产量收益数据资料。试根据这些资料建立适当模型说明产量与收益之间的关系。下面分别为直线拟合和对数拟合的结果,从结果中可以看出,对数拟合更合适作线性回归拟合做对数拟合收益与产量线性拟合结果y=0.0196x-2.0861R2=0.84820510152025303540455005001000150020002500产量(X)收益(Y)收益(Y)收益估计值收益与产量对数拟合结果-505101520253035404505001000150020002500产量(X)收益(Y)收益(Y)收益估计值2.1.4.8回归分析举例产量XResidualPlot-10-5051005001000150020002500产量X残差U=LN(X)ResidualPlot-10-5051066.577.58U=LN(X)残差2.1.5多重线性回归在实际问题中,自变量的个数可能多于一个,随机变量y与多个可控变量x1,x2,x3,…,xk之间是否存在相关关系,则属于多重(元)回归问题。多重线性回归模型随机变量与之间的线性关系y12,,,kxxx01122kkyxxx其中2~0,N012,k,,,,未知则上式称为多重线性回归模型。多重线性回归模型的矩阵形式)),0(N~(则:有矩阵形式11x1Y记:22121122111121EeeXYexxxxxXyyynnnknkkn考虑多元函数确定的最小二乘法20111niikikiQyxx目标:确定使最小01,,,kQ方法:0,1,2,,iQik解得:kkxxxy22110ˆ——多重线性回归方程有效性检验——方差分析法线性回归方程是否有统计意义,可检验假设01122kkyxxx012:0kH是否成立方法:方差分析法,将总离差平方和分解ERniniiniiTSSyyyyyyS121212)ˆ()ˆ()(有效性检验——方差分析法SR——回归平方和,反映线性关系对观测结果产生的数据波动,SR越大,线性相关关系越强。SE——剩余平方和(或残差平方和),反映除线性因素之外的其它因素对观测结果产生的数据波动,SE越大,则其它因素对Y的影响越大。niiRyyS12)ˆ(niEyyS12)ˆ(有效性检验——方差分析法在H0成立的条件下,可以证明:22~1TSSn22~RSSk22~1ESSnk(n为观测次数,k为自变量个数)构造F统计量~,11RESSkFFknkSSnk当时,拒绝H0,1FFknk2.1.6Excel的函数使用函数:计算机执行的一步或多步运算过程,包括数学和三角函数、较复杂的矩阵运算函数及复杂的数据分析函数等。12类,300多种。(1)Excel函数组成函数名、参数函数名:指定要执行的运算。参数—指定函数使用的数值或单元格数据。要放在括号()内。(2)基本语法①开头必须有=。如=LOG(10)(也可用+,-开头)②参数必须放在圆括号()内,()前后无空格,不用参数的函数用空()。③参数间要用逗号“,”隔开;参数可以是数值、数组、单元格、单元格区域、表达式、函数(嵌套≤7层)等。④可用名称作为参数,如已定义的单元格名、区域名。(3)函数调用概念:函数调用—使用函数的过程,函数的返回值—结果。方法先选定插入函数的单元格,用下列方法之一调用函数。①“插入”/fx→插入函数→搜索函数/选择类别/选择函数→函数名→输入参数;②键盘输入=函数名,参数;③输入=,再点击左侧函数列表框,选已用过的函数;在()内输入参数;④点击按钮S选函数名。•用好帮助菜单栏→帮助/“F1”键;有关该函数的帮助…2.1.6.1一元线性回归由最小二乘法求直线方程y=ax+b的参数:斜率slope—a截距intercept—b;还有相关系数correlation—r/R2,Linest可对一组数据作线性回归分析(LineStatistic)通式:y=a1x1+a2x2+...+amxm+bLinest给出回归参数a1,a2,...,am,b,数值数组形式,即返回{a,b}

1 / 53
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功