运筹学 数据模型与决策

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

2019/8/301数据模型与决策西安理工大学工商管理学院2019/8/302数据模型与决策DataModelsandDecisions(DMD)学习内容一数据分析(DataAnalysis)简记:DA二线性规划(LinearProgramming)简记:LP三动态规划(DynamicProgramming)简记:DP四决策分析(DecisionAnalysis)简记:DEA2019/8/303预修课程:线性代数管理学经济学教材:《管理运筹学》韩伯棠2019/8/304学习方式1课堂讲授2案例讨论、分析3上机4平时作业5案例报告6考核:平时成绩(20%)+案例成绩(30%)+笔试成绩(50%)上课、实验考勤成绩,作业成绩成绩分析2019/8/305一、数据分析2019/8/306背景数据分析是研究如何收集、分析数据并从中提取有用信息、知识供决策之用的方法,属于“统计学”科学。由于统计问题涉及的数据量都有一定规模且计算复杂,必须借助统计软件作为分析工具。常用的统计软件(如SAS、SPSS)都是针对统计专业人员编写的,不易掌握,另一方面,非统计专业的学生,在今后的工作环境中运用专业统计软件的机会较少。因此,可充分应用MicrosoftExcel软件。2019/8/307EXCEL软件简介MicrosoftExcel是一个功能强大、使用灵活方便的电子表格软件,也是最为流行的办公自动化软件,本课程主要利用EXCEL的统计分析功能和丰富的统计图表。0102030405060708090第一季度第二季度第三季度第四季度东部西部北部2019/8/308主要内容第一章数值型变量数据分析1.数值型单变量数据分析2.数值型双变量数据分析第二章属性变量数据分析1.单变量属性数据分析2.双变量属性数据分析第三章回归模型及分析1.线性回归2.简单非线性回归3.多元回归2019/8/309第一章数值型变量数据分析1.1数值型单变量数据分析例1.1某班《DMD》考试成绩如下:808576786793889075666577748381708364966079868071试用相关统计量对成绩进行分析。2019/8/3010Excel有3种分析工具用来描述数值型单变量数据:1.描述性统计2.直方图3.排位和百分比排位2019/8/30111.1.1描述性统计该统计工具提供了反映集中趋势、离散程度以及偏移程度的统计指标共16个。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“描述统计”;4)根据对话框,选择或输入相关数据。•C:\MyDocuments\模拟成绩.xls2019/8/3012描述统计指标说明:1.平均:一组数据的平均值。2.中值(中位数):数据序列中位于中间的值。3.模式(众数):发生次数最多的值。C:\MyDocuments\模拟成绩.xlsnxxxxn......212019/8/30134.标准差:反映数据的离散程度。•C:\MyDocuments\模拟成绩.xlsniixxn12)(112019/8/30145.峰值(峰态):它是衡量对称分布陡缓程度的指标。当分布较正态分布平坦时,该指标为正;当分布较正态分布陡峭、尖时,该指标为负。2019/8/30156.偏斜度:它是衡量数据分布不对称程度的指标。当某些极端值出现在正方向时,称为“向右偏离”;当某些极端值出现在负方向时,称为“向左偏离”。2019/8/30167.区域(全距):数据中最大值与最小值之差。8.最小值:样本中的最小值。9.最大值:样本中的最大值。10.求和:样本数据的和。11.计数:样本中数据个数。12.最大k值:给出数据中第k个最大值。13.最小k值:给出数据中第k个最小值。•C:\MyDocuments\模拟成绩.xls2019/8/30171.1.2直方图该统计工具提供一张频数分布表和一张直方图。步骤:1)确定直方图的区间个数,填入每个组界值;2)打开“工具”菜单;3)选择“数据分析”;4)选择“直方图”;5)在“直方图”对话框中填入数据。C:\MyDocuments\模拟成绩.xls2019/8/3018输出图表的修饰:1)单击条块选中图形;2)选择“数据系列格式”;3)在对话框“图案”中,改“区域”为无;4)单击“选项”,改“分类间距”为0;5)单击“确定”。C:\MyDocuments\模拟成绩.xls2019/8/30191.1.3排位和百分比排位该统计工具提供一张含有升序排列的数据表格以及其排列后的序号、百分位号。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“排位与百分比排位”。4)根据对话框,选择或输入相关数据。数据模型课件\模拟成绩.xls2019/8/3020练习下列数据为15项资产的出售价格(万元),试用描述性统计、直方图、排位和百分比分析工具进行数据分析:¥2603804363103964483743124063483724183923844522019/8/30211.2数值型双变量数据分析对两组数值型数据分析它们之间的相关关系。有两种分析工具。1.散点图2.相关系数2019/8/3022例1.2某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据记录如下:试作散点图,并判断两变量间的相关性。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.752019/8/30231.2.1散点图该统计工具用来描述两个变量之间的关系。通常用在直观判断基本关系或用在回归模型使用前。步骤:1)输入变量X和Y的数值;2)选中数据;3)打开“图表向导”;4)对散点图进行编辑。C:\MyDocuments\房租模拟.xls2019/8/30241.2.2相关系数相关系数用来说明两个变量之间的相关密切程度。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“相关系数”。4)根据对话框,选择或输入相关数据。C:\MyDocuments\房租模拟.xls2019/8/3025相关系数的基本计算公式:两个数列的协方差:自变量数列的标准差:因变量数列的标准差:yxxyr2nyyxxxy))((2nxxx2)(nyyy2)(2019/8/3026相关程度判断标准:1.当r=±1时,X与Y为线性相关;2.当│r│<0.3时,X与Y为微弱相关;3.当0.3≤│r│<0.5时,X与Y为低度相关;4.当0.5≤│r│<0.8时,X与Y为显著相关;5.当0.8≤│r│<1时,X与Y为高度相关。2019/8/3027练习下面是10家商店销售额和利润率的资料:(1)画出散点图;(2)计算每人月平均销售额与利润率的相关系数。商店每人月平均销售额(万元)利润率(%)1612.62510.43818.5413.0548.16716.37612.3836.2936.610716.82019/8/30282019/8/30292属性变量数据分析2.1单变量属性数据分析用途:对性别、职称、品牌等属性数据进行分布描述。例2.1对某城市饭店业进行前景调查,问卷数据如下表所示。要求统计出各项数据的分布。数据包括:业主类型(owner)前途看法(outlook)2019/8/3030某饭店调查数据序号问卷号(ID)前途看法(outlook)业主类型(owner)12626322634132644142652*526613626731726833826942927053102714211272311227311前途看法:1(很不乐观)6(十分乐观)业主类型:1—股份制2—合伙3—独资*--不详2019/8/3031步骤:1.打开“数据”菜单;2.选择“数据透视表”,按下一步;3.选择“版式”;4.单击变量“owner”,拖到“行”区域中;5.单击变量“owner”,拖到“数据”区域中;6.双击“求和项”,在“汇总方式”中选择“计数”;7.单击“确定”。C:\MyDocuments\饭店调查.doc2019/8/3032以百分比形式表示统计结果:1.选中“结果表”中的任一单元格2.打开快捷菜单,选择“字段”3.单击“选项”4.在“数据显示方式”中选择“占总和的百分比”5.单击“确定”C:\MyDocuments\饭店调查.doc2019/8/30332.2双变量属性数据分析—两维表格(列联表)用途:对性别、职称等属性数据进行相关关系描述。例如统计饭店的前途是否与店主的类型相关。2019/8/3034步骤:1.打开“数据”菜单;2.选择“数据透视表”,按下一步;3.选择“版式”;4.单击变量“Owner”,拖到“行”区域中;5.单击变量“Outlook”,拖到“列”区域中;5.单击变量“Outlook”,拖到“数据”区域中;6.双击“求和项”,在“汇总方式”中选择“计数”;7.单击“确定”。C:\MyDocuments\饭店调查.doc2019/8/3035以百分比形式表示统计结果:1.选中“结果表”中的任一单元格2.打开快捷菜单,选择“字段”3.单击“选项”4.在“数据显示方式”中选择“占同行数据总和的百分比”5.单击“确定”C:\MyDocuments\饭店调查.doc2019/8/30363回归分析通常用以确定两个变量之间的线性关系模型,并据此进行预测。根据回归分析方法得出的数学表达式,称为回归方程,它可能是直线方程,也可能是曲线方程。3.1线性回归3.2简单非线性回归2019/8/3037例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据如下:试求月租金与空置率的关系模型。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.752019/8/30383.1线性回归两个变量之间存在相关关系,而且其相关的紧密程度必须是显著的,直线回归方程的基本形式为:其中:a,b是待定参数,可通过以下方法求出:1.散点图中插入趋势线2.回归分析工具bxaybxay2019/8/30393.1.1散点图中插入趋势线在插入趋势线前必须绘制散点图,如果点近似分布在一直线附近,那么可用简单线性回归方法;如果点近似分布在一曲线附近,那么考虑使用非线性回归方法。0510152019/8/3040例某公司欲调查办公楼的租金和空置率间的关系,工作人员在10个不同的城市里,对办公楼中每平方米的月租金和空置率的数据如下:试求月租金与空置率的回归模型。城市12345678910空置率311659257108月租金52.54.754.534.5433.252.752019/8/3041步骤:1)打开“图表”;2)作出散点图;3)点击图中任一数据点;4)在“图表”中选择“添加趋势线”命令;5)单击“线性图”;6)根据对话框,选择或输入相关数据。C:\MyDocuments\房租模拟.xls2019/8/30423.1.2回归分析工具插入趋势线仅给出了回归线、回归方程及,运用回归分析工具可得到更多的信息。步骤:1)打开“工具”菜单;2)选择“数据分析”;3)选择“回归”。4)根据对话框,选择或输入相关数据。数据模型课件\房租模拟.xls2R2R2019/8/3043关于回归分析的说明:用于衡量回归方程式优良性的工具通常是以下几种:1.标准误差用来说明回归方程代表性的大小。nyySyx2)ˆ(其中:y是因变量实际值,是根据回归方程推算出来的因变量估计值。从计算公式可以看出,标准误差实际上是一个平均误差。数值越大,说明所有点离回归线越远,则回归方程的代表性越小;数值越小,说明所有点越靠近回归线,则回归方程的代表性越大。2019/8/30442.判定系数反映自变量与因变

1 / 66
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功