管理统计学袁长峰2011.3为什么要学管理统计学?1.让管理研究科学化国内研究方法现状:总结、思辨、定性是主流国际通用方法:实验、实证、问卷-数据-统计、长期跟踪2.统计方法的应用是管理学研究的基本技能不学基本技能,研究难以深入。让管理研究走向科学,是管理科学大学教育的基本任务之一。3.统计学方法可以解决的主要问题:1)现状的客观描述(如不同状况的百分比、均值)2)均值、方差、百分比等统计值是否有本质区别(随机差异?本质差异?)3)依据样本推断总体的概率分布是什么4)依据数据找出问题的显著因素与关键因素5)寻找变量的相互关系(相关关系)6)寻找变量间的数量规律7)依据规律把变量分为具有某些共同特性的类别8)依据已有规律,判别新数据属于哪个类别等。4.管理科学论文的基本结构三段:文献、调查-数据-统计-结论、对策研究如何通过样本数据去推断总体数量特征。是在对样本数据进行描述的基础上,对统计总体的未知数量特征作出以概率形式表述的推断。管理统计学描述统计学推断统计学研究如何取得反映客观现象的数据,并通过图表形式对所收集的数据进行加工处理和显示,进而通过综合、概括与分析得出反映客观现象的规律性数量特征管理统计学的分类统计学探索客观现象数量规律性的过程反映客观现象的统计数据描述统计学(统计数据的收集、整理、显示和分析)推断统计学(利用样本信息和概率论对总体数量特征进行估计并检验)概率论(分布理论、大数定律、中心极限定理)总体内在的数量规律统计学在管理中的应用1.财务领域财务会计审计查帐成本核算2.工业管理领域生产控制库存确定风险投资3.人力资源管理业绩考核了解员工提高质量4.市场营销管理市场分析消费者偏好营销策略统计学在管理中的应用—示例审计员检查一个大公司的账目,可以通过统计方法抽取账目样本,根据样本结果确定该公司是否有账目不清的问题。小企业的经理在确定原材料的进货量时,需要考虑可能的原材料需求水平和原材料存储费用。为此他要做相应的调查。经济学家需要根据消费者的购买模式,评价改变销售税对社会的影响。为此他需要通过实地调查,了解主要地区不同收入阶层消费者的购买模式。统计学在管理中的应用—示例营销经理在决定是否销售一种新产品时,对样本顾客进行试销,并依据评价效果确定可能的销售水平。投资经理依据咨询师的观点并考虑当前政策和企业现状,估计各种投资收益率出现的概率。生产经理根据检验产品样本的质量情况,决定是否对生产过程作出必要的调整。对学习本课程的一般要求本课程强调对管理问题的应用,强调对概念的透彻理解和统计软件的应用,而不注重数学推导和证明。读书,做题,做SPSS的练习。前修课程:概率论学习本课程后应具备的基本能力会依据管理问题设计问卷会比较恰当地抽样会比较科学地调查掌握基于概率论的主要统计方法会针对所学过的方法,用SPSS软件处理相应的数据会依据统计计算结果,得出恰当的结论一句话:会依据所要解决的管理问题,获取数据,处理数据,得出正确的研究结果。本课程学习的主要内容第一部分:概率论基础知识随机实验与样本空间,随机变量,概率分布第二部分:数据、调查与抽样数据类型,数据获取,调查与抽样第三部分:估计与检验总体分布与样本分布,参数估计(点估计与区间估计)第四部分:假设检验参数估计的假设检验,非参数估计的假设检验(概率分布的假设检验)第五部分:方差分析单因素方差分析,双因素方差分析第六部分:相关分析与回归分析第七部分:聚类分析与判别分析第八部分:SPSS(forwindows)的应用教材与参考书1.马庆国著.管理统计——数据获取、统计原理、SPSS工具与应用研究.科学出版社,2002.2.马庆国.应用统计学:数理统计方法、数据获取与SPSS应用.科学出版社,2005.3.李金林,赵中秋著.管理统计学.清华大学出版社,2006.4.肖淑芳著.管理统计学基础.北京理工大学出版社,2002.5.李金林,马宝龙著.管理统计学应用与实践:案例分析与统计软件应用.清华大学出版社,2007.6.丁国盛,李涛.SPSS统计教程—从研究设计到数据分析.机械工业出版社,2008.第1章概率论基础知识1.1随机实验、样本空间、概率与条件概率1.2随机变量与概率分布的基本概念1.3几个典型的概率分布1.1随机实验、样本空间、概率与条件概率1.1.1、一些基本概念1.随机实验例如,抛硬币、掷骰子(1)在同一条件下可无限次重复的实验;(2)实验结果有多个,且不确定;(3)事前不知实验结果。2.基本事件(基本随机事件)一次随机实验的可能结果。例如,抛一次硬币,就是一次随机实验,其可能结果有2个:正面、反面。3.样本空间(基本空间)所有基本事件所组成的集合。例如,抛2次硬币,样本空间为:{正、反,正、正,反、正,反、反}4.随机事件(事件)指基本事件所组成的集合。例如,抛2次硬币,至少出现1个正面。由3个基本事件“正、正”、“正、反”、“反、正”组成。5.不相容事件6.概率)()()(}{}{2121kkkkAPAPAPAAPAP7.概率运算的主要性质SAB8.等概率随机实验例如,随机实验E“先后抛2枚均匀的硬币”,共有4个基本事件:“正、正”、“正、反”、“反、正”、“反、反”。若事件A是“至少有1枚正面朝上”,则事件A包括3个基本事件“正、正”、“正、反”、“反、正”,所以P(A)=?P(A)=3/41.1.2条件概率、乘法定理与条件概率表例:一个包装箱里有6个产品。假设其中4个为一级品,2个为二级品。若随机实验E是“从该包装箱中抽取1个产品(无放回抽取)”。设事件A是“第一次抽取并抽到二级品”,事件B是“第二次抽取并抽到二级品”。问:P{B|A}=?51}|{ABP)()(}|{APABPABP1515162)(ABP31)(AP5131151)()(}|{APABPABP)()(}|{APABPABP)()(}|{APABPABP1.条件概率的定义条件概率要点:子空间。A不一定先发生。2.概率的乘法公式(乘法定理)3.条件概率表炎患者”。请填写下面的条件概率表。条件概率表P(••)B:肝炎:非肝炎总计A:阳性:非阳性总计AB3.条件概率表炎病人”。由题意可知:P(B)=0.0001,P(B|A)=0.9需要求得P(A)=?条件概率表P(••)B:肝炎:非肝炎总计A:阳性:非阳性总计BA条件概率表P(••)B:肝炎:非肝炎总计A:阳性1/100001/900001/9000(“子空间”):非阳性08999/90008999/9000(“子空间”)总计1/10000(“子空间”)9999/10000(“子空间”)1(“原空间”)90001)(AP90008999)(AP100001)(BP100009999)(BP100001900019.0)()|()(APABPABPAB条件概率表的一般表达B1B2…Bm总计A1F(A1B1)F(A1B2)…F(A1Bm)ΣA1行A2F(A2B1)F(A2B2)…F(A2Bm)ΣA2行………………AnF(AnB1)F(AnB2)F(AnBm)ΣAn行总计ΣB1列ΣB2列ΣBm列ΣΣ要点1:表头的事件都必须是样本空间S的一个划分。要点2:表内方格中的F(AiBj),表示对事件Ai与事件Bj同时发生的数量描述。它可以是概率描述,也可以不是概率描述,但必须遵循比例原则(大家都是概率描述的某个倍数)。4.全概率公式)()|()()(11kknkknkAPABPBAPBP1.1.3贝叶斯公式1.贝叶斯公式的概率。率新信息发生的无条件概先验概率新信息发生的条件概率后验概率2.用“条件概率表”处理贝叶斯问题P(••)A:按时B:未按时总计甲公司递送乙公司递送总计0.540.320.60.41.1.4相互独立的随机事件的概率公式1.相互独立的随机事件的定义2.相互独立事件的概率乘法公式1.2随机变量与概率分布的基本概念1.2.1离散型随机变量1.随机变量2.离散型随机变量3.离散型随机变量的概率4.离散型随机变量的概率分布5.离散随机变量的累积概率6.离散随机变量的累积概率分布例1.2.1一个箱子里有10个大小、材质都一样的小球,其中红色的有2个,蓝色的有5个,黄色的有3个。随机地从箱子里摸取小球,摸取到红色小球的概率是0.2,摸取到蓝色的是0.5,黄色的是0.3。则,随机变量X(从箱子里摸取不同颜色的小球)的概率分布。离散型随机变量的概率分布X的取值x红色蓝色黄色X的概率P(X=x)0.20.50.3例1.2.1一个箱子里有10个大小、材质都一样的小球,其中红色的有2个,蓝色的有5个,黄色的有3个。随机地从箱子里摸取小球,摸取到红色小球的概率是0.2,摸取到蓝色的是0.5,黄色的是0.3。设:随机变量X为:从箱子里摸取不同颜色的小球离散型随机变量的概率分布X的取值x红色蓝色黄色X的概率P(X=x)0.20.50.3X≤2时的累积概率为P(X≤2)=0.7例1.2.1一个箱子里有10个大小、材质都一样的小球,其中红色的有2个,蓝色的有5个,黄色的有3个。随机地从箱子里摸取小球,摸取到红色小球的概率是0.2,摸取到蓝色的是0.5,黄色的是0.3。设:随机变量X为:从箱子里摸取不同颜色的小球离散型随机变量的累积概率分布X的取值x红色蓝色黄色X的概率P(X=x)0.20.50.3P(X≤x)的累积概率分布为:P(X≤1)=0.2P(X≤2)=0.7P(X≤3)=11.2.2连续型随机变量1.连续型随机变量的取值特点2.连续型随机变量的概率3.连续型随机变量的累积概率4.连续型随机变量的累积概率分布连续型随机变量小于等于每一个可能的实验结果x(用数字表示结果)的概率P(X≤x)的分布情况。5.连续型随机变量的累积概率分布函数6.连续型随机变量的概率密度函数图1.连续型随机变量的概率密度函数示意图7.均值8.方差9.小结:离散分布与连续分布的区别与对应关系这种对应关系,可如图所示:图2.离散型随机变量与连续型随机变量的对应关系1.2.3对随机变量的概率分布的进一步讨论1.两个随机变量的联合概率分布(1)两个离散型随机变量的联合概率分布联合概率的一般表达式为:P(X=i,Y=j)=P(AiBj)也就是以概率形式表达的条件概率表格中,Ai与Bj交叉位置上的概率数据。(2)两个连续型随机变量的联合概率密度分布两个连续型随机变量的联合概率密度分布,可以用图形表达。如果随机变量X、Y服从相同的正态分布,则X与Y的联合概率密度函数的图形,就是将图1中的曲线,围绕μ处的虚线旋转一周所得到的曲面。2.边缘分布(1)离散型二维随机向量(X,Y)的边缘分布(2)连续二维随机向量(X,Y)的边缘分布,又称联合分布的边缘分布。3.条件分布(1)离散型随机变量的条件概率分布(2)连续型随机变量的条件概率分布4.相互独立的随机变量1.3几个典型的概率分布两点分布(0-1分布)二项分布泊松分布均匀分布正态分布1.两点分布:2.二项分布:E(X)=pD(X)=p(1-p)E(X)=npD(X)=np(1-p)3.泊松分布:E(X)=λD(X)=λ4.均匀分布:E(X)=(a+b)/2D(X)=(b-a)2/125.正态分布:图中曲线和x轴之间的面积表示概率。不论图中曲线如何陡或平,它与x轴之间的面积总是1。正态分布的概率密度函数示意图相应的(累积)概率分布函数为:其中,μ为均值,σ2为方差。相应的图形为:连续型累积概率示意图练习:三个柜子换与不换哪个中奖概率大?有三个柜子,其中一个里面有钱,你若能猜中哪个里面有钱钱就归你。若你选择了最后的那个柜子,主持人从剩下的两个柜子中打开一个没有钱的(从这句话可以看出主持