管理定量分析第一章绪论1.1定性与定量分析1、定性分析定性分析,仅仅分析被观察对象所包含的成分或具备的特性,通常用描述性的语句表达有关的分析结果。2、定量分析定量分析,可以分析一个被研究对象所包含的数量关系或所具备性质间的数量关系,也可以对几个对象的某些性质,特性,相互联系从数量上记性分析比较,研究的结果也用“数量”加以描述。3、联系与区别(判断在什么情况下用定量/定性比较合适)定性分析与定量分析对同一个问题有各自的分析标准和优缺点,应该根据不同需要,不同对象选用合适的分析方法。1)定量分析比较准确、清晰、适用于需要精确地反映某些对象的数量关系和场合,定性分析多用于日常生活、人际交往、需要形象描述和比较的情况,比较直观。容易被大众理解,但是比较模糊。2)定量分析工作量大,花费人力、物力和时间都比定性分析多。3)定性分析依赖个人(或群体)的经验、能力和水平,其标准常常因人而异,往往带有主观随意性;定量分析则标准明确,比较客观。4)借助图表、曲线可以把定量分析的结果直观描述,既清晰又容易理解。5)利用模糊数学、统计数学的理论或者其他数学方法。定量分析和定性分析的过程和结果可以互相转换。1.2定量分析的量化过程一、管理定量分析的工作内容1、用系统工程的科学方法,在错综复杂的问题中理解脉络,提炼要素,整理出有关要素之间的逻辑和数量关系2、确定量化的原则3、建立相应的数学模型4、运用有效算法做出合理的、符合需要的结论二、定量分析的步骤(论述+例子)确定问题构建指标体系选取量纲确定量化单位确定采集数据的方法进行量化分析例“城市化水平”是将一个地区或者国家的诸多相关因素进行量化分析后,给出一个社会发展状况的评价,大体需要经历如下几步分析研究:第一步,确定问题——明确何谓“城市化”。城市化,又称城镇化,都市化,是指人类生产和生活方式由乡村型向城市型转化的历史过程,具体表现有:1、乡村人口向城市人口的转移以及城市不断发展和完善2、人类进入工业社会后,随着社会经济发展,农业活动的比重逐渐下降,非农业活动的比重逐步上升3、不仅包括城镇人口数量的增加,更重要的是包括社会经济的进一步集约化、现代化。第二步,通常用一个完整的指标体系衡量城市化水平,其中包括:1、一定地域内城市人口占总人口的比例2、“土地指标”,城市化过程也是城市用地不断扩展的过程,内含:1)城市用地占可建设用地的比重,比重越大,说明城市化水平越高2)农业用地转化为城市用地的速度,每年转化越多,说明城市化发展越快3)城镇密度和城镇规模:用城镇的疏密和城镇规模的大小,表示城市化水平的高低4)产业指标:二、三产业的产值在国民生产总值中所占的比重第三步,对每一项指标给出相应的衡量标准:确定计量单位(数据、百分比或等级评价);需要时对相关物理量确定量纲。第四步,根据有关区域(国家)的统计调查数据,进行计算分析,判断该地区城市化水平。1.3数学模型用以字母、数字或其他数学符号描述客观事物的特征及其内在联系2.1搜集资料一、搜集信息的方法获取信息最基本的方法是“调查”。调查的方式可以分为全面调查和非全面调查两类2、非全面调查(填空)1)重点调查(怎么做,优势)A重点调查的概念重点调查是一种非全面调查,它是在调查对象中,选择一部分重点单位作为样本进行调查。重点调查主要适用于那些反映主要情况或基本复杂的调查B重点单位的选择重点调查的重点单位主要是指在调查中具有举足轻重的能够代表总体的情况、特征和主要发展变化趋势的那些样本单位。这些单位可能数目不多,但有代表性,能够反映调查对象总体的基本情况。选取重点单位应遵循两个基本原则,一是根据调查任务的要求和调查对象的基本情况而确定选取的重点单位及数量。一般来讲,要求重点单位尽可能少,而其标志值在总体中所占的比重应尽可能大,以保证有足够的代表性;二是注意选取那些管理比较健全、业务力量较强,统计工作基础较好的单位作为重点单位。C重点单位的特点投入少,调查速度快,所反映的主要情况或基本趋势比较准确D重点调查的作用在于反映调查总体的主要情况或趋势,因此重点调查通常用于不定期的一次性调查,但有时也用于经常性的连续调查2)典型调查:也是一种非全面调查,是从众多的调查研究对象中,有意识的选择若干个具有代表性的典型单位进行深入、周密系统的调查研究。A进行典型调查的主要目的不在于取得社会经济现象的总体数值,而在于了解与有关数字相关的生动具体情况。B典型调查的优缺点优点在于调查范围小、调查单位少,灵活机动,具体深入节省人力,物力等缺点在于实际操作中,选择真正有代表性的典型单位比较困难而且还容易受人为因素的干扰,从而可能会导致调查的结论有一定的倾向性,且典型调查的结果一般情况下不易用以推断全面数字C典型调查的作用:a、在特定的条件下用于对数据的质量检查b、了解与数字相关的生动具体情况3)随机抽样调查:根据调查的目的,从研究对象的总体中抽取一部分单位作为样本进行调查,据此推断有关总体的数字特征。二、调查误差1、误差的类型:1)工作误差——有调查工作本身造成的误差2)代表性误差——有调查的“样本”推断“全体”而引入的误差三、调查步骤:(以问卷调查为例)1、确定问题:明确调查的主题——围绕什么中心搜集资料2、列出调查大纲、细化主题(设计问卷)3、确定取样数量、范围、被调查对象的条件选择被调查对象的原则4、有指导地发放、填写问卷5、回收问卷6、初步分析整理问卷,在整理数据之前对资料的有效性进行初步分析7、资料归类,初步数据整理8、清点样本总数,输入设计的计算机表格用列表法将所搜集到得资料分类整理,常用的有:(举例考你)定类法:按分类登记如营业税,个人所得税等定序法:同类项目下按照一定的数量顺序登记如按年龄登记相应的人数定距法:按一定的距离变化登记观察值,一般以公认的标准为基础,对变量属性间实际意义的标准间距作出表达,结果可以进行加减运算(工资水平,分段统计年龄等)2.3频率分布的概率变量法一、算术平均数(不需要背,知道怎么算可看课本)用算术平均数代表全部数据,优点1、通俗,直观易懂2、是一个可以计算的“单位值”任何一组数据都有且仅有一个算术平均数3、在计算算术平均数时,所有的数据都参与运算,不能用概率推等,因此可以被作一个可靠,具有代表性的度量中心趋势的量。缺点:1、算术平均数是根据相关的全部数据计算的,容易受到资料中那些没有代表性、特殊的数据影响。2、存在无下限或无上限的开口组的时候,无法计算组中值,也无法计算算术平均数。用“定距法”分段统计数据资料时,需要用相应的组中值计算算术平均值。二、加权平均数(数学期望)加权平均法考虑频率分布的情况,使得数量大的数据在计算平均值时占比较大的比重,数量小的数据占有比重相应较小。衡量数量多少的标准时频率——有关数据在总体资料中所占的比重三、几何平均值四、中位数Me中位数是一个位于一组观察值的中心位置的参数,位于数列中心,大于Me和小于Me的观察值数量相等与平均数相比,中位数的优点在于:1、不会受到特殊数据的影响,比如工资收入特高或者特低的值会影响平均数,但不会影响中位数2、无论在分组还是不分组的资料中都可以计算中位数,且结果直观易解五、众数Mo众数是指资料中重复出现次数最多的数,也是频率最高的数2.4变量特性分析全距(极差)=最大观察值-最小观察值四分位内距R=Q3-Q1例如:1,2,3|,4,5,6|7,8,9,|10,11,12四分位数内距R=Q3-Q1=9.5-3.5=6离差、方差、标准差(知道怎么算)第三章抽样分析3.1总体与样本1、总体:在统计分析中,把被调查的对象全体称为总体。2、样本:在总体数量非常大的时候,从中抽取某些个体进行调查分析,这些个体的集合称为样本。3、容量:总体包含的元素个数N,称为容量样本包含的元素n,称为样本容量3.2抽样方法1.随机抽样(概率抽样)(概念)按照随机原则抽取样本,即在总体中抽取单位时,完全排除任何主观因素的影响,使每一个单位都有同等机会被抽到,即总体中每个体被抽到的机会均等。4.抽样调查的使用范围1)对一些不可能或不必要进行全面调查的社会经济现象,最宜用抽样调查的方式解决举例:有破坏性或损耗性质的商品质量的检验,对一些既有无限总体的调查(如对森林木材积蓄量的调查)2)在经费,人力,无力和实践有限的情况下,采用抽样调查方法可节约费用,争取时间,用较少的人力物力和时间达到满意的调查结果3)运用抽样对全面调查进行验证。6、随机抽样的类型(选什么方法,用该方法该怎么做)1)简单随机抽样:将总体中所有对象编上不重复的号码之后,经由随机数进行抽样2)机械抽样:在时间或空间范围内等距离选取样本3)类型抽样:在抽样前先把总体中的个体按需要的类型分类,大体按照各类元素数量在总体中所占的比例分配在该类的抽样数,按随机抽样原则在每一类对象中抽样4)整群抽样:把整体分为许多组,然后随机选取一组,作为调查研究的对象第四章:估计与假设检验估计类型:点估计——估计某一个总体参数的具体值区间估计——估计一个包含总体参数在内的区间,通常用区间的大小或者实际参数落在某个区间的概率来表达区间估计的结果一、点估计1.平均数估计同一个参数可以有多的估计量,如可以用样本平均书或中位数来估计总体的平均数。但一般情况下样本平均数是比样本中位数更有效的估计量,因为在大量的样本中,样本平均数的平均误差比样本中位数的平均误差来的小。2.方差估计样本方差和总体方差的无偏估计,是一个较好的估计,可以通过计算样本方差的值来估计总体方差。3.百分比估计(最大似然估计)是用样本中具有某类特征的个体所占比重q,作为具有该特征个体在总体只能够所占比重p的估计值。二、区间估计置信区间(什么事置信区间,怎么做)区间估计的取值范围叫做置信区间,即该估计区间包含总体参数的概率有多大。1)根据样本的统计量和抽样误差计算总体参数的范围2)置信区间只是一个可能的范围,不是一个绝对可靠的范围,即总体多数个人给定的概率落在置信区间中。3)当扩大误差范围时,估计的可靠程度也随之提高,当缩小误差范围时,估计的可靠程度也随之降低。4.2假设检验假设检验:又称统计检验,是统计假设检验的简称。检验的基本方法是:先假设总体具有某些统计特性,再跟据样本统计特征,验证总体是否具有这些特征。一、显著水平假设检验需要利用样本提供的信息构造适当的检验统计量,用来分析总体和样本之间的相关统计量是否存在显著差异,依此判断是不是有足够的旅游相信原假设是可信的。检验的基本原理:经过抽样分析,如果小概率实践发生,原假设检验的假设正确性将受到怀疑。显著性水平α是一个很小的值,是检验者判断小概率事件是否发生的标准。二、假设检验步骤1.作出原假设Ho和备择假设H1,确定显著水平α2.建立统计量Z3.根据是双侧检验还是单侧检验,决定取Z还是取Z/2,在单侧检验是注意Z应用与左侧还是右侧。4.计算之心区间的上下限5.根据显著水平,将计算得到的统计量与相应的临界值比较,作出接受还是拒绝原假设的判断。例2:过去的研究指出小学生的智商为正态分布N(105,225),我们认为时代改变了,很可能智商平均数和过去不一样了,于是随机抽取100位学生,得到样本智商平均数位105.92,试问,是否可以推翻过去的研究结构,认为智商平均数与过去不一样。解:1、H0:U0=105,H1:U0≠1052、Z=(X—U)/σx巴=(105.92-105)/(15/10)=0.6133、Zα/2∈[-1.96,1.96]∵0.613∈[-1.96,1.96]∴接受原假设,即不一样。三、两类错误第一类:以真当假的错误——拒绝了原本为真的原假设(显著性水平选择太小)第二类:以假当真的错误——接受了原本该拒绝的元假设。4.4卡方检验一、基本原理在两个样本取自同一总体的假设下,具备某一特征的元素在样本所占比例和在总体中所占比重应该相同。二、实例某地区正在流行某种流行病,抽样4个民区,抽查人数和被感染人数见图表,问此传染病在这一地区传播情况是否相同?城市1234总计被感染人数3247287114未感染人数681056258293样本容量1001529065