管理统计学名词解释一、绪论1.统计学:研究如何收集、整理、分析和解释涉及社会、经济、管理问题的数据,并对研究对象进行统计推断的一门科学2.描述统计学:利用获得的数据,绘制统计图,并计算一些数字特征值3.推断统计学:利用获得的样本数据,进行区间估计、假设检验、回归分析、方差分析、时间序列分析4.管理统计学:研究如何收集、整理、分析和解释涉及社会、经济、管理问题的数据,并对研究对象进行统计推断的一门科学5.总体:构成研究对象全部元素的集合6.样本:通过多次抽样观察可以得到总体指标X的一组数值(x1,x2,…,xn),其中每个xi是一次抽样观察的结果。(x1,x2,…,xn)称为容量为n的一个样本,也称样本观察值7.总体参数:总体分布的某些特征,如分布位置、分布离散程度等8.统计量:由样本数据加工出来的、反映样本数量特征的函数,它不含任何未知量二、数据收集方法1.统计变量:调查现象的某种特征2.直接来源:第一手或直接的统计数据,包括专门调查和科学试验3.统计调查:方式可分为普查、抽样调查、统计报表、重点调查和典型调查;根据调查对象的不同,可分为全面调查和非全面调查4.间接来源:别人调查或科学试验的第二手或间接数据,包括公开出版或公开报道的数据5.数据误差:统计数据与客观现实之间的差距,包括抽样性误差和非抽样性误差6.统计推断:根据抽样分布律和概率理论,由样本结果(统计数)来推论总体特征(参数)。7.普查:为某一特定目的而专门组织的一次全面调查三、描述数据的图标方法1.定类变量:定类变量的值就是定类数据2.定序变量:定序变量的值就是定序数据3.数字变量:数字变量的值即为定距数据或定比数据(统称为定量数据)4.定性数据:只能归入某一类而不能用数值进行测度的数据,包括定类数据和定性数据5.定量数据:用数值来表现观察值,包括定距数据和定比数据6.频数分布:由分组标志序列和各组相对应的分布次数两个要素构成7.茎叶图:用于直接描述未分组原始数据的探索性分析,是描述数据分布形状,如数据是否集中,是否有极端值等的图形方法,由茎、叶、每个茎对应叶的个数、茎的宽度这四元素组成8.交叉表:用来描述同时产生两个定性变量的数据的图形方法9.散点图:描述两个数字变量之间关系的图形方法10.直方图:用用矩形的高度和宽度来表示频数分布的图形四、描述统计中的测度1.均值:数据平均数,是度量集中趋势最主要的指标之一2.调和平均数:根据变量值倒数计算的均值,也叫倒数平均数(Hm)3.几何平均数:n个变量值连乘积的n次方根(G)4.中位数:一组数据按数值的大小从小到大排序后,处于中点位置上的变量值(Me)5.众数:一组数据中出现次数最多的变量值(Mo)6.百分位数:用99个点将排列好的数据一百等分后,分别给出的从最小值到最大值区间内数据的信息分位点上的值7.四分位数:一组数据排序后处于25%和75%位置上的值8.极差:也叫全距,一组数据的最大值与最小值之差(R)9.四分位差:也称为内距或四分位距,是第一四分位数与第三四分位数的差,代表数据分布中间50%的距离(IQR)10.平均差:变量数列中各个变量值与算术平均数的绝对离差的平均数(MD)方差:变量数列中各变量值与其算数平均数差的平方的算术平均数(s²)11.标准差:方差的平方根,又称均方差或均方差根的算术平均数(s)12.标准分数:也称标准化值或z分数,是变量值与其平均数的离差出一标准差后的值,是对每个数据在该组数据中相对位置的测量(z)13.离散系数:也称为标准差系数,是把离散趋势绝对数与数列均值进行对比,将其抽象化,反映数列离散趋势的相对程度,是一组数据的标准差与其对应的平均数之比,是测度数据离散程度的相对指标(C.V.)14.偏态:对分部偏斜方向和程度的测度,是次数分配的非对称程度15.峰度:是分布集中趋势高峰的形状,指次数分布曲线顶端的尖峭程度五、概率与概率分布1.随机事件:在同一组条件下,可能发生也可能不发生的事件2.必然事件:在同一组条件下,每次试验一定出现的事件。3.不可能事件:在同一组条件下,每次试验一定不出现的事件。4.互斥事件:在同一组条件下,不可能同时发生的事件。也叫互不相容事件。5.条件概率:给定事件B,且P(B)0,条件概率是指事件A在给定事件B发生的条件下发生的概率。条件概率表示为:P(A|B),读作“A在B发生的条件下发生的概率”。若只有两个事件A,B,那么,。6.验前概率:也叫先验概率,是指根据以往经验和分析得到的概率,如全概率公式,它往往作为由因求果问题中的因出现的概率。在贝叶斯统计推断中,不确定数量的先验概率分布是在考虑一些因素之前表达对这一数量的置信程度的概率分布。7.验后概率:也叫后验概率,是指在得到“结果”的信息后重新修正的概率,是“执果寻因”问题中的果。后验概率的计算,要使用贝叶斯公式。8.概率分布:是指用于表述随机变量取值的概率规律。9.连续型随机变量:能按一定次序一一列出,其值域为一个或若干个有限或无限区间,这样的随机变量称为离散型随机变量。10.离散型随机变量:如果随机变量X在x轴上只取有限个或可数个数值,则称其为离散型随机变量。11.期望值:在一个离散性随机变量试验中每次可能结果的概率乘以其结果的总和。是随机试验在同样的机会下重复多次的结果计算出的等同“期望”的平均值。12.二项分布:n个独立的是/非试验中成功的次数的离散概率分布),(~pnBX)1())1(())1(()(22ppbapbppbapaXVar----+---=0()()nkEXkPXknp====ånpqXVar=)(13.泊松分布:泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。泊松分布适合于描述单位时间内随机事件发生的次数。)(~PX,2,1,0,!)exp()(kkkXPk)()(XVarXE14.分布函数:分布函数是随机变量最重要的概率特征,分布函数可以完整地描述随机变量的统计规律,并且决定随机变量的一切其他概率特征。15.概率密度函数:对于一维实随机变量X,设它的累积分布函数是Fx(x),如果存在可测函数fx(x),满足xdttfxxFx)()(,那么X是一个连续型随机变量,并且fx(x)是它的概率密度函数。连续型随机变量的概率密度函数(在不至于混淆时可以简称为密度函数)是一个描述这个随机变量的输出值,在某个确定的取值点附近的可能性的函数。而随机变量的取值落在某个区域之内的概率则为概率密度函数在这个区域上的积分。16.正态分布:17.指数分布:18.均匀分布:),(~2NX),2)(exp(21)(22xxf2)(,)(XVarXExxex2221)(2~(,)~(0,1)XXNN)(~EX),exp()(xxf21)(,1)(XVarXE指数分布的(正态分布),(~baUX其他情况,,时;当0],[,1)(baxabxfab12)()(,2)(2abXVarbaXE六、抽样与抽样分布1.统计描述:运用各种统计方法手段对观测数据的数量特征进行客观如实地描述和表达。2.统计推断:根据抽样分布律和概率理论,由样本结果(统计数)来推论总体特征(参数)。3.抽样分布:从一个总体中随机抽出容量相同的各种样本,从这些样本计算出的某统计量所有可能值的概率分布,称为这个统计量的抽样分布。4.总体参数:描述总体特性的指标。5.样本统计量:是样本的函数,由样本数据加工出来的、反映样本数量特征的函数,它不含任何未知量6.样本均值:样本均值(samplemean)又叫样本均数。即为样本的均值。均值是表示一组数据集中趋势的量数,是指在一组数据中所有数据之和再除以这组数据的个数。它是反映数据集中趋势的一项指标。样本均值则是在总体中的样本数据的均值。7.样本均值的分布:在重复选取容量为n的样本时,由样本均值的所有可能值形成的相对频数分布。8.样本方差:先求出总体各单位变量值与其算术平均数的离差的平方,然后再对此变量取平均数。9.样本比例:样本中具有某种属性的单位与全部单位总数之比。10.样本比例的分布:样本比例的所有可能取值的概率分布。11.独立同分布:指随机过程中,任何时刻的取值都为随机变量,如果这些随机变量服从同一分布,并且互相独立,那么这些随机变量是独立同分布。六、参数估计1.点估计:用样本统计量的某个取值直接作为总体参数的估计值2.样本k阶(原点)矩:设X是随机变量,若E(Xk)(k=1,2,...)存在,则称它为X的k阶原点矩,记作vk(X)。3.样本k阶中心矩:E(X^k)即样本K次方的均值4.中心极限定理:设从均值为μ,方差为σ²的任意一个总体中抽取样本容量为n的随机样本,则当n充分大时,样本均值x拔的抽样分布近似服从均值为μ,方差为σ²/n的正态分布5.极大似然估计法:已知某个参数能使这个样本出现的概率最大,把这个参数作为估计的真实值。6.无偏估计量:样本估计量的数学期望等于被估计总体参数的真值,估计值的均值与真值相等。(P119)7.有效估计量:在诸多无偏估计值中具有最小方差的无偏估计量(P120)8.一致估计量:当样本容量趋于无穷大时,样本的数字特征(比如样本集中趋势或离散趋势)依概率收敛于相应总体。(P120)9.区间估计:在点估计的基础上,根据给定的置信度估计总体参数取值范围的方法10.置信区间:在区间估计中,由样本统计量所构成的总体参数的估计区间11.独立样本:两个样本是从两个总体中独立地抽取的,即一个样本中的元素与另一个样本中的元素相互独立12.配对样本:一个样本中的数据与另一个样本中的数据相对应七、假设检验1.假设检验:也称为显著性检验,是事先作出一个关于总体参数的假设,然后利用样本信息来判断原假设是否合理,即判断样本信息与原假设是否有显著差异,从而决定应接受或否定原假设的统计推断方法2.原假设:通常将研究者想收集数据予以反对的假设选为原假设,H03.备择假设:与原假设对立的假设,通常将研究者想收集数据予以支持的假设选为备择假设4.α错误:弃真错误,指原假设H0为真,但是由于样本的随机性使样本统计量落入了拒绝域,由此作出接受原假设的判断5.β错误:取伪错误,指原假设H0不为真,但是由于样本的随机性使样本统计量落入了接受域,由此作出不能接受原假设的判断6.显著性水平:表示原假设H0为真时拒绝H0的概率,即拒绝原假设所冒的风险,用α表示7.P值:在原假设H0为真时,样本统计量落在其观测值以外的概率,即表示在实际原假设为真的情况下,拒绝H0犯错误的概率,也称为观测到的显著性水平或相关概率值8.临界值:在假设检验中,拒绝域的边界称为该假设检验的临界值。9.单侧检验:当要检验的是样本所取自的总体的参数值大于或小于某个特定值时,所采用的一种单方面的统计检验方法。只有一个否定区的假设测验。10.双侧检验:当统计分析的目的是要检验样本平均数和总体平均数,或样本成数有没有显著差异,而不问差异的方向是否是正差还是负差时,所采用的一种统计检验方法。八、方差分析1.方差分析:针对一定因素分析各总体的各个因素水平是否有差异2.单因素方差分析:针对一个因素所进行的方差分析3.双因素方差分析:针对两个因素所进行的方差分析4.方差分析表:为了便于进行数据分析和统计判断,按照方差分析的过程,将有关步骤的计算数据,例如差异来源、离差平方和、自由度、均方和F检验值等指标数值逐一列出,以方便检查和分析的统计分析表。5.F分布:)(1knSSEkSSAMSEMSAF)(,它是一种非对称分布,有两个自由度,且位置不可互换。6.因素:或称为因子,所要检验的对象7.因素水平:因子的不同表现8.平方和:总离差平方和SST、因素水平间离差平方和SSA、因素水平内离差平方和SSE9.均方:1KSSAMSA,KNSSEMSE10.自由度:计算某一统计量时,取值不受限制的变量个数。11.总离差平方和:观测值与其平均值的偏差平方和nXXSST22)(åå-=12.因素水平间