数量方法二考试重要公式

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

《数量方法》通过宝典第一章数据的整理和描述一、数据的分类:按照描述的事物分类:1.分类型数据:描述的是事物的品质特征,本质表现是文字形式2.数量型数据:事物的数量特征,用数据形式表示3.日期和时间型数据。按照被描述的对象与时间的关系分类:1.截面数据:事物在某一时刻的变化情况,即横向数据2.时间序列数据:事物在一定的时间范围内的变化情况,即纵向数据3.平行数据:是截面数据与时间序列数据的组合二、数据的整理和图表显示:1.组距分组法:1)将数据按上升顺序排列,找出最大值max和最小值min2)确定组数,计算组距c3)计算每组的上、下限(分组界限)、组中值及数据落入各组的频数vi(个数)和频率if(mimiivyv11=频数的和组中值)的和(频数平均数),形成频率分布表4)唱票记频数5)算出组频率,组中值6)制表2.饼形图:用来描述和表现各成分或某一成分占全部的百分比。注意:成分不要多于6个,多于6个一般是从中选出5个最重要的,把剩下的全部合并成为“其他”;成分份额总和必须是100%;比例必须于扇形区域的面积比例一致。3.条形图:用来对各项信息进行比较。当各项信息的标识较长时,应当尽量采用条形图。4.柱形图:如果是时间序列数据,应该用横坐标表示时间,纵坐标表示数据大小,即应当使用柱形图,好处是可以直观的看出事物随时间变化的情况。5.折线图:明显表示趋势的图示方法。简单、容易理解,对于同一组数据具有唯一性。6.曲线图:许多事物不但自身逐渐变化,而且变化的速度也是逐渐变化的。具有更加自然的特点,但是不具有唯一性。7.散点图:用来表现两个变量之间的相互关系,以及数据变化的趋势。8.茎叶图:把数据分成茎与叶两个部分,既保留了原始数据,又直观的显示出了数据的分布。三、数据集中趋势的度量:1.平均数:容易理解,易于计算;不偏不倚地对待每一个数据;是数据集地“重心”缺点:它对极端值十分敏感。平均数=数据的个数全体数据的总和nixnx1112.中位数:将数据按从小到大顺序排列,处在中间位置的一个数或最中间的两个数的平均数。它的优点是它对极端值不像平均数那么敏感,因此,如果包含极端值的数据集来说,用中位数来描述集中趋势比用平均数更为恰当。3.众数:数据中出现次数最多的数。缺点是一个数据集可能没有众数,也可能众数不唯一;优点在于它反映了数据集中最常见的数值,而且它不仅对数量型数据(数据都是数值)有意义,它对分类型数据集也有意义;并且能够告诉我们最普遍、最流行的款式、尺寸、色彩等产品特征。4.分组数据的平均数(加权平均):mimiivyv11=频数的和组中值)的和(频数平均数m为组数,vi为第i组频数,yi为第i组组中值。四、数据离散趋势的度量:1.极差R=最大值max-最小值min2.四分位点:第二四分位点Q2就是整个数据集的中位数;第一四分位点Q1是所有小于(或等于)Q2的数据所组成的数据集的中位数;第三四分位点Q3是所有大于(或等于)Q2的数据所组成的数据集的中位数。四分位极差=Q3-Q1,它不像极差R那么容易受极端值的影响,但是仍然存在着没有充分地利用数据所有信息地缺点。3.方差:离平均数地集中位置地远近;nynyvvyvvyvnxnxxxniiiiiiiiniii222212222)(1)(1iv:频数,iy:组中值,ivn:数据的个数,iiivyvy:用分组数据计算的平均数。4.标准差:2。变异系数:表示数据相对于其平均数的分散程度%100xV第二章随机事件及其概率一、随机试验与随机事件:1.随机试验:a)可以在相同的条件下重复进行;b)每次试验的可能结果可能不止一个,但是试验的所有可能的结果在试验之前是确切知道的;c)试验结束之前,不能确定该次试验的确切结果。2.样本空间:a)所有基本事件的全体所组成的集合称为样本空间,是必然时间;b)样本空间中每一个基本事件称为一个样本点;c)每一个随机事件就是若干样本点组成的集合,即随机事件是样本空间的子集;d)不包含任何样本点的随机事件就是不可能事件。样本空间的表示方法:①.列举法②.描述法:二、事件的关系和运算1.事件的关系:a)包含关系:事件A的每一个样本点都包含在事件B中,或者事件A的发生必然导致事件B的发生,成为事件B包含事件A,记做ABBA或者。若ABBA且则称事件A与事件B相等,记做A=B。b)事件的并:事件A和事件B至少有一个发生的事件称为事件A与事件B的并记做BABA或者。c)事件的交:事件A与事件B同时发生的事件称为事件A与事件B的交,记做ABBA或者。d)互斥事件:事件A与事件B中,若有一个发生,另一个必定不发生,则称事件A与事件B是互斥的,否则称这两个事件是相容的。BA。e)对立事件:一个事件B若与事件A互斥,且它与事件A的并是整个样本空间Ω,则称事件B是事件A的对立事件,或逆事件。事件A的对立事件是A,AAAA,。f)事件的差:事件A发生,但事件B不发生的事件,称为事件A与事件B的差,记做A-B。2.运算律:a)交换律:ABBAABBA,b)结合律:CABBCACBACBA)()()()(,c)分配律:)()()()()()(CABACBACABACBA,d)对偶律:BABABABA,三、事件的概率与古典概型:1.事件A发生的频率的稳定值p称为事件A发生的概率,记做:pAP)(,10p2.概率的性质:a)非负性:0)(APb)规范性:10pc)完全可加性:11)()(iiiiAPAPd)0)(Pe)设A,B为两个事件,若BA,则有)()()(APBPABP,且)()(APBP3.古典概型试验与古典概率计算:a)古典概型试验是满足以下条件地随机试验:①.它的样本空间包含有限个样本点②.每个样本点的发生等可能的。b)古典概率的计算:NNAPA)(;c)两个基本原理:①加法原理:假如做一件事情有两类办法,在第一类办法中有m种不同方法,而在第二类办法中有n种不同方法,那么完成这件事情就有m+n种不同方法。可以推广到有多类办法的情况;①乘法原理:假设做一件事情可以分成两步来做,做第一步有m种不同方法,做第二步有n种不同方法,那么完成这件事情有mn种不同方法。也可以推广到多个步骤的情形。4.条件概率:在事件B发生的条件下(假定P(B)0),事件A发生的概率称为事件A在给定事件B的条件概率,简称A对B的条件概率,记做:)()()|(BPABPBAP;5.概率公式:a)互逆:对于任意的事件A,1)()(APAP;b)广义加法公式:对于任意的两个事件A和B,)()()()(ABPBPAPBAP,广义加法公式可以推广到任意有限个事件的并的情形,特别地:)()()()()()()()(ABCPBCPACPABPCPBPAPCBAPc)减法公式:)()()(ABPAPBAP——→)()()(BPAPBAPBA,则;d)乘法公式:P(AB)=P(A)P(B|A),P(A)≠0;e)全概率公式:设事件A1,A2,…,An两两互斥,A1+A2+……+An=Ω(完备事件组),且P(Ai)0,i=1,2,…,n则对于任意事件B,有:niiiABPAPBP1)|()()(;f)贝叶斯公式:条件同上则对于任意事件B,如果P(B)0,有:niiiiiiABPAPABPAPBAP1)|()()|()()|(;第三章随机变量及其分布随机变量:取值带有随机性,但取值具有概率规律的变量一、离散型随机变量:取值可以逐个列出1.数学期望:1)定义:iiipxEx,以概率为权数的加权平均数;2)性质:Ec=c(常数期望是本身)E(ax)=aEx(常数因子提出来)E(ax+b)=aEx+b(一项一项分开算)2.方差:1)定义:iiipExxExxEDx22)()(;2)性质:Dc=0(常数方差等于0)D(ax)=a2Dx(常数因子平方提)D(ax+b)=a2Dx3)公式:22)()(ExxEDx(方差=平方的期望-期望的平方);3.常用随机变量:1)0-1分布:①随机变量X只能取0,1这两个值;①X~B(1,p);①Ex=pDx=p(1-p)2)二项分布:a)分布律:nkppCkXPknkkn,,,,210)1()(;b)X~B(n,p)c)Ex=npd)Dx=np(1-p)e)适用:随机试验具有两个可能的结果A或者A,且P(A)=p,P(A)=1-p,将次贝努里试验重复n次。3)泊松分布:a)分布律:2,1,0!)(kkekXPk,,λ0b)X~P(λ)c)Ex=λd)Dx=λmkmk4.设X是一个连续型随机变量:1)X的均值,记做μ,就是X的数学期望,即μ=EX;2)X的方差,记做DX或2,是2)(X的数学期望,:222)(])[(XEXEDX3)X的标准差,记做σ,是X的方差2的算术平方根,即2;5.常用连续型随机变量:名称分布律或密度记法EX期望DX方差均匀分布,其他,(0)1)(bxaabxf],[~baUX2ba12)(2ab指数分布000)(xxxfx,,,λ0)(~EX121正态分布021)(222)(2,xxp),2(~NXμ2标准正态分布221xxx)(X~N(0,1)016.正态分布的密度曲线y=P(x)是一条关于直线x=μ的对称的钟形曲线,在x=μ处最高,两侧迅速下降,无限接近X轴;σ越小大,曲线越高扁。7.标准正态分布的密度曲线y=φ(x),是关于Y轴对称的钟形曲线。8.随机变量的标准化DXEXXX(减去期望除标差)。9.标准化定理:设)1,0(~Z(~2NXNX=),则,。二、二维随机变量:1.用两个随机变量合在一起(X,Y)描述一个随机试验,(X,Y)的取值带有随意性,但具有概率规律,则称(X,Y)为二维随机变量。2.X,Y的协方差:cov(X,Y)=E[(X-EX)(Y-EY)]=E(XY)-EXEY,cov(X,Y)0说明X与Y之间存在一定程度的正相关关系,cov(X,Y)=0称X与Y不相关,cov(X,Y)0说明X与Y存在一定程度的负相关关系;3.X,Y的相关系数:DYDXYXryx),cov(,,取值范围是11,YXr,越接近1,表明X与Y之间的正线性相关程度越强,越接近于-1,表明X与Y之间的负线性相关程度越弱,当等于0时,X与Y不相关。4.随机变量的线性组合:1)E(aX+bY)=aEX+bEy;2))(),(2)()(22YDbYXabCovXDabYaXD三、决策准则与决策树:1.决策:对不确定的因素进行估计,从几个方案中选择一个2.决策三准则:1)极大极小原则:将各种方案的最坏结果(极小收益)进行比较,从中选择极小收益最大的方案;2)最小期望损失原则:选择期望损失最小的方案;3)最大期望收益原则:选择期望收益最大的方案。3.决策树:使我们把不确定因素的过程以图解的形式表示出来,有简单、直观的优点。第四章抽样方法与抽样分布一、抽样基本概念:总体:研究对象的全体;个体:组成总体的每一个个体;抽样:从总体中抽取一部分个体的过程;样本:从总体中抽出的一部分个体构成的集合;样本值:在一次试验或观察以后得到一组确定的值;随机样本:①.个体被抽到的可能性相同②.相互独立③.同分布。二、抽样方法:1.简单随机抽样:总体中有n个单元,从中抽取r个单元作为样本,使得所有可能的样本都有同样的机会被抽中。有放回抽样的样本个数为rn;无放回抽样的样本个数为rnC。2.系统抽样:将总体单元按照某种顺序排列,按照规则确定一个起点,然后每隔一定的间距抽取样本单元。3.分层抽样:在抽样之前将总体划分为互不交叉重叠的若干层,然后从

1 / 16
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功