11.数据的类型:根据描述事物所采用的不同尺度,数据分为分类型数据和数量型数据;按照被描述的对象与时间的关系分为截面数据、时间序列数据与平行数据。2.图形显示:饼形图、条形图、柱形图、散点图、折线图、曲线图、茎叶图。(1)饼形图的作用:反映各个部分的构成各频率的总合是100%。(2)条形图和柱形图:信息的比较——条形图:不同单位,不同信息的比较;柱形图:同一单位不同时间信息的比较。(3)折线图:同柱形图作用相似,对同一的数据折线图具有唯一性(两点间有且只有一条直线)。(4)曲线图:同折线图作用相似也是表示不同时间信息的比较,但不具有唯一性。(5)散点图:表示两个变量之间的相互关系。(两个变量的任何一对取值都在平面直角坐标系上代表一个点)。(6)茎叶图:把每一个数据分解成两部分——茎与叶(它的优点在于它既保留了所有的原始数据又直观地显示出了数据的分布情况(与条形图相似))3.平均数、中位数和众数的关系:(1)数据分布是对称分布时:众数=中位数=平均数(2)数据分布不是对称分布时:左偏分布时:众数<中位数<平均数右偏分布时:众数>中位数>平均数4.分组数据的平均数(加权平均):平均数=频数的和组中值)的和频数*(5.极差R=最大值—最小值(极差容易受极端值的影响有时是无效的)6.四分位极差先排队再等分为4份,其中41n对应Q1,中位数为Q2,4)1(3n的对应Q3,n为总个数。Q3-Q1=四分位极差,这两个点上的数值叫四分位点。如果四分位点不是一个整数则将前后两位数相加除以2便是。7.方差22)(1xxni8.变异系数是标准差与平均数的比值,即:%100xV9.样本空间与随机事件的两种表示方法:(1)列举法;(2)描述法10.按照随机变量的取值情况,一般把随机变量分为:(1)离散型随机变量;(2)连续型随机变量。11.若两个事件是相依的,则不一定是互斥的。12.概率的乘法公式:)()()()()(ABPAPBAPBPABP(B发生的概率×B发生条件下A也同时发生的概率)13.全概率公式:)()()()()()()()(221121iinnnABPAPABPPAABPPAABPPABAPBAPBAPBP)(14.贝叶斯公式:)()()()(iiiiiABPAPABPAPBAP)(【例。全概率】某车间有4个工人生产同一种产品,每个人生产的产品个数分别占总产量的15%,20%,30%和35%,每个人的次品率分别为0.05,0.4,0.03和0.02,求该产品的总次品率(即随机地抽取一个产品,它是次品的概率)。解:设Ai代表“取到的产品是第i个人生产的”,i=1,2,3,4.设B代表“取到的产品是次品”。根据题意有:P(B/A1)=0.05P(B/A2)=0.04P(B/A3)=0.03P(B/A4)=0.02P(A1)=0.15P(A2)=0.20P(A3)=0.30P(A4)=0.35我们想要求的是P(B),首先所有的产品都是由4个人中的一个人生产的,因此A1+A2+A3+A4=M,同时,A1,A2,A3.A4两两互斥,由概率的加法公式得P(B)=P(BM)+P{B∩(A1+A2+A3+A4)}=P(BA1)+P(BA2)+P(BA3)+P(BA4)再由概率的乘法公式,得到)()(iiABPAPBP)(=0.15*0.05+0.20*0.04+0.30*0.03+0.35*0.02=0.0315即总次品率为3.15%2【例。全概率】在上例中,假设车间规定,出了次品要追究有关人士的经济责任,现从生产出的产品中任取一件,结果为次品,但它是由谁生产的标志已脱落,问这4个人当中谁生产了这个次品的可能性最大?解:沿用上例的符号,我们想求的是P(Ai/B),i=1,2,3,4.由条件概率的定义和乘法公式,我们可以得到:P(A1/B)=0.15*0.05/0.0315=0.238P(A2/B)=0.2*0.04/0.0315=0.254P(A3/B)=0.30*0.03/0.0315=0.286P(A4/B)=0.35*0.02/0.0315=0.222即该次品由第3个人生产的概率最大。【例。贝叶斯】某出版社向80%教授MBA管理经济学的教师寄送了关于一本管理经济学方面的新教科书的广告。在收到广告的教师当中,有30%采用了该书,在没有收到广告的教师中了,有10%采用了该书,已知某教师采用了该书,问他收到了广告的概率是多少?解:设A代表事件“收到广告”,B为“采用了该书”。则根据题意P(A)=0.80,P(B/A)=0.30,P(B/A非)=0.10我们想求的是非)(非))(A/BP()/()()()(APABPAPABPAPBAP=[0.8*0.3]/[0.8*0.3+0.2*0.1]=0.92315.期望值:iiPXXE)()()(XEPXXE22)2()()(XEXE3232)()(XbEabxaEpXXEii)(【例。数学期望】若20)(XE,求)(42xE,523xE的期望值。5.520415.0415.0415.0415042)()()()(XEXEXEXE6.8205253)(52535253523XEXEXE)()(16.离散型随机变量的方差:2222)()()()()(EEpxXD17.二项分布【例】:次品率为0.05(1)从中抽取10个1个为次品,其余为正品995.005.0P(2)10个中有1个正品,第2个为次品,其余为正品的概率P(概率)9111095.005.0C(3)10个中有2个次品8221095.005.0C[次品位置固定时前两个为8295.005.0]knkknPPCkP)1()(X=K表示做几次试验,有K次出现的概率为多少。二项颁布率为X~B(n、p)二项颁布期望值E(X)=np方差D(X)=np(1-p)18.泊松公布:X~P()单位时间内某事件出现的次数!kekXPke为自然数=2.718283当n很大并且P很小时,可以利用泊松分布来近似地计算二项分布。泊松分布特征值:E(X)=(期望值)标准差D(X)=【例。泊松分布】某大学计算机中心有计算机80台,各台工作是相互独立的,发生故障的概率都是0.01,假设一台计算机的故障可由一个维护人员来处理,问至少需配备多少维护人员,才能保证计算机发生故障但不能及时维修的概率小于0.01.解:设需配备N人,用X表示同一时刻发生故障的计算机台数,则X---B(80,0.01),我们要确定使P(X≤N)≥0.99的最小的N。N应满足99.08.08.00!kekNk即1—01.08.08.00!kekNk查表得满足上式的最小的N是3,即至少应配备3个维护人员。19.连续型随机变量的数学期望值和方差若已知E(x),计算E(a+bx)=a+bE(x)方差:若已知D(x),计算D(a+bx)=b2D(X)所有变量值减去期望值为0。X除以标准差的方差为1。【例。连续型随机变量的数学期望和方差】某人估计她家八月份的电费(元)由下式决定:X=28.5+0.6C其中C是八月份的平均温度(单位:C),它是均值为34.2,标准差为2.2的连续型随机变量,求该人家八月份的平均电费以及标准差。解:该人家八月份的平均电费为:E(X)=28.5+0.6E(C)=28.5+0.6*34.2=49.02(元)其标准差为σx=√σ2=2*62.0=0.6*2.2=1.3220.决策的准则:(1)极大极小原则(悲观准则)。(2)最大期望收益原则。(3)最小期望机会损失原则(机会损失)。21.决策的三个基本要素:(1)要找出决策方案(两个以上)。(2)找出自然状态(无法控制的)。(3)收益值和损失值(找出不同方案在不同自然状态下的收益值和损失值)。22.总体均值的估计:x(总体均值);P(总体比例);21xx(两个总体均值之差);21PP(总体比例差)9545.0)22(6827.0)112222nnxnxPnxnxP;(一、总体分布方差σ2已知,用Z代表大样本nzxa2重复抽样;)1(2NnNnzx不重复抽样。1的置信度为90%时,2Z=1.6451的置信度为95%时,2Z=1.961置信度为95.45%时,2Z=21置信度为99.73%时,2Z=3二、总体正态分布、方差未知、大样本1nsx22Z重复抽样;)1(2NnNnsZx不重复抽样【例。置信区间】某汽车租赁公司欲估计全年每个租赁汽车的顾客每次租赁平均行驶的里程。由于全年汽车租赁量很大,随机抽取了200个顾客,根据记录计算平均行驶里程X=325公里,标准差s=60公里。试估计全年所有租赁汽车每次平均行驶里程的置信区间。置信水平分别为(1)0.90,(2)0.95.解:由于样本量n=200为大样本,故x的抽样分布为正态分布,x的标准差的估4计值为ns=20060=4.2426(1)置信度为90%时,2Z=1.645,由公式nSzxa2,置信区间为=3251.645(4.2426)=3256.98,为318.02公里至331.98公里之间。(2)置信度为95%时2Z=1.96,u的置信区间为3251.96(4.2426)=3258.32。【例。置信区间】某药厂在生产过程中改换了一种新的霉素,测定了36批产品的产出率与理论产出率的比值:1.281.311.481.100.991.221.651.400.951.251.321.231.431.241.731.351.310.921.101.051.391.161.191.410.980.821.220.911.261.321.711.291.171.741.511.25要求:(1)计算这一比值95%的置信区间;(2)得出上述结论时作出了什么假设;(3)能否以95%的置信水平说明新霉素的产出率提高了。解:(1)计算得到x=1.268s=0.228,置信度为95%时2Z=1.96,故置信区间为nSzxa2=1.2681.96(6228.0)得1.194﹤u﹤1.342.(3)假设36批的样品是随机的。(4)说明新的霉素的产出率提高了,因为置信下限已超过1.23.总体正态分布、方差未知、小样本nsntx22)1(重复抽样;)1()1(22NnNnsntx不重复抽样。【例。置信区间】为研究独生子女的每月零花钱,从某小学随机抽取了20个独生子女的家庭,得到x=107,s=40,试以95%的置信度估计该校独生子女小学生家庭平均每月零花钱的置信区间。解:因为t分布适用于正态总体,因此研究这一问题应首先假设独生子女家庭的子女零花钱应服从正态分布,在小样本、总体方差未知用S2代替时,su非x~t(n-1),由公式nsntx22)1(其置信区间为:nsntx22)1(=204009.2107=(88.3~125.7元)24.假设检验的基本思想——小概率原理;接受域和拒绝域—若在小概率范围的区域【例】:<-n,>n(0.27内)称<-n,>n为拒绝域;显著水平=α—原假设为真的,但我们却错误地拒绝了它,而这种可能性是多少?就是显著水平α(也就是小概率原理)25.假设检验中两类错误:弃真错误——同第五点α取伪错误——样本本是假的β弃真错误减少则取伪错误增加=两者成反比我们只能控制“弃真错误”26.原假设和备择假设H0:u=u0H1:u≠u0拒绝域两边H0:u≥u0H1:u<u0拒绝域左边H0:u≤u0H1:u>u0拒绝域右边=①等号一定在原假设上;②(单侧检验);③一般把希望拒绝的假设放在原假设5中(对立方不一样),(拒绝的错误,就是弃真错误,更直观地知道)在中立立场上,把可能拒绝的放在原假设中。三种形式,希望拒绝;可