计算:1、标准差标准化:标准化后数据的特点:平均值为0,标准差为1,又称Xj’为规格化变量。2、极差标准化:特点:各列的极差为13、极差正规化:特点是:最大值为1,最小值为0,即新数据分布在区间[0,1]内。4、一元线性回归分析——该井段渗透率(K)是否和孔隙度(Φ)存在相关关系?(1)令x=Φ,y=ln(K),建立回归方程:(2)求相关参数进而可求出回归系数为:从而得到回归方程(同上)(3)检验方程的显著性:复相关系数检验R愈接近于±1时,说明y与x之间的线性关系很密切,回归方程的显著性越高;反之,当R愈接近于0时,y与x之间的相关性越差,回归方程就没有实际意义。统计量F检验:Q,Q1,Q2的自由度为:(n是观测样品数)遵从F(1,n-2)分布:FF,y与x存在线性关系,回归方程显著;F≤F,y与x没有线性关系,回归方程不显著以上检验说明方程式显著的。(4)将Φ=x,ln(K)=y代回方程,可以得到渗透率与孔隙度的关系式:5、多元回归分析——求储量密度y与这五个因素间的多元线性回归关系式。(1)计算各个变量的平均值以及Sijnijjijjijixxnxxx12)(1),,2,1;,,2,1(mjni),,2,1;,,2,1(minmax11mjnixxxxxjinijinijjijiyyxxxySSSQQQQ2121xxxySSb11Qfn111Qfn21Qf),,2,1;,,2,1(minmaxmin111mjnixxxxxjinijinijinijijiyyxxxySSSQQR2121)(miiixbyb1011nkkxxn11nkkyyn01bybx21222211//1(2)//(2)1QQQfQnRFQfQnR01ˆybbx22211111112221111()()1()()()()1()()nnnxxkkkkkknnnnxykkkkkkkkkknnnyykkkkkkSxxxxnSxxyyxyxynSyyyynln()0.386.19K0.386.19Ke(2)得出矩阵方程,解矩阵可得:b1,b2,……,将上述结果带入公式得出即可得回归方程(3)方程显著性检验:Q1=Q-Q2fQ=n-1fQ1=n-m-1fQ2=m则复相关系数、统计量(公式、判断同上)6、逐步回归分析——用逐步回归求储量密度Y与这五个因素之间的回归关系式。初步估计可选取3-4个自变量左右,取检验水平为α=0.05,则可由表查出Fα(1,10)=4.96,于是取引入和剔除变量的F1=F2=F*=5由原始数据算得各变量的均值及Sii,然后计算得相关系数的增广矩阵R(0)。第一步:计算所有变量的方差贡献,引入第一个变量得出V1(0),V2(0),V3(0),V4(0),V5(0)´,其中以V3(0)=0.55最大作引入x3′的显著性检验:于是在回归方程中引入变量x3′,按求解求逆变换公式对R(0)作变换,得矩阵R(1),按公式:第二步:计算未选入回归方程的其它自变量的方差贡献,引入第二个变量得出V1(0),V2(0),V4(0),V5(0)´,其中,V5(1)最大。作x5′的显著性检验,计算于是在回归方程中引入变量x5′,按求解求逆变换公式对R(1)作变换,得矩阵R(2),公式同上!第三步:检验引入到回归方程中新变量是否剔除(1)检验回归方程中有否应剔除的变量,x5’刚引入不能立即剔除,故检验x3’应否剔除,x3’的方差贡献为V3(2),并由此算出统计量F’如下故x3’不能剔除(2)考虑引入新的变量。计算x1´、x2´、x4的方差贡献得出V1(0)、V2(0)、V4(0),其中,x2’的方差贡献最大,作显著性检验yynkkSyyQ12)(nkkyyQ122)ˆ((0)(0)(0)(0)11/l,2,,5imiimiiVrrri),(/1),(/),(/),(/)()1()()()1()()()()()1()()()1(kajkairrkajkairrrkajkairrrrrkajkairrrNkakaNijNkakaNijNijNkakaNkajNikaNijNijNkakaNijNij)23(ˆ10miiixbby(0)*3(0)(0)1130.55152(2)15.910.55mmVnFFrV(1)(1)(1)(1)11/1i5,i3imiimiiVrrr(1)*5(1)(1)1150.176153(3)7.70.450.176mmVnFFrV(2)(2)(2)(2)3133133/0.212mmVrrr(2)30(2)11(3)0.2121539.280.274mmVnFFr(2)(2)(2)(2)11/1,2,4imiimiiVrrri于是在回归方程中引入x2’,同时对R(2)作变换得R(3)第四步:检验原先引入的变量是否有剔除(1)检验回归方程中有否应剔除的变量,即对原来引入的变量x3’及x5’计算其方差贡献,得V3(3)=-0.159V5(3)=-0.136,x5’的方差贡献的绝对值最小,对它进行检验故x5’不应剔除(2)考虑引入新的变量,计算x1’和x4’的方差贡献,其中,x4’的方差贡献最大,对x4’作显著性检验算出故x4’不能引入,于是没有变量可以引入方程了,回归到此结束.7、趋势面分析(1)多项式曲面的一般形式:(2)二维二次:(3)二维三次:(4)拟合度:拟合度越高,说明趋势面拟合程度越好。(5)偏差:观测值与趋势值之差,即8、聚类分析Q型:(1)相似系数:(2)相关系数:),,2,1,(nji在相关系数矩阵中:rij=rji,rii=1。rij越接近1,Xi与Xj的相关程度越大。(3)距离系数:即形成距离系数矩阵[dij]n×n。dij=dji,dii=0。dij越接近0,Xi与Xj的性质越相近。R型:(1)相似系数:*0.13215410.220.2740.132FF*0.136(15-4)0.14210.5FF*0.36615323.470.1420.036FF()26524321ˆybxybxbybxbbz26524321ˆybxybxbybxbbz31029283726524321ˆybxybyxbxbybxybxbybxbbz%1002QQCiiizzzˆmkmkjkikmkjkikjijijijixxxxXXXXr11221cos),,2,1,(njijjiijimkmkjkjikimkjkjikijiSSSxxxxxxxxr11221)()())((2/112)(1mkjkikjixxmd),,2,1,(njinknkkjkinkkjkijijijijixxxxXXXXr11221cos),,2,1,(mji形成相似系数矩阵[rij]m×m。其中:rij=rji,rii=1。rij越接近1,Xi与Xj的相似程度越大。(2)相关系数:形成相关系数矩阵[rij]m×m。其中:rij=rji,rii=1。rij越接近1,Xi与Xj的相关程度越大。(3)距离系数:形成距离系数矩阵[dij]m×m。dij=dji,dii=0。dij越接近0,Xi与Xj的性质越相近。1、一次形成法——现要求用一次形成法对样品进行分类(1)写出原始数据阵ijx(2)选择适当的相似统计量如下:本例选用样品间相似系数,算得相似系数矩阵=[cosij](用Q型相似系数公式)(2)一次谱系图形成:(3)(a)找出中最大值q(1)max=q45=0.9790,将样品4与样品5聚合为一类,同时划去第五行和第五列。(4)(b)找出中剩余元素的最大值q(2)max=q16=0.9763,划去第六行和第六列。(5)(c)找出中剩余元素的最大值q(3)max=q23=0.9549,划去第三行和第三列。(6)(d)找出中剩余元素的最大值q(4)max=q14=0.9133,同时划去第四行和第四列。(7)(e)找出中剩余元素的最大值q(5)max=q12=0·7524,划去第二行和第二列。聚合归类过程表谱系图0.70.80.91联结顺序联结样品相似系数1x4x50.97902x1x60.97633x2x30.95494x1,x6x4,x50.91335x1,x6,x4,x5x2,x30.7524456231jjiijinknkjkjikinkjkjikijiSSSxxxxxxxxr11221)()())((),,2,1,(mji2/112)(1nkkjkijixxnd),,2,1,(mji2、最优二分割分2段:取k=2,令j=1,2,…,n-1,α1是最优2分割的分割点,X分割为2段段内离差平方和:3、最优三分割分3段:取k=3,令j=1,2,..,n-1,j≠α1,则α2是最优3分割的第2分割点,X分割为3段;9、判别分析两总体判别分析——若油层为组A,水层为B,现要求根据表中的数据建立判别函数并检验其有效性。(1)计算各组指标的平均值和均值(jd=油层A)(axj平均值—水层B)(bxj平均值)(2)给出(3)给出判别系数C1、C2、C3、C4,从而判别函数为:(4)计算各组判别函数的平均值和判别指标多总体判别分析——油层、水层、油水层的判别函数(1)给出第一、二、三组判别函数(2)将31个原样品指标代入各判别函数,将每个样品归于其判别函数值为最大的那一组,考察其判对率,以第一组第一个样品为例。得出F1(X)、F2(X)、F3(X)。(3)因为F1(X)的值最大,所以样品应该为第一组。还可以算出样品1归于各组的后验概率可见归于第一组的概率最大,为96%。逐步判别分析—用Bayes逐步线性判别法建油层、水层、油水层三组判别函数。(1)开始无变量可剔除,故考虑引入变量。U1=w11/t11U2=w22/t22U3=w33/t33U4=w44/t44很明显,U4最小,可见x4的分辨力最强,对它作F检验,算得故将x4引入判别函数。(2)对矩阵W和T作变换,得矩阵W(1)和T(1)(r=4));2(min);2(111jSSnnjn);3(min);3(1,112jSSnjnjn),,2,1()]()([mjbxaxdjjjmmxcxcxcy221141()()8.1307jjjyAcxA41()()8.1667jjjyBcxBbabannBynAyny)()(0exp(29.95)11/exp(29.95)exp(19.91)exp(26.83)0.962/03/0.04PXPXPX()12()()prrrpprrwUrrrrt,,...,()()1()44()(1)/(1)/()(1)(1)/(31)(10.28536)/435.062.52/(313)0.28536/28pprrrrrprrrNGPtwUGFUNGPGwUU()()()()()()(1)()()()/(,)/(,)1/(,)/(,)pprlrrppppprlkrrlrrklprrppirrrwwkrlr()()()()()()(1)()()()/(,)/(,)1/(,)/(,)p