模糊数学方法及其应用

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1第十一章模糊数学方法及其应用§1模糊聚类分析(参考内容)§2模糊模型识别(参考内容)2模糊数学是用数学方法研究和处理具有“模糊性”现象的数学。所谓的模糊性主要是指客观事物差异的中间过渡界线的“不分明性”。如储层的含油气性、油田规模的大小,成油地质条件的优劣,圈闭的形态,岩石的颜色等。这些模糊变量的描述或定义是模糊的,各变量的内部分级没有明显的界线。地质作用是复杂的,对其产生的地质现象有些可以采用定量的方法来度量,有些则不能用定量的数值来表达,而只能用客观模糊或主观模糊的准则进行推断或识别。前言31965年美国控制论专家L.A.Zadeh提出这一概念后,模糊数学得到迅速发展并应用到各个领域,地学种主要用于矿产资源评价,各种地质现象的分类、识别、决策和模拟。在此介绍油气勘探中常用的模糊聚类分析和模糊识别。4§1模糊聚类分析模糊聚类分析是在模糊相似矩阵的基础上,对分类对象进行定量分类的方法。主要内容数据标准化建立模糊相似矩阵动态聚类一、数据标准化1.原始数据设论域U是n个被分类对象构成的集合,每个对象又有m个描述对象特征的变量,它们的观测值构成原始数据矩阵:5nmnnmmxxxxxxxxxX2122221112112.极差正规化求模糊矩阵时要求将数据压缩到区间[0,1]上,为此对原始数据进行极差正规化处理。极差是变量观测值的最大值与最小值之差,即极差正规化是变量的每个观测值减去观测值的最小值再除以极差。变换公式为:),,,(minmaxmjxxxijniijnij21116由上可知,对原始数据正规化处理以后,变量最大值为1,最小值为0,即新数据在区间[0,1]内。),,2,1;,,2,1(/)min(1mjnixxxxjjinijiji二、模糊相似矩阵模糊相似矩阵是进行模糊聚类的基础。下面介绍建立模糊相似矩阵的常用方法。7(1)数量积法1.相似系数法显然|rij|∈[0,1],若rij0,令rij’=(rij+1)/2,则rij’∈[0,1]。其中mijkikMijxxr111矢量或点:Xj=(xj1xj2…xjm)Xi=(xi1xi2…xim)i=ji≠ji,j=1,2,…,nmkjkikjixxM1)(max8(2)夹角余弦法见相似性度量聚类中的相似系数。(3)相关系数法见相似性度量聚类中的相关系数。),,2,1,()(/)(11njixxxxrmkmkjkikjkikij符号∧和∨分别表示两个元素取小和取大。(4)最大最小法例如:94.05.1/6.012r5.16.05.04.0)(1mkjkikxx0.16.0/6.012r)3.02.01.0()3.02.01.0(21xx6.03.02.01.0)(1mkjkikxx6.03.02.01.0)(1mkjkikxx)6.05.04.0()3.02.01.0(21xx6.03.02.01.0)(1mkjkikxx10(5)算术平均最小法0.12.1/2.112r)3.02.01.0()3.02.01.0(21xx2.1)3.02.01.0(2)(21mkjkikxx2.16.04.02.0)(1mkjkikxx),,2,1,()(/)(211njixxxxrmkmkjkikjkikij11(6)几何平均最小法0.16.0/6.012r)3.02.01.0()3.02.01.0(21xx6.03.02.01.0)(1mkjkikxx6.03.02.01.01mkjkikxx),,2,1,(/)(11njixxxxrmkmkjkikjkikij122.距离法上述(4)、(5)、(6)三种方法要求xij≥0,否则,要进行适当变换。(1)绝对值倒数法适当选取M,使得0≤rij≤1。mijkikijxxMr1||/1i=ji≠ji,j=1,2,…,n(2)欧氏距离见相似性度量聚类中的相似系数。13),,2,1,(1njixxdjkikmkij建立模糊相似矩阵的其他方法,就不再介绍了。(3)切比雪夫距离三、聚类1.模糊等价矩阵给定U上的一个模糊关系Rij=[rij]n×n,若它满足:(1)自反性(rij=1);(2)对称性(rij=rji);(3)传递性();则称R是U上的一个模糊等价矩阵。RRR14式中“○”表示矩阵的合成运算,类似矩阵乘法运算,但要将元素的相乘改为求最小值、相加改为求最大值。例如:矩阵乘法运算矩阵○运算33336342214323215628281463422143232115相似性度量的相关、相似系数矩阵满足自反性和对称性,但不一定满足传递性。对于传递性,可先计算R○R(记作R2),然后看其是否满足传递性。若不满足,经过R○R=R2,R2○R2=R4…运算,可将R改造成满足传递性的模糊等价矩阵。2.模糊等价矩阵的λ截矩阵设R=[rij]n×n是模糊等价矩阵,对任意λ∈[0,1],称Rλ=[rij(λ)]n×n为R=[rij]n×n的λ截矩阵,其中:ijijijrrr,,)(01161.000.890.420.410.270.220.891.000.460.450.300.250.420.461.000.770.680.560.410.450.771.000.620.590.270.300.680.621.000.690.220.250.560.590.691.00R=将R中≥0.6的元素改为1,其它元素改为01.001.000.000.000.000.001.001.000.000.000.000.000.000.001.001.001.000.000.000.001.001.001.000.000.000.001.001.001.001.000.000.000.000.001.001.00RR=矩阵RR叫做R矩阵的截矩阵(λ≥0.6)173.分类由模糊等价矩阵的λ截矩阵可知,当rij=1时,i与j应为同类,否则为异类。让λ由大到小变化,可形成动态聚类图。18对于不同的λ∈[0,1],可得不同的分类方案,从而形成一种动态聚类图。这对全面了解对象的分类情况是比较形象和直观的。但有的实际问题需要选择某个阀值λ,确定一个具体的分类,这就是确定阀值λ的问题。二、最佳阀值λ的确定在动态聚类过程中,调整λ的值以得到适当的分类。另外,也可由熟悉专业的专家确定阀值λ,得到阀值λ水平上的分类。1.按实际需要确定19设对应于λ的分类数为r,第j类的样品数为nj,j类的样本记为:)()(2)(1,,,jnjjjxxx),,,()()(2)(1)(jmjjjxxxx)(jkx2.用F-统计量确定λ的最佳值jnijmjjjjikjjkxxxxmkxnx121211),,,();,,,()()()()()()(nimikkxxxxmkxnx121211),,,();,,,(第j类的聚类中心为向量:第j类中第k个变量的平均值:20rjnijjirjjjjrnxxrxxnF112)()(12)()/()1/(定义F-统计量为:表征了类与类之间的距离表征类内样品间的距离F越大,表明类间的差异越大,分类效果就越好。mkkjkjxxxx12)()()()(jxx)()(jjixx)(jix)(jx为:与的距离。为第j类中样品与的距离。21假设各类差异不明显,对于给定的检验水平α,查Fα(r-1,n-r)分布表,得临界值Fα,若FFα,则认为各类之间有明显的差异。F服从自由度为r-1,n-r的F分布。22简单讲,模型识别就是根据研究对象具有的某些特征对其进行识别并归类。如采集的植物标本识别它属于哪个纲目;又如拨打电话号码识别对应的电话机。这种模型识别具有2个本质的特征:§2模糊模型识别一、基本概念①事先已知若干标准模型(称为标准模型库),模型具有明显的界线;1.模型识别②有待识别归类的对象,并且它所属的类必然是若干标准模型之一。23模糊模型识别是指标准模型库中的模型是模糊的(模型间没有明显的界线)。如据电测或气测资料,建立的储层含油气性(油层、油气层、油水同层、气层、含水油层、干层等)标准模型库,又如由不同沉积相岩样观测值构成的岩样标准模型库,它们中的模型都是模糊的。因此,根据测井信息或者岩样的观测值判断钻穿储层的含油气性、岩样的沉积相是一个模糊集对标准模糊集的识别问题。对于这类模型识别问题,可据模型的界线对待识别对象进行归类,是标准集对标准集的识别。2.模糊模型识别24为了解决模糊集的识别问题,需要一个度量模糊集与标准模糊集靠近程度的指标,这就是下面要介绍的隶属度和贴近度。(1)模糊向量及其内外积若0≤ai≤1(i=1,2,…,n),则称向量a=(a1,a2,…,an)为模糊向量。设a,b是模糊向量,则分别称:二、隶属度和贴近度1.隶属度)(1iinibaba)(1iinibaba为向量a与b内积和外积。符号∧和∨分别表示两个元素取小和取大。ni1ni1表示和取大、小运算。25例如设:).,.,,.(),.,,.,.(30700206005010ba20.ba0.10.500.60.200.70.30.20.50.70.6取小→0.230.ba0.10.500.60.200.70.30.1000.3取大→0.3ab26)~,,~,~(~21nAAAA(2)模糊向量集合族(3)隶属度设U上有n个模糊子集,其隶属函数为:当为模糊向量集合族,为普通向量时,则:),,,(21nxxxx),,2,1)((~nixAi))(~()(~1iinixAxA为对的隶属度。xA~设是论域U上的n个模糊子集,称以模糊集为分量的模糊向量为模糊向量集合族,记为:nAAA~,,~,~21nAAA~,,~,~21nAAA~,,~,~21nAAA~,,~,~2127应用模糊数学方法的关键是建立符合实际的隶属函数,但它是目前尚未完全解决的问题。我国的汪培庄教授提出的随机集落影理论对于相当一部分模糊集的隶属函数的客观实在性给出了满意的解释,基于这一理论的模糊统计方法是确定一类模糊集隶属度的有效方法。现确定隶属函数的方法有模糊统计法、指派法、借用已有尺度法等。niiixAnxA1)(~1)(~基于不同考虑,隶属度也有其他的定义形式,如:28(4)最大隶属度原则原则Ⅰ:设论域U={x1,x2,…,xn}上有m个模糊子集:mAAA~,,~,~21)()(~0100xAxAkmki0~iA(m个模型)构成一个标准模型库,若对x0∈U,有i0∈{1,2,…,m}使得则认为x0隶属于。29则应首先录取xk。原则Ⅱ:设论域U上只有1个标准型,现有n个待识别对象x1,x2,…,xn∈U,若其中的xk满足:A~))(~()(~1inikxAxA为便于理解,下面给出两个应用的例子:3010090,19080,1080800,0)(~xxxxxA原则Ⅰ的例子。在论域U=[0,100](分数)上确定三个代表学习成绩的模集糊=“优”,=“良”,=“差”。当某学生的数学成绩为88分时,该学生的数学成绩该评为优、良、还是差?A~B~C~为此,要先建立模糊集隶属函数。有人用指派法建立了论域U上模糊集的隶属函数为:CBA~,~,~CBA~,~,~3110095,09585,10958580,18070,1070700,0)(~xxxxxxxxB

1 / 42
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功