第一讲系统的不确定性表征区间(灰)数模糊数自然语言变量直觉模糊数随机变量三端点区间数未确知数云模型2一、区间数3区间数的运算45区间数的大小比较6国内外对于区间数排序方法的研究虽然较多,但到目前还没有一个能够被大家所普遍接受的最好方法。现有文献的区间数排序方法,基本上都是试图把这个不确定性的问题转换为确定性的问题,然而这样得到的排序结果可能会存在一定的不合理性,因此区间数排序问题值得进一步研究。78二、模糊数在经典集合论中,元素和集合之间的关系是属于或不属于,二者必居其一。如a∈A,b≮A,关系非常明确。经典集合具有分明的边界,即外延是明确的。现实生活中,人们的认识还存在着另一类边界不分明,即模糊性的概念,如“这个城市很漂亮”,“胖子’’等等,这类概念的外延是模糊的,如“高与矮”的边界是多少?9针对这种模糊性的外延,元素与集合的关系,只能用隶属度来表示,即用[0,1]上的实数去衡量。如对于“高个子”这个模糊概念,可给出如下表示:身高(n1)2.11.81.51.3隶属度0.950.830.10.02即身高1.8m的人属于“高个子”集合的程度是83%(0.83)。在模糊性现象中,不能用“属于”或“不属于”这两种绝对的判断来表示元素与集合之间的相互关系,而只能用隶属度来表示元素隶属于集合的程度。10隶属函数的确定和选择具有一定的主观性,既取决于对模糊集合的深刻认识,也取决于丰富的实践经验。隶属函数的建立,通常方法是初步确定粗略的隶属函数,再通过“学习”和不断的实践检验,逐步修正和完善,从而达到主观与客观的一致。11常用的模糊数三角模糊数梯形模糊数12模糊数的运算规则1314隶属函数概念用一个唯一的精确数值表示元素。对模糊集合的隶属程度,不符合人们对自然语言中概念的理解。隶属函数一旦通过人为假定“硬化”成精确数值后,就被强行纳入到精确数学王国。15三、自然语言16自然语言的另外几种形式:负对称的形式(S-2,S-1,S0,S1,S2,S3)连续的形式(S2,S2.2)17自然语言处理的两种方式自然语言变量集相对应的模糊数Verypoor(S1)(0,0,0,20)Betweenverypoorandpoor(S2)(0,0,20,40)Poor(S3)(0,20,20,40)Betweenpoorandfair(S4)(0,20,50,70)Fair(S5)(30,50,50,70)Betweenfairandgood(S6)(30,50,80,100)Good(S7)(60,80,80,100)Betweengoodandverygood(S8)(60,80,100,100)Verygood(S9)(80,100,100,100)18四、随机变量表示随机现象(在一定条件下,并不总是出现相同结果的现象称为随机现象)各种结果的变量(一切可能的样本点)。例如,某一时间内公共汽车站等车乘客人数,电话交换台在一定时间内收到的呼叫次数等等,都是随机变量的实例。19一个随机试验的可能结果(称为基本事件)的全体组成一个基本空间Ω。随机变量X是定义在基本空间Ω上的取值为实数的函数,即基本空间Ω中每一个点,也就是每个基本事件都有实轴上的点与之对应。例如,随机投掷一枚硬币,可能的结果有正面朝上,反面朝上两种,若定义X为投掷一枚硬币时正面朝上的次数,则X为一随机变量,当正面朝上时,X取值1;当反面朝上时,X取值0。如,掷一颗骰子,它的所有可能结果是出现1点、2点、3点、4点、5点和6点,若定义X为掷一颗骰子时出现的点数,则X为一随机变量,出现1,2,3,4,5,6点时X分别取值1,2,3,4,5,6。20要全面了解一个随机变量,不但要知道它取哪些值,而且要知道它取这些值的规律,即要掌握它的概率分布。概率分布可以由分布函数刻画。若知道一个随机变量的分布函数,则它取任何值和它落入某个数值区间内的概率都可以求出。21变量的随机性的理解考试成绩的随机性(考分的随机性;评分的随机性);判断的随机性,…,2223五、未确知数24未确知数252627复杂性28六、三端点区间数未确知数表达的科学性和复杂性293031与三角模糊数的区别32七、(区间)直觉模糊数33根据得分函数排定直觉模糊数的大小。34八、云模型云模型(Cloudmodel)是我国学者李德毅院士提出的定性和定量转换模型。主要反映宇宙中事物或人类知识中概念的两种不确定性:模糊性(边界的亦此亦彼性)和随机性(发生的概率)。它把模糊性和随机性完全集成在一起,研究自然语言中的最基本的语言值(又称语言原子)所蕴含的不确定性的普遍规律。使得有可能从定性信息中获得定量数据的范围和分布规律,也有可能把精确数值有效转换为恰当的定性语言值。35云由许许多多个云滴组成,一个云滴是定性概念在数量上的一次实现。单个云滴可能无足轻重,在不同的时刻产生的云的细节可能不尽相同,但云的整体形状反映了定性概念的基本特征。36云的“厚度”是不均匀的,腰部最分散,“厚度”最大;而顶部和底部汇聚性好,“厚度”小。云的“厚度”反映了确定度的随机性的大小,靠近概念中心或远离概念中心处确定度的随机性较小,而离概念中心不近不远的位置确定度的随机性大,这与人的主观感受相一致。37云的数字特征用期望值Ex(ExpectedValue)、熵En(Entropy)和超熵He(HyperEntropy)三个数值来表征,构成定性和定量相互间的映射.期望值Ex是概念在论域中的中心值,是最能代表这个定性概念的值,通常是云重心对应的x值,它应该100%地隶属于这个定性概念.Ex反映了相应的定性知识的信息中心值.38熵En是定性概念模糊度的度量,反映了在论域中可被这个概念所接受的数值范围,体现了定性概念亦此亦彼性的裕度.熵越大,概念所接受的数值范围也越大,概念越模糊。超熵He是熵En的熵,反映了云滴的离散程度.超熵越大,云滴离散度越大,确定度的随机性越大,云的“厚度”也越大。3940九、其它的不确定性表示序值的扩展形式(确定序值,区间型序值,增强型序值)不清楚,不知道;不确定,拿不准;遗憾后悔;……41不确定性的表示研究方向结合心理学研究,更准确地表达客观事物(含决策者)的特性;容易决策和数学处理;决策柔性和准确性的折中与协调;有较厚实的数学基础;有现实背景(决策);……42有关应用某高校学生处拟基于学生的学习成绩来评价学生的学习能力及素质。设5门课程分别为:高级计量经济学;高等运筹学;现代工业工程;应用统计学;预测与决策。25位学生的成绩(或者评分)记为:aij,i=1,2,…,25;j=1,……,5。试分别根据aij的表达形式(可能含不确定性),进行择优分析。43本章思考请给出区间数、模糊数的四则运算规则、比较大小和计算距离的方法。尝试提出一种新的不确定性表示形式?