第十讲概率粗糙集模型1Y.Y.Yao,Three-waydecisionswithprobabilisticroughsets,InformationSciences,180(2010)341-3532Y.Y.Yao,S.K.M.Wong,P.Lingras,Adecision-theoreticroughsetmodel,in:Z.W.Ras(Eds),MethodologiesforIntelligentSystems,vol.5,North-Holland,1990,17-243Y.Y.Yao,Y.Zhao,Attributereductionindecisiontheoreticroughsetmodel,InformationSciences,178(2008)3356-3373设P是样本空间U上的一个概率测度。条件概率:()()()PABPABPB;全概率公式:设{;1}iAik是样本空间的一个划分,则11()()()().iiiikikPAPAAPAAPA贝叶斯公式:1()()()().()()()iiiijjjkPAPAAPAAPAAPAPAPAA最小风险贝叶斯决策设(,,,,)KUPATVf是一个概率知识表示系统,其中(,,,)UATVf是一个信息系统,P是U上的一个概率测度。状态集合(state)12{,,,}s,iwU决策集合(action)12{,,,}mArrr。([])jPwx:具有描述[]x的对象处于状态jw的概率;()ijrw:状态为jw时采用决策ir的风险损失(量化).对具有描述[]x的对象采用决策ir的期望损失由全概率公式可得:1([])()([]).iijjjsRrxrwPwx若1([])min([])ittmRrxRrx,则对[]x实施决策.ir例:停车问题1:w会议时间不超过2小时;2:w会议时间超过2小时。假设:1()0.8,Pwx2()0.2.PwxParkonmeter(1a):不超过2小时为2美元;超过2小时为12美元.Parkinaparkinglot(2a):不超过2小时为7美元;超过2小时为7美元.于是有:1()20.8120.23Rax(美元)2()70.870.27Rax(美元)决策:Parkonmeter(1a)。1([])()([]).iijjjsRrxrwPwx医疗诊断问题设U是病人集合,w是某种疾病,状态集合{,}ww。情形1:全体病人被分为()posw:立即治疗的病人集合;()negw:不用治疗的病人集合。决策集合12{,}Arr,其中1r:()xposw;2:().rxnegw于是有12([])([])([])iiiRrxPwxPWx,1()iirw,2(),iirw1,2.i由贝叶斯最小风险决策原理可得:1():[]()Yrxposw,若12([])([])RrxRrx;2():[]()Nrxnegw,若21([])([])RrxRrx。假设11212212,,122221111222()(),则有1():[]()Yrxposw,若([])Pwx;2():[]()Nrxnegw,若([])Pwx。具体应用中,有两种方案:11():[]()Yrxposw,若([])Pwx;12():[]()Nrxnegw,若([])Pwx。21():[]()Yrxposw,若([])Pwx;22():[]()Nrxnegw,若([])Pwx。情形2:全体病人被分为()posw:立即治疗的病人集合;()negw:不用治疗的病人集合;()bndw:进一步观察病人集合。决策集合123{,,}Arrr,其中1r:()xposw;2:()rxnegw;3:()rxbndw。于是有得到期望风险:12([])([])([])iiiRrxPwxPWx,1()iirw,2(),iirw1,2,3.i由贝叶斯最小风险决策原理可得:1():[]()Yrxposw,若12([])([])RrxRrx,13([])([])RrxRrx;2():[]()Nrxnegw,若21([])([])RrxRrx,23([])([])RrxRrx;3():[]()Drxbndw,若31([])([])RrxRrx,32([])([])RrxRrx。假设113121,223212,于是有1():[]()Yrxposw,若([])Pwx,([])Pwx;2():[]()Nrxnegw,若([])Pwx,([])Pwx;3():[]()Drxbndw,若([])Pwx,([])Pwx。其中123231111232()(),122221111222()(),322221313222()()。注意到介于与之间,于是有:(1)若,则1():[]()Yrxposw,若([])Pwx;2():[]()Nrxnegw,若([])Pwx;退化为情形1.(2)若,则,从而1():[]()Yrxposw,若([])Pwx;2():[]()Nrxnegw,若([])Pwx;3():[]()Drxbndw,若([])Pwx。退化为情形1.(3)若,1():[]()Yrxposw,若([])Pwx;2():[]()Nrxnegw,若([])Pwx;3():[]()Drxbndw,若([])Pwx,([])Pwx。进一步,有1():[]()Yrxposw,若([])Pwx;2():[]()Nrxnegw,若([])Pwx;3():[]()Drxbndw,若([])Pwx。概念w的下近似与上近似定义为(概率粗糙集模型):()(){;([])}aprwposwxPwx,()()(){;([])}aprwposwbndwxPwx。AboutlossesLossesmaybeestimatedthroughtechniquessuchascost-effectiveanalysisandcost-benefitanalysis.Theestimationoflossesismuchdomaindependentandneedscarefulinvestigationbasedondomainknowledgewhenapplyingthedecision-theoreticroughsetmodel.Derivationofotherprobabilisticroughsetmodels假设:0()c:113121,223212;1()c:3111213112323222()。(1)非对称变精度粗糙集模型(G.Busse,1992)()(){;([])}aprwposwxPwx,(){;([])}aprwxPwx.(2)若12211,112231320,则1,0,0.5,此时(1,0)(){;([])1}aprwxPwx,(1,0)(){;([])0}aprwxPwx。若[]([])[]wxPwxx为包含度,则退化为Pawlak粗糙集模型(1982)。(3)若满足:2()c:3111213112323222()()()(),则1,(0.5,1]()(){;([])}aprwposwxPwx,()()(){;([])1}aprwposwbndwxPwx,退化为Ziarko变精度粗糙集模型(1993)。例如,令12214,31321,11220,则0.75,0.25,0.5。基于概率粗糙集模型的规则获取设(,{},,)SUAtCDVf是一个决策表,{;1}iUDimD,{[];}UxxUC.对于wU,()(){;([])}aprwposwxPwx,(){;([])}aprwxPwx,其中,已确定,且.11()()()imiimiposDposDaprD;11()()(()())imiimiibndDbndDaprDaprD;()()().negDUposDbndD一般情况下,(1)()()posDbndDU,()().posDbndD(2)()()()ijposDposDij一般不成立。(3)()()()ijbndDbndDij一般不成立。若0.5,则(2)成立;若0.5,则(2),(3)成立;若0,则()negD。确定性规则:若[]ixD,则[]ixD;不确定性规则:[]jxD,可信度为[][]jxDx,01.按照Pawlak粗糙集模型,恰好得到如上规则。基于Pawlak模型的正域约简保持确定性规则不变。按照概率粗糙集模型,可以将规则划分为:1Positiverule:若[]()xposD,则[]pixD,其中[]()()iixposDaprD;2Boundaryrule:若[]()xbndD,则[]bixD,若[]()()()iiixbndDaprDaprD;3Negativerule:若[]()xnegD,则对于任意1im,[]()ixnegD,[]nixD,[][]ixDx。Therulewiththeconfidenceistooweaktobemeaningful,anddoesnotsupportanyactiontowardsadecisionclass.Singleruleevaluation(1)[]([])([])[]iiixDconfidencexDPDxx;([])piconfidencexD;([])biconfidencexD。(2)[]cov([])([])iiiixDeragexDPxDD;(3)[]([])ixgeneralityxDU;(4)cost:若假设1112,则1112([])([])([])piiiRxDPDxPDx121112()([])piconfidencexD1211121112()(1),特别地,110,121时,([])1.piRxD3132([])([])(1([]).biiiRxDPDxPDxRulesetevaluation记max([])argmax{([])}iDxconfidencexD设PRS是所有Positiverule构成的集合。(1)[]()max[]()[]([])()[]xposDxposDxDxconfidencePRSxmax[]()[]([]([]))()xposDxconfidencexDxposD(2)[]()max[]([])cov()xposDxDxeragePRSUmaxmax[]()([])cov([]([]))xposDDxeragexDxU(3)()()posDgeneralityPRSU(4)cost:1112()()(1())RPRSconfidencePRSconfidencePRSmax[]()[]([]([])).()xposDxRxDxposD设BRS是所有Boundaryrule构成的集合。(1)[]()max[]()[]([])