人工智能原理2008年春季广西大学计算机学院Dr.Ou不确定性(并非世界不完美,只是我们的知识有限)R&N:Chap.3,Sect3.6+Chap.13人工智能原理2008年春季广西大学计算机学院Dr.Ou课程到目前为止,都是基于如下“完美”假设:•世界(问题)的状态都是完全可以观察的当前状态是明确知道的•所执行的动作(决策)的描述是清楚的下一步到达的状态是可以明确预测的现在我们研究一个智能体如何去应对所谓的“非完美”信息有时候,我们还需要考虑动态的问题世界人工智能原理2008年春季广西大学计算机学院Dr.OuIntroductoryExampleGoalArobotwithimperfectsensingmustreachagoallocationamongmovingobstacles(dynamicworld)人工智能原理2008年春季广西大学计算机学院Dr.OuairbearinggastankairthrustersRobotcreatedatStanford’sARLLabtostudyissuesinrobotcontrolandplanninginno-gravityspaceenvironment人工智能原理2008年春季广西大学计算机学院Dr.OuModel,Sensing,andControlTherobotandtheobstaclesarerepresentedasdisksmovingintheplaneThepositionandvelocityofeachdiscaremeasuredbyanoverheadcameraevery1/30secxyrobotobstacles人工智能原理2008年春季广西大学计算机学院Dr.OuExperimentalRunTotalduration:40sec人工智能原理2008年春季广西大学计算机学院Dr.OuExperimentalRun人工智能原理2008年春季广西大学计算机学院Dr.Ou还可能有其他意外例如:推进器堵塞机器人没气了,又或者没电了做实验用的大桌子突然跨塌了等等...[毫无疑问的不确定性!]人工智能原理2008年春季广西大学计算机学院Dr.Ou另外一个例子:不确定性下的决策智能体相信:P(A25getsmethereontime|…)=0.04P(A90getsmethereontime|…)=0.70P(A120getsmethereontime|…)=0.95P(A1440getsmethereontime|…)=0.9999•那么到底应该选择哪一个动作呢?可能要根据误机的承受程度对比无聊候机的厌恶程度(效用)来进行决策,……人工智能原理2008年春季广西大学计算机学院Dr.Ou不确定性的来源SourcesofUncertainty人工智能原理2008年春季广西大学计算机学院Dr.Ou第一个不确定性的来源:描述世界的表示语言当前的知识表示技术下,真实问题世界的状态要远多于表示语言的表达能力范畴表示语言描述的一种状态,在真实问题世界了可能对应多个不同的状态(表达能力的限制),于是智能体无法区分这些不同的状态表示语言描述的动作也可能不够准确,智能体会无所适从ABCABCABCOn(A,B)On(B,Table)On(C,Table)Clear(A)Clear(C)人工智能原理2008年春季广西大学计算机学院Dr.Ou第二个不确定性来源:无法完美的对世界进行观察对问题世界的观察可能会是:部分的Partial,例如视觉传感器无法穿透障碍物(感知信息缺少)R1R2机器人在R1时无法看到R2是否有灰尘人工智能原理2008年春季广西大学计算机学院Dr.Ou人工智能原理2008年春季广西大学计算机学院Dr.OuObservationoftheworldcanbe:对问题世界的观察可能会是:部分的Partial,例如视觉传感器无法穿透障碍物不明确Ambiguous,例如,感知信息可能有多种解释不正确Incorrect第二个不确定性来源:无法完美的对世界进行观察人工智能原理2008年春季广西大学计算机学院Dr.Ou第三个不确定性的来源:无知,惰性,效率一个动作可能会有很长的前提清单,例如:Drive-Car:P=Have(Keys)Empty(Gas-Tank)Battery-OkIgnition-OkFlat-TiresStolen(Car)...可能由于惰性,也可能基于效率,智能体设计者往往不愿意去把这些所有的前提都表示出来于是执行动作的结果可能会是不正确的执行(动作的效果与描述不一样),也可能执行动作会得到多个不同的结果人工智能原理2008年春季广西大学计算机学院Dr.Ou不确定性的表示有许多不确定性模型我们课程考虑其中一种最重要的模型:•概率模型Probabilisticmodel:不确定性可表示成概率分布人工智能原理2008年春季广西大学计算机学院Dr.Ou信度状态信度状态beliefstate是智能体所认为的该问题世界每一种状态的可能性不确定性的概率模型中,每种状态的概率是对实际状态的可能性的量测0.20.30.40.1人工智能原理2008年春季广西大学计算机学院Dr.Ou概率意味着什么?概率很自然的可以理解为频率智能体相信如果能够重复多次同一个信度状态,则实际的状态发生的频率会遵循概率分布0.20.30.40.1Thisstatewouldoccur20%ofthetimes人工智能原理2008年春季广西大学计算机学院Dr.Ou例子考虑这样一个问题世界:牙医智能体D碰到了一位新患者D只对一件事情感兴趣:P是否有牙洞(命题Cavity)在对患者进行任何的检查(观察)之前,D的信度状态是:即意味着D认为有某一部分的人有牙洞(的疾病)CavityCavityp1-p人工智能原理2008年春季广西大学计算机学院Dr.Ou概率怎么得到?基于过去的观察,得到的频率数据系统理论的分析得到,例如:•滚动骰子,每一面的概率位1/6主观给出,例如:•如果在限速120公里的高速公路上开到时速180公里,那么被交警开罚单的概率位0.6•无差别原则Principleofindifference:如果对这些可能没有相关的知识,那么给所有的可能分配一个均等的概率人工智能原理2008年春季广西大学计算机学院Dr.Ou概率理论基本知识人工智能原理2008年春季广西大学计算机学院Dr.Ou随机变量Randomvariables•例子:离散随机变量Weather,有如下值域sunny,rain,cloudy,snow.•sunny为Weather=sunny的缩写•P(Weather=sunny)=0.72,P(Weather=rain)=0.1,etc.•可记为:P(sunny)=0.72,P(rain)=0.1,etc.•其他类型的随机变量:–布尔随机变量,值域为true,false,•例如,Cavity(布尔随机变量是离散随机变量的特例)–连续随机变量,连续的值域,例如Temp人工智能原理2008年春季广西大学计算机学院Dr.Ou命题•对随机变量赋值,即构成基本的命题:–e.g.,Weather=sunny,–Cavity=false(简写为cavity)•复杂的命题由基本命题与逻辑连接符构成–e.g.,Weather=sunnyCavity=false人工智能原理2008年春季广西大学计算机学院Dr.Ou原子事件•原子事件:–不确定世界所有状态的完整的具体描述,例如:Cavity=falseToothache=falseCavity=falseToothache=trueCavity=trueToothache=falseCavity=trueToothache=true•原子事件是互斥的,是穷尽的人工智能原理2008年春季广西大学计算机学院Dr.Ou先验概率•先验(无条件)概率–P(sunny)=0.72,P(rain)=0.1,etc.•概率分布给出了所有可能值的概率:–P(Weather)=0.72,0.1,0.08,0.1–和为1人工智能原理2008年春季广西大学计算机学院Dr.Ou联合概率•随机变量组合的概率:•表中所有项的和为•问题领域内的所有查询都可以由联合概率得到•一个命题的概率为该命题所包含的原子事件的概率的和–P(cavity)=0.1[addelementsofcavityrow]–P(toothache)=0.05[addelementsoftoothachecolumn]ToothacheToothacheCavity0.040.06Cavity0.010.89人工智能原理2008年春季广西大学计算机学院Dr.Ou条件概率•P(cavity)=0.1和P(cavitytoothache)=0.04均为先验(无条件)概率•一旦有了新的证据(之前概率未知的随机变量)例如toothache,则有了一个后验(条件)概率,例如P(cavity|toothache)•P(A|B)=P(AB)/P(B)•P(cavity|toothache)=0.04/0.05=0.8ToothacheToothacheCavity0.040.06Cavity0.010.89ABUAB人工智能原理2008年春季广西大学计算机学院Dr.Ou•条件概率的定义:P(A|B)=P(AB)/P(B)•乘法法则:P(AB)=P(A|B)P(B)=P(B|A)P(A)•也可写为如下形式:P(Weather,Cavity)=P(Weather|Cavity)P(Cavity)•链式法则可由连续应用乘法法则得到:P(X1,…,Xn)=P(X1,...,Xn-1)P(Xn|X1,...,Xn-1)=P(X1,...,Xn-2)P(Xn-1|X1,...,Xn-2)P(Xn|X1,...,Xn-1)=…=)X...,X|P(X1i1,n1i|i条件概率人工智能原理2008年春季广西大学计算机学院Dr.Ou贝叶斯法则Bayes’Rule•P(A|B)=(P(B|A)P(A))/P(B)•P(disease|symptom)=P(symptom|disease)P(disease)P(symptom)•用于由原因概率得到诊断概率:–P(Cause|Effect)=P(Effect|Cause)P(Cause)/P(Effect)•Imagine–disease=SARS,symptom=coughing–P(disease|symptom)对于SARS来说,流行区与非流行区该概率是不一样的–P(symptom|disease)相对是稳定的(由病理分析)•更容易得到P(symptom|disease)–P(symptom)如何得到呢?•使用条件(见下页)人工智能原理2008年春季广西大学计算机学院Dr.Ou条件•思想:使用条件概率代替联合概率•P(A)=P(AB)+P(AB)=P(A|B)P(B)+P(A|B)P(B)例子:P(symptom)=P(symptom|disease)P(disease)+P(symptom|disease)P(disease)•更一般的:P(Y)=zP(Y|z)P(z).