K-不确定性-人工智能(AI)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

人工智能原理2008年春季广西大学计算机学院Dr.Ou不确定性(并非世界不完美,只是我们的知识有限)R&N:Chap.3,Sect3.6+Chap.13人工智能原理2008年春季广西大学计算机学院Dr.Ou课程到目前为止,都是基于如下“完美”假设:•世界(问题)的状态都是完全可以观察的当前状态是明确知道的•所执行的动作(决策)的描述是清楚的下一步到达的状态是可以明确预测的现在我们研究一个智能体如何去应对所谓的“非完美”信息有时候,我们还需要考虑动态的问题世界人工智能原理2008年春季广西大学计算机学院Dr.OuIntroductoryExampleGoalArobotwithimperfectsensingmustreachagoallocationamongmovingobstacles(dynamicworld)人工智能原理2008年春季广西大学计算机学院Dr.OuairbearinggastankairthrustersRobotcreatedatStanford’sARLLabtostudyissuesinrobotcontrolandplanninginno-gravityspaceenvironment人工智能原理2008年春季广西大学计算机学院Dr.OuModel,Sensing,andControlTherobotandtheobstaclesarerepresentedasdisksmovingintheplaneThepositionandvelocityofeachdiscaremeasuredbyanoverheadcameraevery1/30secxyrobotobstacles人工智能原理2008年春季广西大学计算机学院Dr.OuExperimentalRunTotalduration:40sec人工智能原理2008年春季广西大学计算机学院Dr.OuExperimentalRun人工智能原理2008年春季广西大学计算机学院Dr.Ou还可能有其他意外例如:推进器堵塞机器人没气了,又或者没电了做实验用的大桌子突然跨塌了等等...[毫无疑问的不确定性!]人工智能原理2008年春季广西大学计算机学院Dr.Ou另外一个例子:不确定性下的决策智能体相信:P(A25getsmethereontime|…)=0.04P(A90getsmethereontime|…)=0.70P(A120getsmethereontime|…)=0.95P(A1440getsmethereontime|…)=0.9999•那么到底应该选择哪一个动作呢?可能要根据误机的承受程度对比无聊候机的厌恶程度(效用)来进行决策,……人工智能原理2008年春季广西大学计算机学院Dr.Ou不确定性的来源SourcesofUncertainty人工智能原理2008年春季广西大学计算机学院Dr.Ou第一个不确定性的来源:描述世界的表示语言当前的知识表示技术下,真实问题世界的状态要远多于表示语言的表达能力范畴表示语言描述的一种状态,在真实问题世界了可能对应多个不同的状态(表达能力的限制),于是智能体无法区分这些不同的状态表示语言描述的动作也可能不够准确,智能体会无所适从ABCABCABCOn(A,B)On(B,Table)On(C,Table)Clear(A)Clear(C)人工智能原理2008年春季广西大学计算机学院Dr.Ou第二个不确定性来源:无法完美的对世界进行观察对问题世界的观察可能会是:部分的Partial,例如视觉传感器无法穿透障碍物(感知信息缺少)R1R2机器人在R1时无法看到R2是否有灰尘人工智能原理2008年春季广西大学计算机学院Dr.Ou人工智能原理2008年春季广西大学计算机学院Dr.OuObservationoftheworldcanbe:对问题世界的观察可能会是:部分的Partial,例如视觉传感器无法穿透障碍物不明确Ambiguous,例如,感知信息可能有多种解释不正确Incorrect第二个不确定性来源:无法完美的对世界进行观察人工智能原理2008年春季广西大学计算机学院Dr.Ou第三个不确定性的来源:无知,惰性,效率一个动作可能会有很长的前提清单,例如:Drive-Car:P=Have(Keys)Empty(Gas-Tank)Battery-OkIgnition-OkFlat-TiresStolen(Car)...可能由于惰性,也可能基于效率,智能体设计者往往不愿意去把这些所有的前提都表示出来于是执行动作的结果可能会是不正确的执行(动作的效果与描述不一样),也可能执行动作会得到多个不同的结果人工智能原理2008年春季广西大学计算机学院Dr.Ou不确定性的表示有许多不确定性模型我们课程考虑其中一种最重要的模型:•概率模型Probabilisticmodel:不确定性可表示成概率分布人工智能原理2008年春季广西大学计算机学院Dr.Ou信度状态信度状态beliefstate是智能体所认为的该问题世界每一种状态的可能性不确定性的概率模型中,每种状态的概率是对实际状态的可能性的量测0.20.30.40.1人工智能原理2008年春季广西大学计算机学院Dr.Ou概率意味着什么?概率很自然的可以理解为频率智能体相信如果能够重复多次同一个信度状态,则实际的状态发生的频率会遵循概率分布0.20.30.40.1Thisstatewouldoccur20%ofthetimes人工智能原理2008年春季广西大学计算机学院Dr.Ou例子考虑这样一个问题世界:牙医智能体D碰到了一位新患者D只对一件事情感兴趣:P是否有牙洞(命题Cavity)在对患者进行任何的检查(观察)之前,D的信度状态是:即意味着D认为有某一部分的人有牙洞(的疾病)CavityCavityp1-p人工智能原理2008年春季广西大学计算机学院Dr.Ou概率怎么得到?基于过去的观察,得到的频率数据系统理论的分析得到,例如:•滚动骰子,每一面的概率位1/6主观给出,例如:•如果在限速120公里的高速公路上开到时速180公里,那么被交警开罚单的概率位0.6•无差别原则Principleofindifference:如果对这些可能没有相关的知识,那么给所有的可能分配一个均等的概率人工智能原理2008年春季广西大学计算机学院Dr.Ou概率理论基本知识人工智能原理2008年春季广西大学计算机学院Dr.Ou随机变量Randomvariables•例子:离散随机变量Weather,有如下值域sunny,rain,cloudy,snow.•sunny为Weather=sunny的缩写•P(Weather=sunny)=0.72,P(Weather=rain)=0.1,etc.•可记为:P(sunny)=0.72,P(rain)=0.1,etc.•其他类型的随机变量:–布尔随机变量,值域为true,false,•例如,Cavity(布尔随机变量是离散随机变量的特例)–连续随机变量,连续的值域,例如Temp人工智能原理2008年春季广西大学计算机学院Dr.Ou命题•对随机变量赋值,即构成基本的命题:–e.g.,Weather=sunny,–Cavity=false(简写为cavity)•复杂的命题由基本命题与逻辑连接符构成–e.g.,Weather=sunnyCavity=false人工智能原理2008年春季广西大学计算机学院Dr.Ou原子事件•原子事件:–不确定世界所有状态的完整的具体描述,例如:Cavity=falseToothache=falseCavity=falseToothache=trueCavity=trueToothache=falseCavity=trueToothache=true•原子事件是互斥的,是穷尽的人工智能原理2008年春季广西大学计算机学院Dr.Ou先验概率•先验(无条件)概率–P(sunny)=0.72,P(rain)=0.1,etc.•概率分布给出了所有可能值的概率:–P(Weather)=0.72,0.1,0.08,0.1–和为1人工智能原理2008年春季广西大学计算机学院Dr.Ou联合概率•随机变量组合的概率:•表中所有项的和为•问题领域内的所有查询都可以由联合概率得到•一个命题的概率为该命题所包含的原子事件的概率的和–P(cavity)=0.1[addelementsofcavityrow]–P(toothache)=0.05[addelementsoftoothachecolumn]ToothacheToothacheCavity0.040.06Cavity0.010.89人工智能原理2008年春季广西大学计算机学院Dr.Ou条件概率•P(cavity)=0.1和P(cavitytoothache)=0.04均为先验(无条件)概率•一旦有了新的证据(之前概率未知的随机变量)例如toothache,则有了一个后验(条件)概率,例如P(cavity|toothache)•P(A|B)=P(AB)/P(B)•P(cavity|toothache)=0.04/0.05=0.8ToothacheToothacheCavity0.040.06Cavity0.010.89ABUAB人工智能原理2008年春季广西大学计算机学院Dr.Ou•条件概率的定义:P(A|B)=P(AB)/P(B)•乘法法则:P(AB)=P(A|B)P(B)=P(B|A)P(A)•也可写为如下形式:P(Weather,Cavity)=P(Weather|Cavity)P(Cavity)•链式法则可由连续应用乘法法则得到:P(X1,…,Xn)=P(X1,...,Xn-1)P(Xn|X1,...,Xn-1)=P(X1,...,Xn-2)P(Xn-1|X1,...,Xn-2)P(Xn|X1,...,Xn-1)=…=)X...,X|P(X1i1,n1i|i条件概率人工智能原理2008年春季广西大学计算机学院Dr.Ou贝叶斯法则Bayes’Rule•P(A|B)=(P(B|A)P(A))/P(B)•P(disease|symptom)=P(symptom|disease)P(disease)P(symptom)•用于由原因概率得到诊断概率:–P(Cause|Effect)=P(Effect|Cause)P(Cause)/P(Effect)•Imagine–disease=SARS,symptom=coughing–P(disease|symptom)对于SARS来说,流行区与非流行区该概率是不一样的–P(symptom|disease)相对是稳定的(由病理分析)•更容易得到P(symptom|disease)–P(symptom)如何得到呢?•使用条件(见下页)人工智能原理2008年春季广西大学计算机学院Dr.Ou条件•思想:使用条件概率代替联合概率•P(A)=P(AB)+P(AB)=P(A|B)P(B)+P(A|B)P(B)例子:P(symptom)=P(symptom|disease)P(disease)+P(symptom|disease)P(disease)•更一般的:P(Y)=zP(Y|z)P(z).

1 / 30
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功