1.1intelligence智能:字典定义:有一种学习和应用知识的能力,一种思考和推理的本领,领会并且得益于经验的能力,这些都是有道理的。如果我们想量化一些东西,我们将用到一些东西,像为了在环境中更好的完成任务使能力适应知识AI人工智能:作为一个学习和构造智能体程序,为了一个智能体结构在被给的环境中可以更好的完成任务1.4DoesthismeanthatAIisimpossible?不是,人工智能系统应避免解决一些难驾驭的问题,通常这意味着人工智能系统只能作出最好的行为,有时人工智能擅长解决一些结构化的实例,也许需要一些背景知识的帮助,人工智能系统应尝试做一些相同的事情1.11“surelycomputerscannotbeintelligent-theycandoonlywhattheirprogrammerstellthem.”Isthelatterstatementtrue,anddoesitimplytheformer?Thisdependsonyourdefinitionof“intelligent”and“tell.”Inonesensecomputersonlydowhattheprogrammerscommandthemtodo,butinanothersensewhattheprogrammersconsciouslytellsthecomputertodooftenhasverylittletodowithwhatthecomputeractuallydoes.Anyonewhohaswrittenaprogramwithanornerybugknowsthis,asdoesanyonewhohaswrittenasuccessfulmachinelearningprogram.SoinonesenseSamuel“told”thecomputer“learntoplaycheckersbetterthanIdo,andthenplaythatway,”butinanothersensehetoldthecomputer“followthislearningalgorithm”anditlearnedtoplay.Sowe’releftinthesituationwhereyoumayormaynotconsiderlearningtoplaycheckerstobessignofintelligence(oryoumaythinkthatlearningtoplayintherightwayrequiresintelligence,butnotinthisway),andyoumaythinktheintelligenceresidesintheprogrammerorinthecomputer2.1agent智能体:在一个环境中对一个对象作出反应的实体Agentfunction:智能体函数:智能体相应任何感知序列所采取的行动Agentprogram:智能体程序:与机器结构相结合,并且实现一个智能体函数的程序,在简单的设计下,程序将为一个新的感知调用,并返回一个动作。Rationality理性:智能体的一个属性,即为当前的一个感知选择一个行动,并使期望效用最大化。Autonomy自主:智能体的一个属性,是指他们的行为是由他们自己的经验决定而不是仅仅由最初的程序决定。Reflexagent反射型智能体:一个智能体的行为仅仅依赖于当前的知觉Model-basedagent基于模型的智能体:一个智能体的行动直接得自于内在模型的状态,这个状态是当前世界通用的不断更新Goal-basedagent基于目标的智能体:智能体选择它相信能明确达到目标的行动Utility-basedagent基于效用的智能体:试图最大化他们自己期望的快乐Learningagent学习智能体:基于长期的经验提高自己的行为2.2Boththeperformancemeasureandtheutilityfunctionmeasurehowwellanagentisdoing.Explainthedifferencebetweenthetwo性能度量是被用于通过外在观察度量一个智能体的成功效应函数,将历史记录变为真实数据的函数。效用函数和性能度量不同,此外,智能体可能没有效用函数,大多数都有一个性能度量2.5Foreachoffollowingagents,developaPEASdescriptionofthetaskenvironment:a.Robotsoccerplayer;b.Internetbook-shoppingagent;c.AutonomousMarsrover;d.Mathematician’stheorem-provingassistant.①机器人足球员P(绩效测试):赢得比赛,进球数/输球数。E(环境):场地,足球,两方队员。A(执行机构):用于移动和踢球的设备。S(传感器):摄像机,接触式传感器,加速器,定位传感器。②网上书店代理P:获得需要或感兴趣的书,最小化支出E:因特网。A:跟随链接,输入/提交数据场,显示给用户。S:网页、用户请求③自动火星探测车P:研究,报告地形,聚集和分析样品。E:发射舱,火星A:车轮,样品收集设备,分析设备,无线发射机。S:摄像机,接触式传感器,加速器,定位传感器,轮子编码器,无线电接收器④数学家的定理机器证明助理P:证明定理的正确性/错误性E:机器,助理A:证明机器部件。S:异或门,与门显示结果部件。2.6ForeachoftheagenttypeslistedinExercise2.5,characterizetheenvironmentaccordingtothepropertiesgiveninSection2.3,andselectasuitableagentdesign.Thefollowingexercisesallconcerntheimplementationofenvironmentandagentsforthevacuum-cleanerworld.①基于条件反射模型的代理对很多方面有处理能力,但对于战术打法,据预测,基于效用的代理亦有用。②基于目标的代理合适特定书本的要求,对于更多开放式任务,例如“寻找自己感兴趣的书”在交易是,代理必须比较各种可能购买的效率。③基于条件反映模型的代理对于水平导航,避障,路径规划,实验等有能力,但一些基于目标与效率将诶和的代理也是必须的。④对于具体证明任务,基于目标的代理是必不可少的,例如“探测任务”“证明一些关于有关抛物线的操作”这时基于效用结构是必不可少的。3.1state:一个智能体自身的情况。我们可以分为两种:worldstate真实世界的真实情况,representationalstate智能体根据根据现实世界描述应该做什么。Statespace:是一个图形,这个图形以状态为结点,以行为来连接这些结点。这些结点功能是从一个状态转向另一个状态。Searchtree:搜索树是一棵以根结点为开始状态,并且每个结点是由无论采取任何行为都可以到达的状态组成的树。Searchnode:一棵搜索树的搜索结点Goal:智能体想达到的一种状态Action:智能体可以选择做什么Successorfunction(后继函数):描述智能体的选项,在给定的状态下,它可以得到一个(行为,状态)集合,并且通过此行为可达到这个状态。Branchingfactor:一个搜索树的分支因子是可提供给智能体的行为数量3.8a:用四种颜色涂地图Initialstate:所有区域都没有被涂色Goaltest:所有区域都被上色,而且相邻区域颜色不同Successorfunction:为一个区域分配一种颜色Costfunction:路径耗损b:猴子拿香蕉initialstate:一个三尺高的猴子摘八尺高的天花板上的香蕉,房子里有两个三尺高的箱子goaltest:猴子拿到香蕉successorfunction:挪动箱子,把箱子叠起,走到箱子上摘香蕉costfuction:行动数量c:判断记录合法性:initialstate:考虑所有输入记录goaltest:考虑一个记录,并且它是非法的信息successorfunction:先运行检查一半记录,再检查一半记录costfunction:运行次数d:为12gallon,8gallon,3gallon的水壶加水initialstate:jugshavevalues[0,0,0].Goaltest:jugshavevalues[12,8,3]Successorfunction:Costfunction:倾倒次数3.8开始状态为1,后继函数为2n和2n+1a:画出部分图形1~15b:Supposethegoalstateis11.Listtheorderinwhichnodeswillbevisitedforbreadth-firstsearch,depth-limitedsearchwithlimit3,anditerativedeepeningsearch.广度优先:1,2,3,4,5,6,7,8,9,10,11深度优先:1,2,4,8,9,10,11迭代加深:1;1,2,3;1,2,4,5,3,6,7;1,2,4,8,9,5,10,11c:Wouldbidirectionalsearchbeappropriateforthisproblem?Ifso,describeindetailhowitwouldwork.双向搜索效率很高,因为在反向搜索中n的唯一继承是n/2,这有助于集中搜索d:.Whatisthebranchingfactorineachdirectionofthebidirectionalsearch?2intheforwarddirection;1inthereversedirection.e:Doestheanswerto(c)suggestareformulationoftheproblemthatwouldallowyoutosolvetheproblemofgettingfromstate1toagivengoalstatewithalmostnosearch是,从目标开始使用反向搜索找到后继数字,直到14.2Theheuristicpathalgorithmisabest-firstsearchinwhichtheobjectivefunctionisf(n)=(2-w)g(n)+wh(n).Forwhatvaluesofwisthisalgorithmguaranteedtobeoptimal?(Youmayassumethathisadmissible.)Whatkindofsearchdoesthisperformwhenw=0?Whenw=1?Whenw=2?当w=0时f(n)=2g(n),其实是成本一致搜索算法,与结点的次序无关。当w=1时f(n)=g(n)+h(n),为A*搜索算法。当w=2时f(n)=2h(n),是贪婪最佳优先搜索算法。题中假定h(n)为可接受的,对(n)=(2-w)g(n)+wh(n)故w=1时该算法执行A*搜索算法可保证最优。4.11Givethenameofthealgorithmthatresultsfromeachofthefollowingspecialcases:①k=1是的局部束搜索。K=1是的局部束搜索即为爬山搜索。②拥有一个初始状态,并对状态保留数且无限制的局部束搜索。对于k=∞的局部束搜索算法严格来讲是无意义的,其思想是:若其后每个后继均是保留的就如广度优先算法一样先将一层中的结点增加完再添加新层。从一个状态出发,该算法与广度优先算法本质上相同除了他的每一层只产生一次③T=0的模拟退火(省略终止测试)不考虑,这将会引发立即终止的事实,这一搜索算法和第一选择爬山搜索算法本质相同,因为每个向下后继均会被拒绝。④人口规模为N=1的遗传