MachineLearning1ZHU,XiaoyanTsinghuaUniversityContentIntroductionofMLInductivelearningExample-basedlearningExplanation-basedlearningDecisionTreeMDL2Introduction3机器学习—概述参考书:《MachineLearning》,TomM.Mitchell,1997,(机械出版社)什么是机器学习?Simon(1983):学习就是系统中的变化,这种变化使系统比以前更有效地去做同样的工作。Minsky(1985):学习是在我们头脑中(心里内部)进行有用的变化。学习是一种具有多侧面的现象。学习的过程有:获取新的陈述性知识、通过教育或实践发展机械技能和认知能力、将新知识组织成为通用化和有效的表达形式、借助观察和实验发现新的事实和新的理论。4LearningLearningisessentialforunknownenvironments,i.e.,whendesignerlacksomniscienceLearningisusefulasasystemconstructionmethod,i.e.,exposetheagenttorealityratherthantryingtowriteitdownLearningmodifiestheagent'sdecisionmechanismstoimproveperformance5Learningagents6LearningelementDesignofalearningelementisaffectedbyWhichcomponentsoftheperformanceelementaretobelearnedWhatfeedbackisavailabletolearnthesecomponentsWhatrepresentationisusedforthecomponentsTypeoffeedback:Supervisedlearning:correctanswersforeachexampleUnsupervisedlearning:correctanswersnotgivenReinforcementlearning:occasionalrewards7Introduction(cont.)基本形式知识获取和技能求精。学习的本质就是获取新的知识。包括物理系统和行为的描述和建模,构造客观现实的表示。——知识获取通过实践逐渐改造机制和认知技能。例:骑自行车。这些技能包括意识的或机制的协调。这种改进又是通过反复实践和从失败的行为中纠正偏差来进行的。——技能求精8Introduction(cont.)为什么要研究机器学习?人工智能主要是为了研究人的智能,模仿其机理将其应用于工程的科学。在这个过程中必然会问道:“人类怎样做才能获取这种特殊技能(或知识)?”。.......….9Introduction(cont.)为什么要研究机器学习?.......….当前人工智能研究的主要障碍和发展方向之一就是机器学习。包括学习的计算理论和构造学习系统。现在的人工智能系统还完全没有或仅有很有限的学习能力。系统中的知识由人工编程送入系统,知识中的错误也不能自动改正。也就是说,现有的大多数人工智能是演绎的、没有归纳推理,因而不能自动获取和生成知识。.......….10Introduction(cont.)为什么要研究机器学习?………..未来的计算机将有自动获取知识的能力,它们直接由书本学习,通过与人谈话学习,通过观察学习。它们通过实践自我完善,克服人的存储少、效率低、注意力分散、难以传送所获取的知识等局限性。一台计算机获取的知识很容易复制给任何其它机器。11Limitation实现的困难:预测难:学习后知识库发生了什么变化,系统功能的变化的预测。归纳推理:现有的归纳推理只保证假,不保证真(演绎推理保真)。而且,归纳的结论是无限多的,其中相当多是假的,给生成的知识带来不可靠性。机器目前很难观察什么重要、什么有意义。12History发展历史神经系统模型和决策理论50年代开始。其特点是对开始于无初始结构和面向作业知识的通用学习系统感兴趣。包括构造多种具有随机或部分随机的初始结构的基于神经模型的机器。这些系统一般称为神经网络或自组织系统。由于当时计算机技术状态,多停留在理论和硬件上。这些元件类似于神经元,他们实现简单的逻辑功能。………13History(cont.)发展历史神经系统模型和决策理论………1965年左右,神经网络经验模式导致了模式识别这一新学科以及机器学习的决策理论方法。这种方法中学习就是从给定的一组经过选择的例子中获得判断函数,有线性的、多项式的、或相关的形式。当时,Samuel(1959-1963)的跳棋程序是最著名的成功的学习系统之一。达到了跳棋大师的水平。14History(cont.)符号概念获取1975年左右提出的。这类学习过程通过分析一些概念的正例和反例构造出这些概念的符号表示。表示的形式一般是逻辑表达式、决策树、产生式规则或语义网络。代表有Winston的ARCH。15History(cont.)知识加强和论域专用学习此方法是70年代中期开始,沿着符号主义路线进行的。在原有基础上逐步加强、重于专业的专用性。强调使用面向任务的知识和它对学习过程的引导作用。系统包括预先确定的概念、知识结构、论域约束、启发式规则和论域有关的变换。系统在开始并不具有所有的属性或概念,在学习过程中系统应得到一些新的属性或概念。没有绝对的学习方法。许多系统体现出上述途径的组合。16History(cont.)机器学习进入新阶段的重要表现:(近十年)(1)机器学习已成为新的边缘科学并在高校形成一门课程。它综合应用心理学、生物学和神经生理学以及数学、自动化和计算机科学形成机器学习理论基础。17History(cont.)机器学习进入新阶段的重要表现:(近十年)(2)结合各种学习方法,取长补短的多种形式的集成学习系统的研究正在兴起。特别是连接学习,符号学习的耦合可以更好地解决连续性信号处理中知识与技能的获取与求精问题而受到重视。18History(cont.)机器学习进入新阶段的重要表现:(近十年)(3)机器学习与人工智能各种基础问题的统一性观点正在形成。例如:学习与问题求解结合进行,知识表达便于学习的观点产生了通用智能系统的组块学习。类比学习与问题求解结合的基于案例学习已成为经验学习的重要方向。19History(cont.)机器学习进入新阶段的重要表现:(近十年)(4)各种学习方法的应用范围不断扩大,一部分已形成商品。归纳学习的知识获取工具已在诊断分类性专家系统中广泛应用。连接学习在声图文识别中占优势。分析学习用于设计综合性专家系统。遗传算法与强化学习在工程控制中有较好的应用前景。与符号系统耦合的神经网络连接学习将在企业的智能管理与智能机器人运动规划中发挥作用。20History(cont.)机器学习进入新阶段的重要表现:(近十年)(5)统计机器学习方法越来越占有重要的地位。与网络图模型相关的系列算法:HMM,逻辑马尔科夫网,CRF等等在语音识别、自然语言处理等领域得到了很好的应用。一系列基于统计概率的产生是学习建模的理论算法不断产生:LSA,pLAS,LDA等等。近年来作为神经网络模型的最新进展之一DeepLearning算法风靡一时,在语音识别、图像识别的实际应用中产生了划时代的作用。21History(cont.)机器学习进入新阶段的重要表现:(近十年)(6)与机器学习有关的学术活动空前活跃。新的概念不断产生半监督学习ActivelearningTransferlearning。。。。。。22Models机器学习模型学习是建立理论、形成假设和进行归纳推理的过程。整个过程包括:信息的存储、知识的处理两部分环境学习环节知识库执行环节23Goal研究目的希望得到通用的算法研究了解学习知识的模型、认知模型解决实际问题的知识库与系统,达到工程目标研究特点不可预测性24InductiveLearning25InductiveLearningTheavailableofpriorknowledgeMosthumanlearningtakesplaceinthecontextofagooddealofbackgroundknowledgePureinductiveinferenceis:Givenacollectionofexamplesof(x,f(x)),returnafunctionhthatapproximatesf,i.e.h≈fhiscalledahypothesisFundamentalproblemofinductionAgoodhypothesiswillgeneralizewelltopredictunseenexamplescorrectly.26InductiveLearning(Con.)Howtochoosefromamongmultipleconsistenthypothesesfromhypothesisspace?Choosesimplerone,sincehypothesesthatarenosimplerthanthedatathemselvesarefailingtoextractanypatternfromthedataOckham’srazor:thesimplestone27InductiveLearning(Con.)SystemriskErrorTrainingerrorbytrainingsetGeneralizationerrorbytestsetRiskminimizationEmpiricalrisk(trainingerror)minimizationStructuralriskminimization28InductiveLearning(Con.)Thepossibilityoffindingasimple,consistenthypothesisdependsstronglyonthehypothesisspacechosenItisrealizableifthehypothesisspacecontainsthetruefunction;otherwise,itisunrealizable.Unfortunately,wecannotalwaystellwhetheragivenlearningproblemisrealizable,becausethetruefunctionisnotknown。WhatwecandoisUsepriorknowledgetoderiveahypothesisspace;UselargesthypothesisspaceH;LetHbetheclassofallTuringmachines.Afterall,everycomputablefunctioncanberepresentedbysomeTuringmachines,andthatisthebestwecando;Thencomplexityproblem.Getthetradeoffbetweentheexpressivenessofahypothesisspaceandthecomplexityoffindingsimple,consistenthypothesiswithinthespace.29Examplebasedlearning30实例学习概述50年代兴起的实例学习是归纳学习的一种。目前实例学习在某些系统中的应用已成为机器学习走向实践的先导。环境提供给系统一些特殊的实例,这些实例事先由施教者划分为正例和反例。实例学习系统由此进行归纳推理得到一般规则。环境提供给学习环节的正例和反例是低水平的信息,这是特殊情况下执行环节的行为。学习环节归纳出的规则是高水平的信息,可以在一般情况下用这些