神经网络与深度学习讲义20151211

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

DRAFT编译时间:2015-12-1122:00《神经网络与深度学习》讲义NotesonArtificialNeuralNetworksandDeepLearning邱锡鹏xpqiu@fudan.edu.cn2015年12月11日DRAFT编译时间:2015-12-1122:00目录第一章绪论11.1总结和深入阅读.................................2第二章数学基础32.1向量.......................................32.1.1向量的模................................32.1.2向量的范数...............................32.2矩阵.......................................42.3矩阵的基本运算.................................42.3.1常见的矩阵...............................52.3.2矩阵的范数...............................52.4导数.......................................62.4.1常见的向量导数............................62.4.2导数法则................................62.5常用函数....................................72.5.1logistic函数...............................72.5.2softmax函数..............................72.6总结和深入阅读.................................9第三章机器学习概述103.1机器学习概述..................................10DRAFT编译时间:2015-12-1122:00II目录3.1.1损失函数................................123.1.2机器学习算法的类型..........................133.1.3机器学习中的一些概念.........................143.1.4参数学习算法..............................163.2线性回归....................................183.3线性分类....................................203.3.1两类分类................................203.3.2多类线性分类..............................223.4评价方法....................................263.5总结和深入阅读.................................27第四章感知器284.1两类感知器...................................294.1.1感知器学习算法............................294.1.2收敛性证明...............................304.2多类感知器...................................324.2.1多类感知器的收敛性..........................344.3投票感知器...................................354.4总结和深入阅读.................................36第五章人工神经网络385.1神经元......................................395.1.1激活函数................................395.2前馈神经网络..................................415.2.1前馈计算................................415.3反向传播算法..................................425.4梯度消失问题..................................455.5训练方法....................................465.6经验.......................................46邱锡鹏:《神经网络与深度学习》讲义编译时间:2015-12-1122:00目录III5.7总结和深入阅读.................................47第六章卷积神经网络486.1卷积.......................................486.1.1一维场合................................486.1.2两维场合................................496.2卷积层:用卷积来代替全连接.........................496.3子采样层....................................526.4卷积神经网络示例:LeNet-5..........................536.5梯度计算....................................546.5.1卷积层的梯度..............................556.5.2子采样层的梯度............................566.6总结和深入阅读.................................56第七章循环神经网络577.1简单循环网络..................................587.1.1梯度...................................597.1.2改进方案................................607.2长短时记忆神经网络:LSTM.........................617.3门限循环单元:GRU..............................617.4总结和深入阅读.................................62参考文献63索引65邱锡鹏:《神经网络与深度学习》讲义编译时间:2015-12-1122:00第一章绪论一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答。如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么就可以认为这个计算机是智能的。—AlanTuring[1950],《机器能思维吗?》让机器具备智能是人们长期追求的目标,但是关于智能的定义也十分模糊。AlanTur-ing在1950年提出了著名的图灵测试:“一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答。如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么就可以认为这个计算机是智能的”。要通过真正地通过图灵测试,计算机必须具备理解语言、学习、记忆、推理、决策等能力。这也延伸出很多不同的学科,比如机器感知(计算机视觉、自然语言处理),学习(模式识别、机器学习、增强学习),记忆(知识表示)、决策(规划、数据挖掘)等。所有这些分支学科都可以看成是人工智能(ArtificialIntelligence,AI)的研究范畴。其中,机器学习(MachineLearning,ML)因其在很多领域的出色表现逐渐成为热门学科。机器学习的主要目的是设计和分析一些学习算法,让计算机从数据中获得一些决策函数,从而可以帮助人们解决一些特定任务,提高效率。对于人工智能来说,机器学习从一开始就是一个重要的研究方向,并涉及了概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。人工神经网络(ArtificialNeuralNetwork,ANN),也简称神经网络,是众多机器学习算法中比较接近生物神经网络特性的数学模型。人工神经网络通过模拟生物神经网络(大脑)的结构和功能,由大量的节点(或称“神经元”,或“单元”)和之间相互联接构成,可以用来对数据之间的复杂关系进行建模。Rosenblatt[1958]最早提出可以模拟人类感知能力的数学模型,并称之为感知器(Per-ceptron),并提出了一种接近于人类学习过程(迭代、试错)的学习算法。但感知器因其DRAFT编译时间:2015-12-1122:002第一章绪论结构过于简单,不能解决简单的异或(XOR)等线性不可分问题,造成了人工神经领域发展的长年停滞及低潮。直到1980年以后,GeoffreyHinton、YannLeCun等人将反向传播算法(Backpropagation,BP)引入到多层感知器[WilliamsandHinton,1986],人工神经网络才又重新引起人们的注意,并开始成为新的研究热点。但是,2000年以后,因为当时计算机的计算能力不足以支持训练大规模的神经网络,并且随着支持向量机(SupportVectorMachines,SVM)等方法的兴起,人工神经网络又一次陷入低潮。直到2006年,HintonandSalakhutdinov[2006]发现多层前馈神经网络可以先通过逐层预训练,再用反向传播算法进行精调的方式进行有效学习。并且近年来计算机计算能力的提高(大规模并行计算,GPU),计算机已经可以训练大规模的人工神经网络。随着深度的人工神经网络在语音识别[Hintonetal.,2012]和图像分类[Krizhevskyetal.,2012]等任务上的巨大成功,越来越多的人开始关注这一个“崭新”的研究领域:深度学习。目前,深度学习技术在学术界和工业界取得了广泛的成功,并逐渐受到了高度重视。深度学习(DeepLearning,DL)是从机器学习中的人工神经网络发展出来的新领域。早期所谓的“深度”是指超过一层的神经网络。但随着深度学习的快速发展,其内涵已经超出了传统的多层神经网络,甚至机器学习的范畴,逐渐朝着人工智能的方向快速发展。本书主要介绍人工神经网络与深度学习中的基础知识、主要模型(卷积神经网络、递归神经网络等)以及在计算机视觉、自然语言处理等领域的应用。1.1总结和深入阅读若希望全面了解人工神经网络和深度学习的知识,可以参考如下材料:1.IanGoodfellow,AaronCourville,andYoshuaBengio.Deeplearning.BookinpreparationforMITPress,2015.URL⃝inMachineLearning,2(1):1–127,2009另外,网站也给出很好的教程,比如等。邱锡鹏:《神经网络与深度学习》讲义编译时间:2015-12-1122:00第二章数学基础2.1向量在线性代数中,标量(Scalar)是一个实数,而向量(Vector)是指n个实数组成的有序数组,称为n维向量。

1 / 70
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功