BP神经网络的matlab实现学习历程

zp1539
3 ℃
2020-07-10

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

考拉BP神经网络的matlab实现学习历程（一）考拉BP神经网络的matlab实现学习历程（一）本文《考拉BP神经网络的matlab实现学习历程》系列由论坛超级版主akjuan整理和原创，我们在此表示特别感谢这两天在学习bp，总结和汇报一下，和大家一起学习。希望初入神经网络能有所收获，给新手一些帮组和启发。也希望熟悉bp的高手，多提宝贵意见和建议。学习内容总结成五个小节，具体内容如下：第一节内容：包括神经网络的基础知识，BP网络的特点，bp主要应用的场合，使用时应注意的问题。第二节内容：主要是阐述BP中几个容易混绕的概念和问题，包括什么是网络的泛化能力？过拟合是什么，怎么处理？学习速率有什么作用？神经网络的权值和阈值分别是个什么概念？用BP逼近非线性函数，如何提高训练精度？第三节内容：主要阐述使用matlab实现，为了充分利用数据，得到最优的网络训练结果，在网络建立前，应该进行的基本数据处理问题，包括：BP神经网络matlab实现的基本步骤，数据归一化问题和方法，输入训练数据的乱序排法，以及分类方法，如何查看和保存训练的结果，每次结果不一样问题。第四节内容：bp神经网络进行交通预测的Matlab例子及源代码，bp神经网络进行交通预测的Matlab程序的优化（主要是按设置误差要求，寻找最优网络过程）第五节内容：bp神经网络处理蠓虫分类问题的matlab例子及源代码。不多说，先如主题，第一节，很基础，高手见谅。什么是神经网络？神经网络是由很多神经元组成的，首先我们看一下，什么是神经元上面这个图表示的就是一个神经元，我们不管其它书上说的那些什么树突，轴突的。我用个比较粗浅的解释，可能不太全面科学，但对初学者很容易理解：1、我们把输入信号看成你在matlab中需要输入的数据，输进去神经网络后2、这些数据的每一个都会被乘个数，即权值w，然后这些东东与阀值b相加后求和得到u，3、上面只是线性变化，为了达到能处理非线性的目的，u做了个变换，变换的规则和传输函数有关可能还有人问，那么那个阀值是什么呢？简单理解就是让这些数据做了个平移，这就是神经元工作的过程。处理后的结果又作为输入，可输给别的神经元，很多这样的神经元，就组成了网络。在matlab中具体用什么算法实现这些，我们先不管，我们需要注意的是怎么使用。比如使用BP的神经网络newff()构建一个网络，这些在后面的学习将提到。BP网络的特点①网络实质上实现了一个从输入到输出的映射功能，而数学理论已证明它具有实现任何复杂非线性映射的功能。这使得它特别适合于求解内部机制复杂的问题。我们无需建立模型，或了解其内部过程，只需输入，获得输出。只要BPNN结构优秀，一般20个输入函数以下的问题都能在50000次的学习以内收敛到最低误差附近。而且理论上，一个三层的神经网络，能够以任意精度逼近给定的函数，这是非常诱人的期望；②网络能通过学习带正确答案的实例集自动提取“合理的”求解规则，即具有自学习能力；③网络具有一定的推广、概括能力。bp主要应用回归预测（可以进行拟合，数据处理分析，事物预测，控制等）、分类识别（进行类型划分，模式识别等），在后面的学习中，我都将给出实例程序。但无论那种网络，什么方法，解决问题的精确度都无法打到100%的，但并不影响其使用，因为现实中很多复杂的问题，精确的解释是毫无意义的，有意义的解析必定会损失精度。BP注意问题1、BP算法的学习速度很慢，其原因主要有：a由于BP算法本质上为梯度下降法，而它所要优化的目标函数又非常复杂，因此，必然会出现“锯齿形现象”，这使得BP算法低效；b存在麻痹现象，由于优化的目标函数很复杂，它必然会在神经元输出接近0或1的情况下，出现一些平坦区，在这些区域内，权值误差改变很小，使训练过程几乎停顿；c为了使网络执行BP算法，不能用传统的一维搜索法求每次迭代的步长，而必须把步长的更新规则预先赋予网络，这种方法将引起算法低效。2、网络训练失败的可能性较大，其原因有：a从数学角度看，BP算法为一种局部搜索的优化方法，但它要解决的问题为求解复杂非线性函数的全局极值，因此，算法很有可能陷入局部极值，使训练失败；b网络的逼近、推广能力同学习样本的典型性密切相关，而从问题中选取典型样本实例组成训练集是一个很困难的问题。3、网络结构的选择：尚无一种统一而完整的理论指导，一般只能由经验选定。为此，有人称神经网络的结构选择为一种艺术。而网络的结构直接影响网络的逼近能力及推广性质。因此，应用中如何选择合适的网络结构是一个重要的问题。4、新加入的样本要影响已学习成功的网络，而且刻画每个输入样本的特征的数目也必须相同。5、采用s型激活函数，由于输出层各神经元的理想输出值只能接近于1或0，而不能打到1或0，因此设置各训练样本的期望输出分量Tkp时，不能设置为1或0，设置0.9或0.1较为适宜。考拉BP神经网络的matlab实现学习历程（二）本文《考拉BP神经网络的matlab实现学习历程》系列由论坛超级版主akjuan整理和原创，我们在此表示特别感谢本节主要学习BP中几个容易混绕的概念和问题：什么是网络的泛化能力？过拟合是什么，怎么处理？学习速率有什么作用？神经网络的权值和阈值分别是个什么概念？用BP逼近非线性函数，如何提高训练精度？什么是网络的泛化能力？一个神经网路是否优良，与传统最小二乘之类的拟合评价不同（主要依据残差，拟合优度等），不是体现在其对已有的数据拟合能力上，而是对后来的预测能力，既泛化能力。网络的预测能力（也称泛化能力、推广能力）与训练能力（也称逼近能力、学习能力）的矛盾。一般情况下，训练能力差时，预测能力也差，并且一定程度上，随训练能力地提高，预测能力也提高。但这种趋势有一个极限，当达到此极限时，随训练能力的提高，预测能力反而下降，即出现所谓“过拟合”现象。此时，网络学习了过多的样本细节，而不能反映样本内含的规律。过拟合是什么，怎么处理？神经网络计算不能一味地追求训练误差最小，这样很容易出现“过拟合”现象，只要能够实时检测误差率的变化就可以确定最佳的训练次数，比如15000次左右的学习次数，如果你不观察，设成500000次学习，不仅需要很长时间来跑，而且最后结果肯定令人大失所望。避免过拟合的一种方法是：在数据输入中，给训练的数据分类，分为正常训练用、变量数据、测试数据，在后面节将讲到如何进行这种分类。其中变量数据，在网络训练中，起到的作用就是防止过拟合状态。学习速率有什么作用？学习速率这个参数可以控制能量函数的步幅，并且如果设为自动调整的话，可以在误差率经过快速下降后，将学习速率变慢，从而增加BPNN的稳定性。此时训练方法采用复制内容到剪贴板代码:DEnet.trainFcn='traingda';%变学习率梯度下降算法net.trainFcn='traingdx';%变学习率动量梯度下降算法DE可以定义一个变动的学习速率，如复制内容到剪贴板代码:DEp=[-1-122;0505];t=[-1-111];net=newff(p,t,3,{},'traingda');net.trainParam.lr=0.05;net.trainParam.lr_inc=1.05;net=train(net,p,t);y=sim(net,p)DE在后面的拟合例题中，我们也将用到学习速率这个参数。神经网络的权值和阈值分别是个什么概念？第一节中，我们已经谈到了权值和阀值的概念。这里我们更深入的说明一下，因为他们很重要，关系到网络最后的结果。权值和阈值是神经元之间的连接，将数据输入计算出一个输出，然后与实际输出比较，误差反传，不断调整权值和阈值。假如下面两个点属于不同的类，须设计分类器将他们分开引用:p1=[11-1]';p2=[1-1-1]';这里用单层神经元感知器，假设初始权值复制内容到剪贴板代码:DEw=[0.20.20.3]DE同时假设初始阀值复制内容到剪贴板代码:DEb=-0.3DE输出a1a2复制内容到剪贴板代码:DEa1=hardlims(w*p1+b)a2=hardlims(w*p2+b)DE如果不能分开，还须不断调整w,b用BP逼近非线性函数，如何提高训练精度(1)调整网络结构增加网络的层数可以进一步降低误差，提高精度但会使网络复杂化，从而增加网络的训练时间。精度的提高实际上也可以通过增加隐层神经元的数目来获得，其效果更容易观察和掌握，所以应优先考虑。(2)初始值选取为了使误差尽可能小，需要合理选择初始权重和偏置，如果太大就容易陷入饱和区，导致停顿。一般应选为均匀分布的小数，介于(-1，1)。(3)学习速率调整学习速率的选取很重要，大了可能导致系统不稳定，小了会导致训练周期过长、收敛慢，达不到要求的误差。一般倾向于选取较小的学习速率以保持系统稳定，通过观察误差下降曲线来判断。下降较快说明学习率比较合适，若有较大振荡则说明学习率偏大。同时，由于网络规模大小的不同，学习率选择应当针对其进行调整。采用变学习速率的方案，令学习速率随学习进展而逐步减少，可收到良好的效果。(4)期望误差期望误差当然希望越小越好，但是也要有合适值。考拉BP神经网络的matlab实现学习历程（三）本文《考拉BP神经网络的matlab实现学习历程》系列由论坛超级版主akjuan整理和原创，我们在此表示特别感谢本节主要学习使用matlab实现bp算法的一般步骤和过程。为了充分利用数据，得到最优的网络训练结果，在网络建立前应该进行的基本数据处理问题，包括：(1)BP神经网络matlab实现的基本步骤(2)数据归一化问题和方法(3)输入训练数据的乱序排法，以及分类方法(4)如何查看和保存训练的结果(5)每次结果不一样问题。用matlab实现bp，其实很简单，按下面步骤基本可以了BP神经网络matlab实现的基本步骤1、数据归一化2、数据分类，主要包括打乱数据顺序，抽取正常训练用数据、变量数据、测试数据3、建立神经网络，包括设置多少层网络（一般3层以内既可以，每层的节点数（具体节点数，尚无科学的模型和公式方法确定，可采用试凑法，但输出层的节点数应和需要输出的量个数相等），设置隐含层的传输函数等。关于网络具体建立使用方法，在后几节的例子中将会说到。4、指定训练参数进行训练，这步非常重要，在例子中，将详细进行说明5、完成训练后，就可以调用训练结果，输入测试数据，进行测试6、数据进行反归一化7、误差分析、结果预测或分类，作图等数据归一化问题归一化的意义：首先说一下，在工程应用领域中，应用BP网络的好坏最关键的仍然是输入特征选择和训练样本集的准备，若样本集代表性差、矛盾样本多、数据归一化存在问题，那么，使用多复杂的综合算法、多精致的网络结构，建立起来的模型预测效果不会多好。若想取得实际有价值的应用效果，从最基础的数据整理工作做起吧，会少走弯路的。归一化是为了加快训练网络的收敛性，具体做法是：1把数变为（0，1）之间的小数主要是为了数据处理方便提出来的，把数据映射到0～1范围之内处理，更加便捷快速，应该归到数字信号处理范畴之内。2把有量纲表达式变为无量纲表达式归一化是一种简化计算的方式，即将有量纲的表达式，经过变换，化为无量纲的表达式，成为纯量比如，复数阻抗可以归一化书写：Z=R+jωL=R(1+jωL/R)，复数部分变成了纯数量了，没有量纲。另外，微波之中也就是电路分析、信号系统、电磁波传输等，有很多运算都可以如此处理，既保证了运算的便捷，又能凸现出物理量的本质含义。神经网络归一化方法：由于采集的各数据单位不一致，因而须对数据进行[-1,1]归一化处理，归一化方法主要有如下几种，供大家参考：1、线性函数转换，表达式如下：复制内容到剪贴板代码:DEy=(x-MinValue)/(MaxValue-MinValue)DE说明：x、y分别为转换前、后的值，MaxValue、MinValue分别为样本的最大值和最小值。2、对数函数转换，表达式如下：复制内容到剪贴板代码:DEy=log10(x)DE说明：以10为底的对数函数转换。3、反余切函数转换，表达式如下：复制内容到剪贴板代码: