卷积神经网络人工智能什么是卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是深度度学习的代表算法之一。卷积神经网络具有表征学习能力,能够按其阶层结构对输入信息进行平移不变分类,因此也被称为“平移不变人工神经网络”。前馈神经网络:每个神经元只与前一层的神经元相连。接收前一层的输出,并输出给下一层.各层间没有反馈。表征学习:特征学习,将原始数据转换成为能够被机器学习来有效开发的一种形式。它避免了手动提取特征的麻烦,允许计算机学习使用特征的同时,也学习如何提取特征:学习如何学习。特征学习:如果人们选择图像中的连续范围作为池化区域,并且只是池化相同(重复)的隐藏单元产生的特征,那么,这些池化单元就具有平移不变性。这就意味着即使图像经历了一个小的平移之后,依然会产生相同的(池化的)特征。发展历程1959年发现动物视觉原理提出人工神经感知机1980年1990年提出CNN的原始版本1998年提出基于梯度学习的LeNet-52012年提出更有深度结果的AlexNet2013年ZFNet2014年VGGNet、GoogLeNet至今ResNet等动物视觉原理1958年,DavidHubel和TorstenWiesel在JohnHopkinsUniversity,研究瞳孔区域与大脑皮层神经元的对应关系。他们在猫的后脑头骨上,开了一个3毫米的小洞,向洞里插入电极,测量神经元的活跃程度。发现方向选择性细胞。当瞳孔发现了眼前的物体的边缘,而且这个边缘指向某个方向时,这种神经元细胞就会活跃。这个发现激发了人们对于神经系统的进一步思考。神经-中枢大脑的工作过程,或许是一个不断迭代、不断抽象的过程。神经感知机S型细胞用于提取局部特征。C型细胞对S型细胞的输入进行一些处理,如图像较小的位移或轻微变形等。图像特征复杂图形,往往由一些基本结构组成。一个图可以通过用64种正交的edges(可以理解成正交的基本结构)来线性表示。比如样例中的小图片可以用1-64个edges中的三个按照0.8,0.3,0.5的权重调和而成。而其他基本edge没有贡献,因此均为0。举个例子首先,底层神经元感知像素(pixeis),第二层V2在V1的基础上抽象出了edges,V3继续在V2基础上抽象,直到最后一层组合出了具体的图像。总结在此处添加总结。另外人们还发现,不光图像有这样的特性,声音也有。人们经过研究从未标注的声音中发现了20种基本的声音结构。卷积神经网络的结构卷积神经网络是一个多层的神经网络,每层由多个二维平面(特征图)组成,每个平面通过一个卷积滤波器提取一个特征。而每个平面由多个独立神经元组成。组成:输入层、卷积层、池化层、全连接层、输出层。上图第一层为输入层,第二层为卷积层,第三层为池化层,第四层为卷积层,第五层为池化层,第六层为全连接层,最后为输出层。工作过程输入图像通过和三个可训练的滤波器和可加偏置进行卷积,滤波过程如图一,卷积后在C1层产生三个特征映射图,然后特征映射图中每组的四个像素再进行求和,加权值,加偏置,通过一个Sigmoid函数得到三个S2层的特征映射图。这些映射图再进过滤波得到C3层。这个层级结构再和S2一样产生S4。最终,这些像素值被光栅化,并连接成一个向量输入到传统的神经网络,得到输出。卷积层输入层就是读取图像,这里不多说。卷积层:通过卷积核与图像卷积,提取图像特征。另外卷积核的参数是可以训练的。比如现在有一个3X3的卷积核:我们用它来卷积图下面的图像-1-1-1-18-1-1-1-1第一张是原图,第二张是卷积结果。通过观察我们发现,通过卷积核的卷积处理,图像的高频特征被提取出来了。池化层池化层,就是把每四个单元里的值用一个值来代替。池化分为很多种,最常见的是最大值池化和平均池化加入有四个单元:如果是最大池化,则为9,如果是平均池化则为(5+4+7+9)/4。5479特征提取后传给,池化层(pooling)采样后,数据量就会变小。池化层得到数据后又和下一次卷积层卷积,进一步提取特征。经过多次提取采样后与传给全连接层全,连接层处理后,输出结果。全连接层如上图,全连接层的每一个神经元都和前一层相连,然后其通过分类器,根据全连接得到的数据对图像进行分类。根据分类输出分类结果。回顾卷积神经网络整个过程Conv——卷积relu——线性整流函数pool——池化层FC——全连接层LeNet-5用于识别手写体字符的算法。AlexNetAlexNet网络2012年的ImageNet大规模视觉挑战赛,并以高出第二名10%的性能优势取得了冠军。被称为深度学习在图像分类任务方面的标杆。SENetTheend!