人工智能是否终将超越人类智能

2455255
2 ℃
2020-03-03

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

龙源期刊网人工智能是否终将超越人类智能作者：龚怡宏来源：《人民论坛·学术前沿》2016年第07期【摘要】谷歌公司的AlphaGo与韩国棋圣李世石的人机围棋巅峰对决，以AlphaGo4比1的压倒性胜利落下帷幕。这个比赛结果不仅向全世界展示了人工智能的强大实力与巨大应用潜力，也在人类社会引起了不小的恐慌和忧虑。人们开始认真思考：人工智能将会给人类社会带来哪些进步及挑战？机器智能最终会否超越人类智能？要想回答这些问题，我们首先需要了解人工智能的本质及其基本原理。本文首先对人工智能领域里最受世人瞩目的研究成果——深度学习卷积神经网络——做一个简单描述，进而围绕机器学习的本质及其基本原理进行探讨。接下来，通过对人脑认知机理最新研究成果的概括介绍，揭示机器智能与人类智能的本质差异，比较两种智能的优劣。通过优劣势比较，试图找出针对上述问题的答案。关键词】人工智能AlphaGo神经突触机器学习模式识别【中图分类号】TP18【文献标识码】A【DOI】10.16619/j.cnki.rmltxsqy.2016.07.0022016年3月9～15日，谷歌公司研发的AlphaGo围棋软件与韩国棋圣李世石进行了五场人机对决，AlphaGo以4比1的比分取得了压倒性的胜利。这个比赛结果不仅震惊了整个围棋界，也让人工智能领域的许多专家学者跌破眼镜，更让人工智能走出象牙塔，成为许多普通百姓茶余饭后的热点话题。这场人机围棋巅峰对决不仅向全世界展示了人工智能的强大实力与巨大应用潜力，也在人类社会引起了不小的恐慌和忧虑。人们开始认真思考以下这些问题：机器智能最终会超越人类智能吗？人工智能将会如何改变人类社会？未来的智能机器会像电影《终结者》里所描述的那样试图主宰人类、甚至消灭人类吗？要想回答这些问题，我们首先需要了解人工智能的本质及其基本原理，进而讨论其发展的规律和前景。当前，人工智能领域最前沿的分支学科当属机器学习分支。本文首先对机器学习分支中最受世人瞩目的研究成果——深度学习卷积神经网络——做一个简单综述，进而围绕机器学习的本质及其基本原理进行探讨。接下来，通过对人脑认知机理最新研究成果的概括介绍，揭示机器智能与人类智能的本质差异，比较两种智能的优势与劣势。通过机器智能与人类智能的优劣势比较，试图找出上述几个问题的答案。深度学习卷积神经网络过去几年里，深度学习卷积神经网络所取得的成就足以使它成为人工智能王冠上最光彩夺目的明珠。基于深度学习卷积神经网络的语音识别系统把语音识别的精度提高到了产品级的精度，从而为人类与计算机及各种智能终端之间提供了一种崭新的、更为便捷的交互方式。将深度学习卷积神经网络应用于图像内容及人脸的识别，科学家们取得了能够与人类视觉系统相媲龙源期刊网美的识别精度。战胜韩国棋圣李世石的谷歌围棋软件AlphaGo能够取得如此辉煌的战绩，深度学习卷积神经网络也发挥了关键性的作用。接下来，我们对深度学习卷积神经网络的起源及其原理做一个简单介绍。脑神经科学领域的大量研究表明，人脑由大约1011个神经细胞及1015个神经突触组成，这些神经细胞及其突触构成一个庞大的生物神经网络。每个神经细胞通过突触与其它神经细胞进行连接与信息传递。当通过突触所接收到的信号强度超过某个阈值时，神经细胞便会进入激活状态，并通过突触向上层神经细胞发送激活信号。人类所有与意识及智能有关的活动，都是通过特定区域神经细胞之间的相互激活与协同工作而实现的。早于1943年，美国心理学家W.S.McCulloch和数学家W.A.Pitts就在他们的论文中提出了生物神经元的计算模型（简称M-P①模型），为后续人工神经网络的研究奠定了基础。M-P模型的结构如图1（a）所示，它包含n个带有权重的输入，一个输出，一个偏置b和一个激活函数组成。n个输入代表来自下层n个神经突触的信息，每个权重W）代表对应突触的连接强度，激活函数通常采用拥有S-型曲线的sigmoid函数（参见图1（b）），用来模拟神经细胞的激活模式。龙源期刊网神经元的全连接网络。如图2所示，此类网络的特点是，属于同一层的神经元之间不存在连接；当前层的某个神经元与上一层的所有神经元都有连接。然而，人们很快发现，这种全连接神经网络在应用于各种识别任务时不但识别精度不高，而且还不容易训练。当神经网络的层数超过4层时，用传统的反向传递算法（BackPropagation）训练已经无法收敛。龙源期刊网年，日本学者福岛教授基于Hubel-Wiese的视觉认知模型提出了卷积神经网络计算模型（ConvolutionNeuralNetwork，简称CNN）。早在1962年，Hubel和Wiesel通过对猫视觉皮层细胞的深入研究，提出高级动物视觉神经网络由简单细胞和复杂细胞构成（如图3所龙源期刊网示）。神经网络底层的简单细胞的感受野只对应视网膜的某个特定区域，并只对该区域中特定方向的边界线产生反应。复杂细胞通过对具有特定取向的简单细胞进行聚类，拥有较大感受野，并获得具有一定不变性的特征。上层简单细胞对共生概率较高的复杂细胞进行聚类，产生更为复杂的边界特征。通过简单细胞和复杂细胞的逐层交替出现，视觉神经网络实现了提取高度抽象性及不变性图像特征的能力。卷积神经网络可以看作是实现上述Hubel-Wiesel视觉认知模型的第一个网络计算模型。如图4所示，卷积神经网络是由卷积层（ConvolutionLayer）与降采样层（SamplingLayer）交替出现的多层神经网络，每层由多个将神经元排列成二维平面的子层组成（称为特征图，FeatureMap）。每个卷积层和上层降采样层通常拥有相同数量的特征图。构成卷积层x的每个神经元负责对输入图像（如果x=1）或者x-1降采样层的特征图的特定小区域施行卷积运算，而降采样层y的每个神经元则负责对y-1卷积层的对应特征图的特定小区域进行MaxPooling（只保留该区域神经元的最大输出值）。卷积运算中所使用的卷积核系数都是通过学习训练自动获取的。卷积层中属于同一个特征图的神经元都共享一个卷积核，负责学习和提取同一种图像特征，对应Hubel-Wiesel模型中某种特定取向的简单细胞。卷积层中不同的特征图负责学习和提取不同的图像特征，对应Hubel-Wiesel模型中不同类型的简单细胞。而降采样层y中神经元的MaxPooling操作等同于Hubel-Wiesel模型中复杂细胞对同类型简单细胞的聚类，是对人脑视觉皮层复杂细胞的简化模拟。上世纪90年代初期，贝尔实验室的YannLeCun等人成功应用卷积神经网络实现了高精度手写数字识别算法，所提出的系列LeNet，都达到商用级识别精度，被当时美国邮政局和许多大银行用来识别信封上的手写邮政编码及支票上面的手写数字。然而，受制于90年代计算机有限的内存和弱小的运算能力，LeNet网络采用了较浅的网络结构，每层使用的特征图数目也很少。尽管它在小规模图像识别问题上取得了较好的效果，但与传统机器学习算法（如SVM，AdaBoost等）相比，优势并不十分明显。此外，由于卷积神经网络拥有很高的自由度，设计出一款性能优异的网络需要灵感并配合丰富的经验积累，是一项极具挑战性的工作。因此卷积神经网络在被提出后的很长一段时间里并未得到足够的重视和广泛的应用。2012年，加拿大多伦多大学GeoffreyHinton教授的团队提出了一个规模比传统CNN大许多的深度卷积神经网络（简称AlexNet）。该网络拥有5个卷积与降采样层、3个全连接层，每个卷积与降采样层拥有96384个特征图，网络参数达到6000多万个。利用AlexNet，Hinton团队在国际上最具影响力的图像内容分类比赛（2012ImageNetILSVRC）中取得了压倒性胜利，将1000类图像的Top-5分类错误率降低到15.315%。在这次比赛中，获得第二、三、四名的团队均采用了传统机器学习算法。三个团队的Top-5图像分类错误率分别是26.17%、26.98%和27.06%，相差不到1个百分点，而他们的成绩和第一名相比却低了超过10个百分点，差距十分明显。当前，深度卷积神经网络（DeepCNN）相对传统机器学习算法的优势还在不断扩大，传统学习方法在多个领域已经完全无法与DeepCNN相抗衡。机器学习算法的基本原理及其本质龙源期刊网在几千年的科学探索与研究中，科学家们提出了许多描述自然界及人类社会中各种事物与现象的数学模型。这些模型主要可以被归纳为以下三大类别。归纳模型：由少数几个参数（变量）构成，每个变量都具有明确的物理意义。这类模型能够真正揭示被描述对象的本质及规律，许多数学和物理定律都是典型的归纳模型。预测模型：用一个拥有大量参数的万能函数来拟合用户所提供的训练样本。万能函数的参数一般不具备任何物理意义，模型本身往往只能用来模拟或预测某个特定事物或现象，并不能揭示被描述事物或现象的本质及内在规律。当代的大多数机器学习算法都是构建于预测模型之上的。例如，单隐层全连接神经网络所使用的数学模型是：上式中，x代表神经网络的输入，代表神经网络的参数集，M是隐层神经元的个数。这个数学模型如同一个橡皮泥，可以通过变换它的参数集被塑造成任何形状。给定一个训练样本集，其中分别代表训练样本i以及人工赋予该样本的标签（标签表示样本的类别或某种属性），通过利用T进行训练，我们就能够得到一个优化的参数集，使神经网络能够很好地拟合训练样本集T。当新的未知样本x出现时，我们就能够利用训练好的神经网络预测出它的标签y。显而易见，神经网络的参数集规模与神经元的数目及输入x的维数成正比，所有参数没有任何物理意义，模型本身也不具备揭示被描述对象的本质及内在规律的能力。直推模型：没有明确的数学函数，利用所采集的大数据预测特定输入的标签。此类模型认为针对某个事物或现象所采集的大数据就是对该事物或现象的客观描述。大数据的规模越大，对事物或现象的描述就越全面和准确。当新的未知样本x出现时，我们可以在大数据中找到x的K近邻，根据K近邻的标签或属性来决定x的标签或属性。显而易见，由于不需要定义明确的数学模型，与其它模型相比，直推模型最简单直接，但因为依靠大数据来决定未知样本的标签，直推模型往往需要较高的计算量及使用成本。同样，直推模型也不能被用来揭示事物或现象的本质及内在规律。应当指出，随着互联网用户数量的不断增长以及互联网技术的快速进步，利用互联网获取内容或用户大数据变得越来越简单廉价，利用直推模型来预测某个事物或现象也变得越来越普及。例如，许多互联网搜索引擎利用每个网页的用户点击率来改进搜索网页的排序精度，就是直推模型在互联网内容搜索领域的一个成功应用。综上所述，机器学习算法的本质就是选择一个万能函数建立预测模型。利用用户提供的训练样本对模型进行训练的目的，就是选择最优的参数集，使模型能够很好地拟合训练样本集的空间分布。通过训练得到的预测模型，实际上把训练样本集的空间分布提取出来并编码到其庞龙源期刊网大的参数集中。利用这个训练好的预测模型，我们就能够预测新的未知样本x的标签或属性。当今大多数机器学习算法都是基于这个原理，谷歌公司的AlphaGo也不例外。针对某个事物或现象所采集的训练样本，是对该事物或现象的直观描述，蕴藏着大量与之相关的先验知识。例如，ImageNetILSVRC国际图像内容分类比赛所提供的训练样本集拥有1000类、总共一百多万张彩色图像。每一类都对应自然界中的一种常见物体，如汽车、飞机、狗、鸟，等等，包含大约1000张从不同场景及不同角度拍摄的该种物体的彩色图像。利用这个训练样本集训练出来的深度卷积神经网络，实际上是将每类物体的共性特征及个体差异等进行信息提取与编码，并记忆到其庞大的参数集中