稿号:0906004(修改稿)人工神经网络及其在公共卫生领域的应用沈波(综述)1,郑能雄1(审校),刘宝英2(审校)摘要:人工神经网络(ANN,简称神经网络)由于其具有高度的自适应性、非线性、善于处理复杂关系的特点,较传统统计方法具有很多优点,对其目前在公共卫生领域中的应用进行综述。关键词:人工神经网络;公共卫生;卫生统计;人工神经网络(artificialneuralnetwork,ANN,简称神经网络)是由大量的、简单的处理单元(称为神经元)广泛地互相连接而成的复杂网络系统,它反映了人脑功能的许多基本特征,是一个高度复杂的非线性动力学系统。神经网络的发展与神经科学、数理科学、认知科学、计算机科学、人工智能、信息科学、控制论、机器人学、微电子学、心理学和分子生物学等有关,是一门新兴的边缘交叉学科。神经网络起源于20世纪40年代,1943年心理学家McCulloch和数学家Pitts合作提出了神经元的数学模型,即MP模型,从此开创了神经科学理论研究的新时代。神经网络的发展经历了20世纪60到70年代低潮期,80年代又进入新的研究高潮。1987年6月在美国加州举行了第一届神经网络国际会议,并成立了国际神经网络学会。我国的“863”高技术研究计划从1990年开始批准了关于神经网络的课题,自然科学基金与国防科技基金也把神经网络列入选题指南,对中选的课题提供研究资助[1]。1人工神经网络模型的原理和结构人工神经网络根据神经元的生物特性和功能,把它抽象为简单的数学模型(如图1),X1,X2,……,Xn是神经元的输入,即是来自前级n个神经元的轴突的信息,θi是i神经元的阈值;Wi1,Wi2……,Win分别是i神经元对X1,X2,……,Xn的权系数,也即突触的传递效率;Yi是i神经元的输出;是传递函数,它决定i神经元受到输人X1,X2,……,Xn的共同刺激达到阀值时以何种方式输出。图1神经元的数学模型神经元和神经网络的关系是元素与整体的关系。神经元的结构很简单,工作原理也不深奥。但用神经元组成的神经网络就非常复杂,其功能也十分奥妙。下面是一个最常用的三层BP网络模型,网络包括一个输入层,一个输出层,一个或多个隐含层(中间层)。同层节点(单元)中没有任何连接,各层之间实现全连接,典型的BP神经网络是含有一个隐含层的三层网络结构(图2),第一作者简介:沈波(1974-),男,医学硕士,主管医师,主要从事疾病预防控制工作。1.作者单位:福州市疾病预防控制中心,福州350004;2.福建医科大学,福州350004。图23层BP网络结构这个网络的输入层有n个神经元,输出层有q个神经元,隐含层有p个神经元。输入信号从输入层节点依次传过各隐含层节点,然后传到输出层,每一层节点的输出只影响下一层节点的输出,相邻层每个节点通过适当的连接权值前向连接。BP网络可以看作是一个从输入到输出的高度非线性映射。2神经网络的基本类型和特点人们根据不同的应用,研制出许多种不同的神经网络模型,因此人工神经网络的分类也有很多标准,如按性能可分为连续型与离散型网络或确定性与随机性网络;按学习方法可分为有导师学习或无导师学习;按连接突触性质可分为一阶线性关联网络或高阶非线性关联网络。但常见的人工神经网络按信息传递的路径和网络结构的不同,归纳为三大类,即前馈型神经网络(feedforwardneuralnetwork,FF),以BP网络为代表;反馈型神经网络(backforwardneuralnetwork,BF),以Hopfield网络为代表;自组织特征映射神经网络(self-organizingfeaturemapneuralnetwork,SOM),以Kohonen特征映射网络为代表。其中理论较成熟、应用广泛的是前馈型网络,在前馈神经网络的应用中又首推BP网络和它的变化形式,它也是前馈网络的核心部分,并体现了人工神经网络最精华的部分。尽管人工神经网络只是人脑的低级近似,但是神经网络不同于一般的计算机和人工智能,它的很多特点和人类的智能类似。单个神经单元的功能很弱,但是大量的神经元集体的并行的活动处理功能却十分强大,其具有以下特点:2.1大规模并行处理。人工神经网络是由大量简单处理单元相互连接构成的高度并行的非线性系统,具有大规模并行性处理特征。虽然每个处理单元的功能十分简单,但大量简单处理单元的并行活动使网络呈现出丰富的功能并具有较快的速度。2.2知识的分布式存储。在神经网络中,记忆的信息都存储在神经元之间互连的权值中,从单个权值中看不出其存储信息的内容,因而知识的存储是分布式的方式。2.3较强的容错特性。由于知识的分布式存储,使得人工神经网络具有良好的容错性,即使局部的神经元损坏后,不影响整体神经网络输出的正确性。2.4具有自适应、自组织、自学习的能力。人工神经网络可以处理各种变化的信息,而且在处理信息的同时,非线性动力系统本身也在不断变化,即网络可以通过学习和训练进行自组织,以适应不同的信息处理要求,这也是神经网络最突出的特点。3神经网络与医学统计学的关系与传统的统计方法相比,人工神经网络具有许多的优点:①常规的影响因素分析方法如线性回归模型、logistic回归模型等往往要求资料服从正态分布,且自变量、因变量之间的关系为线性关系,但实际不可能完全满足这些条件,神经网络模型对资料的性质要求较低,可以拟合任意非线性关系。②避免了在建模过程中如何正确设定函数形式,扩充了回归建模研究中的函数类型,能提示系统内部存在的关系,使变量选择研究更具一般性,为在结构未知下的变量筛选开辟了途径。③传统对于强影响点和异常点的处理往往是通过回归诊断,使模型能更多地照顾到大多数点的影响。而BP人工神经网络充分考虑强影响点所包含的信息,能够为决策提供一定的帮助。④神经网络模型能同时处理几百种因素,其中某些因素与问题求解只有很小的相关性,但将它们集合起来考虑,可使困难问题的求解更加精确[2]。人工神经网络方法与传统统计方法又有很强的联系,从统计学的观点来看,人工神经网络最有用的特性之一就是对分析问题的概率模型不要求先做出先验假设然后验证,而是从纯计算的角度实现逼近求解。用人工神经网络逼近映射被认为是统计回归分析,尤其是非线性回归的推广。然而人工神经网络在探查自变量和因变量之间复杂的非线性关系时是从数学计算中发现规律,不能像传统统计分析那样给出明确的方程,但是它能够给出具有确定算法与结构参数的神经网络,这个网络结构是清晰的,从某种意义上说,它能够更有效的表述实际问题,特别是当有些问题并不需要明确的数学表达式或者根本无法找到明确的数学公式表达时,神经网络就更显示其优越性。人工神经网络与传统统计方法相比,理论基础还不是十分完善,在解决问题的模型上没有统一的标准,无法提供明确的统计学差异等验证功能,因此神经网络并不能完全取代传统统计学。也没有必要按传统统计方法的思路过分追究假设检验、可信区间估计等问题在网络模型中的实现。而应该认识到神经网络和传统统计方法各有作用,需要根据数据的条件做出正确的评价,两者互补,结合起来共同发展和完善。4人工神经网络的应用随着人工神经网络理论研究的深入,以及计算机技术的普及与发展,人工神经网络的应用也取得了令人瞩目的成果,涉及自然科学、应用科学及综合性交叉学科等各个领域,主要用于解决以下问题:模式信息处理和模式识别、最优化问题的计算、信息的智能化处理、复杂控制和信号处理等,目前已在人脸识别、能源的优化利用、机器人的智能控制、电力负荷预报、飞行控制、工业生产监控等领域得到了成功应用。近年来在生物医药领域应用也越来越广泛,主要有利用人工神经模型进行的模式识别、判别分析、预测预报,例如用于基因识别和DNA、RNA序列分析,进行药物分析、药代动力学、制剂研究,疾病诊断专家系统、医学图像分析和信号处理,疾病预测等[3]。5人工神经网络在公共卫生领域的应用5.1流行病学方面:有学者通过神经网络建立了一些传染病的预测模型,如吴海磊等根据15个自变量为输入因子建立了性病艾滋病的预测模型[4],曲波、施海龙、高玉兰、KiangR等分别应用气象要素为输入因子建立流脑、呼吸道传染病、伤寒、疟疾等传染病的神经网络预测模型[5-9]。在慢性病的预测模型方面,如马玉霞应用气象要素建立了高血压的神经网络预测模型[10],周水红和高蔚等分别应用神经网络分析了高血压和糖尿病的危险因素,认为神经网络能够胜任疾病危险因素的分析任务,拟合出比传统模型(logistic回归分析)更复杂的变量间关系[11、12]。BaghdadiG则应用神经网络技术开发出糖尿病病人的血糖预测模型[13]。5.2环境与职业医学方面:神经网络技术在环境监测方面学有较好的应用前景[14],Groves等把神经网络技术应用于饮用水中挥发性有机物的检测,提高了野外水源的检测和收集能力[15]。李祚泳等提出了人工神经网络建立环境污染物浓度预测的方法,并通过一个大气污染物SO2浓度的预测实例,证实了人工神经网络用于环境污染预测的可行性[16]。沈波等应用神经网络模型建立了中低强度噪声对高频听力损伤的模型[17],严雁翎建立了噪声非稳态噪声性耳聋发病率的预测模型[18],柳静献,郑双忠等人分别则建立了尘肺发病预测的神经网络模型[19、20],麦海明将其应用于职业卫生安全工程的评价等[21]。5.3食品与营养学方面:HayDC等通过研究认为应用神经网络模型来估计人的每日能量消耗,可以得到更精确和经济方便的结果[22]。HeatyAP等人应用人工神经网络技术和决策树研究膳食模式,通过对1379名爱尔兰成年人的膳食营养等分析,结果提示神经网络可以成功地应用于每日膳食的合理化预测研究[23]。MariniF认为神经网络在食品的分析方面有许多独特的优势和功能,今后有非常大的发展前景[24]。5.4突发性公共卫生事件的预警:应用神经网络对大量数据的综合分析能力和预测预报特点,与GIS等技术结合,通过数据挖掘等,可以建立突发性公共卫生事故的预测预报系统[25]。5.5卫生检验方面用:虽然目前人工神经网络在卫生检验领域直接应用的学术文献很少,但在分析化学应用则有很多的报道,而且也涉及了很多与卫生检验密切相关的研究[26、27]。5.6卫生经济学方面:神经网络在经济学的许多领域有广泛的应用,在公共卫生方面也不另外,雷海潮等采用人工神经网络的模型方法对我国卫生总费用进行了推算研究,得到了近似卫生账户测算体系(SHA)要求的新结果[28]。6神经网络技术的不足虽然人工神经网络具有很多优点,但其理论研究还有待完善,技术上有诸多的限制:①BP神经网络模型能在诸多的影响因素中找出最主要的几个因素,但对于多层神经网络模型而言,其计算过程复杂,不能给出变量间可解释的具体函数关系,无法提供准确的可信区间等指标;②学习速度太慢,即使一个比较简单的问题,也需要几百次甚至上千次的学习才能收敛,容易陷入局部极小值;③网络隐含层的数目与隐含层单元的选择尚无理论上的指导,而是根据经验确定。④要建构良好的网络结构,设计者必须精心设计网络参数,在网络运行中还要进行大量调整。7神经网络的发展前景总之,基于神经网络的方法是一个热点研究问题,目前国内的人工神经网络研究远不如国外成熟,在医学领域中应用研究还比较分散,研究需要多学科联合开展,多数神经网络在公共卫生领域的应用中还存在训练时间长、精确度不够高,缺乏一套行之有效的神经网络设计方法等缺陷,同时由于神经网络模型的复杂性,不同的研究采用不同的网络结构,不同的研究结果之间可能存在矛盾。相信通过对人工神经网络不断的探索和研究,一定能在复杂的公共卫生领域性发挥其巨大的潜力。参考文献[1]董长虹.Matlab神经网络与应用(第2版)[M].国防工业出版社.2007.6-7.[2]张军,黄子杰.BP神经网络模型的原理及在心理学领域的应用[J].现代预防医学,2006,33(10):1855.[3]李丽霞,张敏,郜艳晖,等.人工神经网络在医学研究中的应用[J].数理医药学杂志,2009,22(1):80-82.[4]吴海磊,钱吉生,徐兴大,等.