改进神经网络在芝麻油掺伪检测中的应用朱清妍1,潘勇军2(湖南信息职业技术学院,湖南省长沙市410200)摘要:研究芝麻油掺伪检测问题,提高检测精度。传统物理或化学芝麻油掺伪检测方法操作复杂,设备昂贵,存在不同程度缺陷。结合近红外光谱技术和神经网络优点,提高一种RBF神经网络_近红外光谱的芝麻油掺伪检测方法(NIR-RBF)。首先采用近红外光谱提取芝麻油样本的光谱信息,然后采用主成分分析提取光谱信息主要有效成分,最后将主要有效成分输入到神经网络进行学习,得到芝麻油掺伪检测结果。采用建立的模型对掺入不同类型植物油的芝麻油进行检测,研究结果表明,相对于其它芝麻油掺伪检测方法,NIR-RBF提高了检测精度和速度,降低了检测误差,是一种快速、有效的芝麻油掺伪检测方法。关键词:近红外光谱;神经网络;芝麻油;掺假中图分类号:TP183文献标识码:AApplicationofimprovedneuralnetworkinsesameoiladulterationdetectionZhuQing-yan1,Panyong-jun2(HunanCollegeofInformation,Hunan,Changsha,410200)Abstract:Studyofsesameoiladulterationdetectionproblems,improvetheaccuracyofdetection.Thetraditionalphysicalorchemicalsesameoiladulterationdetectionmethodoperationiscomplex,expensiveequipment,defectstovaryingdegrees.Combiningnearinfraredspectroscopytechnologyandneuralnetworkadvantages,improveaRBFneuralnetwork_nearinfraredspectroscopysesameoiladulterationdetectionmethod(NIR-RBF).Thefirstextractionofsesameoilbynearinfraredspectroscopysamplespectralinformation,andthentheprincipalcomponentanalysisofmaineffectivecomponentsextractionofspectralinformation,finallythemaineffectivecomponentsinputtotheneuralnetworklearning,getsesameoiladulterationdetectionresults.Usingthemodelestablishedontheincorporationofdifferenttypesofplantoilandsesameoilweredetected,theresultsshowthat,comparedwithothersesameoiladulterationdetectionmethod,NIR-RBFimprovesthedetectionprecisionandspeed,toreducetheerrorofdetection,isafastandeffectivemethodfordetectionofadulterationinsesameoil.Keywords:nearinfraredspectroscopy;neuralnetwork;sesameoil;adulteration1引言芝麻油又称香油,是一种古老的油脂品种,营养价值高于其它食用植物油,香味浓郁,是深受人们喜爱,市场售价远高于其它植物油[1]。不法商贩将大豆油、菜籽油、葵花籽油等掺入到芝麻油中,谋取更高的利润。为了保护消费者和生产经营者的合法利益,在加强对芝麻油生产和销售监管的同时,迫切需要建立一种快速、准确、科学、有效的检测方法,对芝麻油掺伪进行有效鉴别[2]。目前主要采用物理或化学的方法对芝麻油掺伪进行检测,这些方法检测精度都不高,误差较大。近些年来,一些学者提出一些新检测方法。朱杏冬利用紫外分光光度法对芝麻油掺假进行检测,该方法简单快速,结果稳定可靠,但是需要对样品进行复杂的前期处理[3]。电子鼻技术是一种生物传感器分析技术,对掺伪油的定量分析结果较差[4]。相色谱是芝麻油掺伪检测中最常用的技术,检测精度相当的高,平均预测误差都小于5%[5]。吴静珠提出了红外光谱法的芝麻油掺伪检测,检测准确率有时达到97%,但是该方法只能进行定性分析,不能进行定量分析[6]。当前检测精度最高的为核磁共振法,,是一种最先进的芝麻油掺伪鉴别手段,总体检测正确率达到95%以上,但是该检测方法要借助于昂贵的设备,目前尚难于在国内推广普及[7]。近些年来随着光谱学发展,近红外光谱分析技术(NearInfraredSpectroscopy,NIR)得到了迅速发展,其具有操作简单、分析速度快、所需样品少等优点,在石油化工、制药、发酵工程和化学工艺等领域得到了广泛的应用,但是其只能进行定性分析,需要进一步建模进行定量分析[8]。当前基于近红外光谱分析的建模方法主要有多元线性回归(MLR)和偏最小二乘法(PLS)等,但是该方法都是线性建模方法,然而近红外光谱信息量大,非特异性强,因此检测精度不高。RBF神经网络可以逼近任何连续的非线性曲线,是定量分析首选方法[9]。为了提高了芝麻油掺伪检测精度,保护消费者权利,本文结合近红外光谱分析技术和RBF神经网络的优点,提出一种RBF神经网络_近红外光谱的芝麻油掺伪检方法(NIR-RBF)。首先对芝麻油近红外光谱提取样品光谱信息,然后主成分分析提取主要有效检测成分,最后采用RBF神经网络建立芝麻油掺伪的定量分析模型,对测试集样品进行检测。结果表明,NIR-RBF的芝麻油掺伪检测精度相当高,为我国芝麻油掺伪检测提供了一种新方法。2芝麻油掺伪检测的关键技术2.1近红外光谱技术原理近红外光谱指样品在波长780-2526nm之间的吸收光谱,它对样品的近红外吸收光谱进行采集,然后通过化学计量学方法对实验数据进行分析和处理,从而对样品进行定性测定,是一种快速、无损检测技术[10]。样品近红外光谱信息由样品的倍频和合频组成,信息十分丰富,谱带较宽,信号较弱,重叠非常严重,样品光谱差别难以用简单对照区进行区分,主要通过计算机,借助化学计量学和数学算法对光谱信息特征进行提取,然后建立相应检测模型对样品进行分析。2.2主成分析近红外波段光谱含有丰富的信息,重叠非常严重,直接采用该信息进行建模,会影响RBF神经网络的计算速度和建模的效率,因此需要采用一定的技术在不减少光谱信息基础上,加快RBF神经网络的计算速度和建模的效率。主成分分析法是一种信息处理技术,选取重要信息,可以消除重叠信息,其信息处理步骤为:(1)设采集到m维样品光谱特征归一化处理,具体为:2()/()/ijijjijjaxxxxn(1)11njijixxn(2)(2)对样本特征协方差矩阵进行计算。1111rmmmmrRrr(3)1221()()()()nijjikkijknijjikkiaaaaraaaa(4)式中,i为样本编号,j为特征编号。(3)计算矩阵R的特征值和相应特征向量,从而获得m个特征值i,1,2,,im。(4)按照特征值大小对其进行排序,根据累计贡献率大85以上的原则取前p个特征向量作为最终主成分,且这些主成分不相关,无消息重叠,很好消除近红外波段光谱的冗余信息,很好反映全部原始光谱信息。2.3RBF神经网络RBF神经网络是一个包括输入层、隐层、输出层的三层神经网络,其采用径向基函数作为隐单元的基,将非线性低维数据变换到高维空间进行线性可分。相对于BP神经网络,RBF神经网络的网络结构十分简单,收敛速度更快,其结构如图1所示。图1RBF神经网络的结构在RBF神经网络的应用过程,wi、ic和i对其模型性起着决定作用,因此要想获得高性能的RBF神经网络模型,首先获得最优的iw,ic,i值,传统RBF神经网络参数优化采用穷举法、梯度下降以及遗传算法,这些方法各自存在不足,穷举法速度慢,梯度下降法对参数初值敏感,遗传算法易陷入局部极小,进化后期收敛速度慢。粒子群算法(PSO)是一种新的优化算法,具有并行性、全局搜索能力,通过跟踪两个最极值(Pbest和gbest)找到最优解,在找最优解的过程中,每一个粒子根据下式更新自己的速度和位置:12(1)()1()(()2()(())ididbestidbestidvivicrandPxicrandgxi(6)(1)()(1)idididxixivi(7)式中,()idvi和(1)idvi表示粒子更新前后的速度;()idxi和(1)idxi表示粒子更新前后的位置;w为惯性权重,1r和2r为一随机数,1c,2c是学习因子。PSO对RBF神经网络参数优化流程见图2。图2RBF神经网络参数优化流程3芝麻油掺伪检测具体步聚(1)收集纯芝麻油和其它植物油样品,并对它们进行均匀混合。(2)采用近红外波段光谱仪对样品光谱进行检测,获得样品光谱信息。(3)对光谱信息进行预处理,过滤掉噪音,消除一些干扰。(4)采用主成分分析对光谱信息进行处理和分析,提取主要有效光谱信息,并消除一些冗余信息,提高检测速度和精度。(5)经主成分分析的光谱信息输入到RBF神经网络进行学习。(6)采用粒子群算法对RBF神经网络参数进行优化,获得最优iw,ic,i值。(7)采用最优参数的RBF神经网络对芝麻油测试样本的光谱信息进行检测。(8)输出检测结果,并对模型性能进行分析。具体检测流如图3所示。图3芝麻油掺伪的检测流程4芝麻油掺伪仿真实验4.1实验材料分别收集纯芝麻油、大豆油、菜籽油和花生油样品,分别将大豆油、菜籽油和花生油掺入到纯芝麻油中,其伪油含量为0.2~40%,组成一个二元体系的伪芝麻油,充分将它们混合均匀,将这些样品放置于25℃和40%湿度的环境下,共获得掺入大豆油的伪芝麻油样品个数为50,掺入菜籽油的掺伪芝麻油样品个数为45,掺入花生油的伪芝麻油样品个数为50。将每类样本分成两部分:训练集和测试集,测试集均为10个,用于对建立的掺伪检测模型性能检验。4.2样品的近红外光谱图由于篇幅有限,本文只详细介绍菜籽油掺入芝麻油的仿真实验情况,采用近近红外光谱仪采集的光谱信息如图4所示。从图4可知,样本的密度对光谱信息有不同程度影响,需要对其采用标准归一化处理,过滤信息中的噪音,消除噪音干扰。图4菜籽油掺入芝麻油的近红外光谱图4.3模型建立与主成分数确定采用光谱分析软件将获得的光谱信息转换为主成分析能够识别的数据,然后采用主成分分析对数据进行主成分提取,获得的结果如表1表示,从表1可知,前面5个主成分累计贡献率达95以上,因此5个主成分基本上代表了原始光谱的主要信息,为了加快建模速度,这样可以选择前面5个主成分作为RBF神经网络的输入。表1主成分分析结果主成分数贡献率(%)累计贡献率(%)165.4565.45215.1780.62312.2792.8941.5594.4451.3595.7960.8896.67将5个主成分输入到RBF神经网络进行学习,RBF神经网络的输入层节点数为5,输出节点为1,大量实验表明,隐层节点数选择10,模型的性能比较好。粒子群的个数为20,122cc,最大迭代次数为300。4.4结果与分析采用粒子群算法对RBF神经网络参数进行优化,最优参数搜索曲线如图5所示,采用获得最优参数建立检测模型,并采用该模型对掺入菜籽油的掺伪芝麻油测试集进行检测,得到结果如图6所示。图5RBF神经网络参数优化的曲线图6菜籽油掺伪的NIRS预测值与真实值比较从图6可知,改进神经网络的预测误差比较小,预测效果较好,可以对芝麻油