matlab编程代做highspeedlogic基于基因数据的神经网络模式分类研究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

highspeedlogic摘要识别活动是人类的基本活动,人们希望机器能代替人类进行识别工作,因此模式识别的理论和方法引起了人们极大的兴趣并进行了长期的研究,现已发展成一门多学科交叉的学科。人工神经网络能较好地模拟人的形象思维,而且由于具有大规模并行协同处理能力、较强的容错能力和联想能力以及较强的学习能力,所以将神经网络方法运用到模式识别中去解决识别问题己成为国内外科技工作者广泛关注的热点。本文首先对模式识别、神经网络的发展概况以及应用神经网络来进行模式识别作了较为详细的介绍,然后分析了模式识别的一些基本概念、方法,指出了其困难和要求,同时给出了神经网络进行模式识别的方法。本课题我们将利用BP神经网络对基因数据进行分类,通过测试得到有三组数据,每组数据均有20个样本,且每一组样本具有共同的特性,并具有其特有的特性,每个样本具有114个数据,已知一组20个样本具有癌症特性,而另一组20个样本具有正常的特性,通过神经网络模型将第三组模型进行训练,做模式分类从而来判断其具有的特性。关键词:模式识别;人工神经网络;BP神经网络;highspeedlogic第一章前言1.1引言近年来,随着基因技术在医学中的广泛应用,基于基因数据的计算机辅助诊断迅速发展起来。计算机辅助诊断可以提高医生诊断的准确率,协助医生对病人病因进行判断和识别并有助于预防疾病。在特征提取的基础上进行模式分类是基于基因的计算机辅助诊断的重要步骤,如人工神经网络等分类方法已广泛的应用于疾病诊断及预防系统之中。人工神经网络的研究已有半个多世纪的历史,起源于20世纪40年代,20世纪80年代开始蓬勃发展,如今出现了研究的新热潮.人工神经网络的研究主要是直接模拟人脑的结构和功能,具有生物神经网络的某些特性,在自学习、自组织、联想、及容错方面具有较强的能力,能用于联想、识别和决策.概率神经网络是20世纪90年代初提出来的一个分类网络,它以贝叶决策和密度函数估计为理论基础,广泛应用于模式识别和模式分类领域.因此,研究概率神经网络的模式识别具有重要的理论意义和应用前景。1.2人工神经网络的发展及研究现状人工神经网络(ArtificialNeuralNetwork),亦称为神经网络(NeuralNetworks,NN),是由大量神经处理单元(神经元Neurons)广泛互连而成的网络,是对人脑的抽象、简化和模拟,反映人脑的基本特征。人工神经网络的研究是从人脑的生理结构出发来研究人的智能行为,模拟人脑信息处理的功能。人工神经网络能模拟人类大脑的某些功能和思维方式,从而更好地解决模式识别、组合优化和智能控制等一系列本质上非计算的问题。它有如下优点:具有很强的自学习和自适应能力,可以处理不确定或不知道的系统;具有很强的信息综合能力,能同时处理定量和定性的信息,能很好地协调多种输入信息关系;具有很强的鲁棒性和容错性,因为信息是分布贮于网络内的神经元中;采用并行处理方法,使得计算快速;可以充分逼近任意复杂的非线性关系等。经过近半个世纪的发展,神经网络理论已在许多研究领域取得了广泛的成功,神经网络和其它算法的结合和交叉,构造混合神经网络模型,是当前神经网络研究的主要趋势。如神经网络和模糊逻辑结合,建立模糊神经网络;将混沌理论和神经网络结合建立混沌神经网络;将优化算法和神经网络结合,利用优化算法优化神经网络的结构或权值;将小波分析和神经网络结合建立小波神经网络;贝叶斯学习以及粗糙集理论和神经网络结合等,都是当前神经网络研究的热点。到目前为止,神经网络的类型已多达数百种,神经网络的理论研究和实际应用有了引人highspeedlogic注目的发展。神经网络在向纵深发展的同时,也在向模糊技术、进化计算等智能方法相结合的方向上发展,并广泛应用于模式识别等多个领域,尤其是在模式识别方面,神经网络所表现出来的能力超过了包括统计方法、静态方法和人工智能方法在内的传统方法。1.3研究意义神经网络通俗来讲,就是人们平时所说的“人工智能”。这个词是神经网络在人类大脑上历史基础的结果。神经网络是基于人类大脑工作的简化模型-这就解释了与人脑相关的神经网络术语。例如,神经网络是经过训练的,而训练的过程被称为学习。神经网络,例如多层的感知器,甚至使用被称为神经元的内部结构,神经细胞由此接收输入并且以不同的强度发射信号。人工神经元网络是生物神经网络的一种模拟和近似,它从结构、实现机理和功能上模拟生物神经网络。从系统观点看,人工神经元网络是由大量神经元通过极其丰富和完善的连接而构成的自适应非线性动态系统。模式识别是一种从大量信息和数据出发,在专家经验和已有认识的基础上,利用计算机和数学推理的方法对形状、模式、曲线、数字、字符格式和图形自动完成识别的过程。模式识别包括相互关联的两个阶段,即学习阶段和实现阶段,前者是对样本进行特征选择,寻找分类的规律,后者是根据分类规律对未知样本集进行分类和识别。广义的模式识别属计算机科学中智能模拟的研究范畴,内容非常广泛,包括声音和语言识别、文字识别、指纹识别、声纳信号和地震信号分析、照片图片分析、化学模式识别等等。在现实世界中,人类发出的声音、印刷或者书写出的文字、眼睛看到的风景,以及测量器输出的信号等,以各种各样的模式存在着。如果计算机能够听出并且分辨出这些模式,就能够简单地输入到计算机,并且可以送到工专业人员的作业负担。把模式输入到计算机后,通过一系列的处理,就可对其进行识别。在模式识别中有很多方法:统计模式识别方法,句法结构模式识别,人工神经网络模式识别。前面两者在实际应用过程中都显示出各自的局限性,而人工神经网络的研究起源于对生物神经系统的研究,采用反向传播(BP)网络,具有良好的模式分类能力,引入模糊逻辑理论,能较好地处理一些数据的不确定性问题。因此它对待识别的对象不要求有太多的分析与了解,具有一定的智能化处理的特点。由于具有良好的容错能力、分类能力强、并行处理能力和自学习能力。因而,采用神经网络识别方式是一种很好的选择。传统的分类方法对于同类相聚,异类分离比较有优势,但客观世界中许多事物在样本空间中的区域分割曲面非常复杂,相近的样本可能属于不同的类,而远离的样本可能属于同一类1。模式是对某些感兴趣的客体的定量描述或结构描述,模式类是具有某些共同特征的模highspeedlogic式的集合。模式分类可分为两种类型,分类和聚类,分类是在类别知识等导师信息的指导下,将待识别的输入模式分配到各自的模式类中去。聚类是无导师的分类方法,它是将相似的模式样本划归为一类,而将不相似的分离开,实现了模式样本类内相似性和类间分离性。通过聚类,可以发现原始样本的分布特性。神经网络对外界的输入样本具有很强的识别能力,可以发现输入样本自身的联系和规律以及输入样本和期望输出之间的非线性规律,因此在模式分类方面具有传统分类方法无法比拟的优点。人工神经网络在模式分类方面提出了大量了网络模型,发现了许多学习算法。1.4本课题研究任务本次毕业设计将根据人(其中部分已确诊患有癌症,部分人身体目前健康)的基因数据设计合适的神经网络进行训练,得到神经网络后再对其他人基因进行研究,判断是否有患病隐患。具体数据与任务为:已知60个人的基因数据样本(每个样本有114个基因),其中前20个是癌症病人的基因样本(其中还可能有子类,即患有某类癌症),其后的是20个正常人的基因样本,其余的20个是待检测的样本(未知它们是否正常)。1.找出描述癌症与正常样本基因的区别,建立数学模型及识别方法,预测待检测样本是癌症还是正常样本。2.设计可视化方法,使得在得到的数学模型下,清楚地表现癌症与正常样本在基因上的区别,并分析癌症样本中的子类情况。highspeedlogic第二章神经网络开发环境简介神经网络开发环境具有大多数个人计算机软件开发环境的特点,例如:编辑、编译、解释、链接、库函数、跟踪调试、等。将这些工具应用于开发环境,神经网络软件开发就变得十分简单了。此外,神经网络开发环境还融入了人工智能、仿真和模型软件包的一些概念,具模块系统提供语言和工具、动态描述、运行、数据提取、信号传送、结果分析、显示或图示结果等功能。理想的神经网络开发环境应具有使用简单、功能强大、有效性和可扩展性等关键特征。因此开发环境应具有描述和运行网络模型的良好的用户界面,使研究人员不必掌握操作系统或实现神经网络模型的计算机硬件知识就能进行网络模型的开发。开发环境应允许研究人员选择网络模型及其特性或定义新的网络模型及其特性,应能执行、监视、显示和控制神经网络的运行,并能将网络与其他处理功能连接。有效性是指神经网络开发环境要尽可能有效地使用汁算机。可扩展性意味着能定义和建立新网络类型的网络原始结构,由于有时无法预见将来需要何种网络,所以必须提供处理这种不确定性的功能。可扩展性是人工智能语言的关键特征,神经网络中同样需要这一技术。比较常用的开发环境有MATLAB神经网络工具箱、Plexi神经网络开发环境、Neuroshell神经网络开发环境等,下面介绍最常用的MATLAB神经网络工具箱。2.1MATLAB简介随着Matlab/Simulink通信、信号处理专业函数和专业工具的成熟,他们逐渐为广大通信技术领域的专家学者和工程师所熟悉,在通信理论研究、算法设计、系统设计、建模仿真和性能验证分析等方面的应用也更加广泛。Matlab,MatrixLaboratory的简称,是美国Mathworks公司于1984年推出的数值计算机仿真软件,经过不断的发展和完善,如今已成为覆盖多个学科、具有超强数值计算能力和仿真分析能力的软件。Matlab应用较为简单,用大家非常熟悉的数学表达式来表达问题和求解方法。它把计算、图示和编程集成到一个环境中,用起来非常方便。同时,Matlab具有很强的开放性和适应性,在保持内核不变的情况下,Matlab推出了适合不同学科的工具箱,如图像处理工具箱、小波分析工具箱、信号处理工具箱、神经网络工具箱等,极大地方便了不同学科的研究工作。Matlab强大的绘图功能,简单的命令形式,使其越来越受到国内外科技人员的青睐,得到越来越广泛的应用。highspeedlogicMATLAB之所以如此迅速地普及,显示出如此旺盛的生命力,是由于它有着不同于其它语言的特点。正如同Fortran和C等高级语言使人们摆脱了需要直接对计算机硬件资源进行操作一样,被称为第4代计算机语言的MATLAB,利用其丰富的函数资源,使编程人员从繁琐的程序代码中解放出来。MATLAB的主要特点:功能强大:MATLAB具有功能强劲的工具箱,其包含两个部分:核心部分和各种可选的工具箱。核心部分中,有数百个核心内部函数。其工具箱又可分为两类:功能性工具箱和学科性工具箱。功能性工具箱主要用来扩充其符号计算功能、图示建模仿真功能、文字处理功能以及与硬件实时交互功能。功能性工具箱能用于多种学科,而学科性工具箱是专业性比较强的,例如controltoolbox,imageprocessingtoolbox,signalprocessingtoolbox等。这些工具箱都是由该领域内的学术水平很高的专家编写的,所以用户无需编写自己学科范围内的基础程序,就能够直接进行高、精、尖的研究。MATLAB之所以成为世界顶级的科学计算与数学应用软件,是因为它随着版本的升级与不断完善而具有越来越强大的功能,主要有:数值计算功能;符号计算功能;数据分析功能;动态仿真功能;图形文字统一处理功能。界面友好,编程效率高:MATLAB突出的特点就是简洁。它用更直观的、符合人类思维习惯的代码代替了C和Fortran语言的冗长代码,给用户带来的是最直观、最简洁的程序开发环境。MATLAB语言简洁紧凑,使用方便灵活,库函数极其丰富,程序书写形式自由,利用其丰富的库函数避开繁杂的子程序编程任务,压缩了一切不必要的编程工作。由于库函数都是由本领域的专家编写的,因此用户不必担心函数的可靠性。可以说,用MATLAB进行科学开发是站在专家的肩膀上来完成的。MATLAB有很好的可扩充性,可以把它当成一种更高级的语言去使用。各种工具箱中的函数可以互相调用

1 / 25
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功