数学建模-蛋白质分子量分解问题的探究

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

分子量分解问题的研究摘要生命蛋白质在形成过程中由若干种氨基酸经不同的方式组合而成,针对拥有一定分子量的蛋白质分子在形成过程中所存在的若干的不同的组合方式问题,在给定的蛋白质分子量x条件下,我们分不拥有计算机和拥有计算机两种情况考虑:一、在没有计算机的情况下,我们通过题中条件建立多元一次方程组,建立了一般数学模型,利用矩阵法得出不附加任何约束条件下的最为一般的数学模型,求解满足已知条件的解,得到不同x条件下方程通解的表达式;二、在拥有计算机的情况下,共建立三个数学模型:分别为:1、不考虑任何其他约束条件下的蛋白质分解,我们用Fortran编程穷举满足方程的所有解,但是我们发现直接编程通过18次循环来求解十八元一次方程工作量较大,因此在模型一中我们将程序循环的上限合理地改为了][]1[n…]1[1-i1iaiaanx,从而减少程序运行次数。当X取1000的时候,运行的次数已经减少到28268次,提高了程序运行的效率,运行时间减少到0.187秒。提高了程序运行的效率,缩短了运行时间。2、在模型二中通过考虑确定C、H、O、N各元素的相对分子含量,在原有的FORTRAN程序中增加了4个约束条件,建立延伸拓展模型,得出合理的有可能在生活中存在的氨基酸的组合数。减少了无用解的数目,缩短了程序运行时间。以分子式为14146343ONHC的蛋白质为例。其相对分子质量为936,分解成氨基酸的组合形式有256种,所用时间2s,组成形式只有原来的1/100,时间缩减为原来的1/5。3、模型三通过生物化学手段确定蛋白质中所含氨基酸的种类M,从而减少方程中未知量的个数,将18元整数一次方程简化为M(M=18)元一次方程,从而大大减少了运算量,节省了时间。最后我们对模型进行了分析,并得到模型的整体评价和推广前景。关键词n元一次不定方程,矩阵法,氨基酸、各元素含量一、问题重述生命蛋白质是由若干种氨基酸经不同的方式组合而成。在实验中,为了分析某个生命蛋白质的分子组成,通常用质谱实验测定其分子量x(正整数),然后将分子量x分解为n个已知分子量a[i](i=1,.......,n)氨基酸的和的形式。某实验室所研究的问题中:n=18,x1000a[i](i=1,.......,18)分别为57,71,87,97,99,101,103,113,114,115,128,129,131,137,147,156,163,186要求针对该实验室拥有或不拥有计算机的情况作出解答。二、问题分析蛋白质是以氨基酸为基本单位构成的生物高分子。由生物常识可知,组成蛋白质的氨基酸总共有20种,由于亮氨酸和异亮氨酸、谷酰胺和赖氨酸相对分子质量相同,所以题目中给出的氨基酸分子质量有18种。分析某个生命蛋白质的分子组成,即通过N元一次方程Xxaiii181求出组成蛋白质的氨基酸的种类和数目。在没有计算机的情况下,常采用辗转相除法解N元一次方程,但由于过程繁琐,计算量大,我们尝试改用矩阵法。在有计算机的情况下,我们可以利用蛋白质本身的特性,补充约束条件,结合FORTRAN语句编程,可以有效减少运算结果和运算时间。三、模型假设1、忽略各个氨基酸分子结合失去一分子水的影响,给定的蛋白质分子量X单纯只是几个已知的氨基酸分子量之和而不考虑其他影响因素;2、假设所有被测定的蛋白质均由给定分子量的20种氨基酸组成,不含有其他组成成分。因为组成蛋白质的20种主要氨基酸中有两对分子量相等,故为18种相对分子质量;3、假设氨基酸分子结合过程中是任意排列组合的,不存在互斥或互补现象,即任何两种氨基酸都可以同时存在于同一个蛋白质中,没有任何一种氨基酸的存在是以其他氨基酸的存在为前提的。实际中这一假设是成立的;4、假设给定的蛋白质分子量X和氨基酸已知分子量ia数据准确,无测量误差;5、假设实验测定中蛋白质是水解完全的;6、假设实验室拥有测定物质化学性质的仪器四、符号系统ia:第i种氨基酸的实际分子质量ix:蛋白质分子中各组成氨基酸的数目X:蛋白质分子的实际分子质量iiiiNOHC,,,:第i种氨基酸C,H,O,N原子的个数C%、H%、O%、N%:该蛋白质中相应元素的质量分数m:该蛋白质含有的氨基酸种类数目五、模型建立5.1在没有计算机的情况下由题目可知,本题是一个典型的多元一次不定方程的求解问题。所谓多元一次不定方程,就是可以写成下列形式的方程:1122...nnaxaxaxA,它是指未知数的个数多余方程个数的方程,这类方程可能有无穷多解。传统方法中常用的方法为辗转相除法,但是当n较大的时候计算起来比较繁琐,因此,我们利用矩阵的初等变换求不定方程的通解。1821,....,,aaa是18个整数,经过一系列初等整消法变换,矩阵naaaa1....000....................0....1000....0100....001321(1)可化为整数矩阵0......................................0...0......18321333323122322211131211nnnnnnnppppppppppppdpppp(2)其中,d是1821,....,,aaa的最大公因数,并且0..............................................................0...0......332211332323213123232221211313212111nnnnnnnnnnnnapapapapapapapapapapapapdapapapap1)(nnnijIp定理1设(naaa,...,21)=1,002,01,...,nxxx为不定方程bxaxaxann...2211的一组特解121,...,nttt为任意整数,那么它的通解为:0111022201110112211.....................;(...)nnnnnnnnnnxxatxxatxxatxxatatat证明由1122...nnaxaxaxb及0001111...nnaxaxaxb,得000111222()()()0nnnaxxaxxaxx故0000111222111()()()...()nnnnnnaxxaxxaxxaxx,显然上式有n-1个自由未知量,不难求得它的n-1个解为:112211(,0,...,0,);(0,,0,...,0,);....................................(,...,0,,);nnnnnaaaaoaa因为行列式1210...000...00...............0,00...0...nnnnnnnaaDaaaaaa所以D的n个列线性无关,从而它的前n-1个列线性无关,即1,2,...1n线性无关,故方程000111222()()...()0nnnaxxaxxaxx的任意解是121,,...n的线性组合。所以,0001122112211(,,......)nnnnxxxxxxttt=121112211(,,...,...),nnnnnnatatatatatat即0111022201110112211.....................;(...)nnnnnnnnnnxxatxxatxxatxxatatat其中121,,...nttt为任意整数。证毕。定理2设12(,,...)1,naaa则不定方程bxaxaxann...2211有解;任取2nn个整数,1,2...1,1,2,...ijainjn及n个数12,,...naaa做矩阵:111211,11,21,12.....................nnnnnnaaaAaaaaaa使0A,并作伴随矩阵:11211,1,112221,22121,........................nnnnnnnnnnAAAAAAAAAAAAA其中ijA为ija的代数余子式;设00012,,...,nxxx为方程的任一组特解,那么方程的通解为:01,111121101,221222212101,11..................nnnnnnnnnAxAAxAxAAxtttAxAAx其中121,,...,nttt为任意整数。证明由1122...nnaxaxaxb及0001111...nnaxaxaxb,得000111222()()()0nnnaxxaxxaxx由行列式性质得10,1,2,...,1.njijjaAin所以A的前n-1列是方程(3)的解。又A=10nA,所以A的n个列线性无关,从而它的前n-1列线性无关,故(3)的任意解是A的前n-1列的线性组合。从而有任意整数121,,...,nttt,使得01,111121101,221222212101,11..................nnnnnnnnnAxAAxAxAAxtttAxAAx证毕5.2在有计算机的情况下模型一:不考虑任何其他约束条件下的蛋白质分解在不考虑任何其他约束条件时,我们想到用穷举法法解决此问题,根据方程式Xxaiii181,利用循环结构,对18种氨基酸可能的组合进行罗列。显然这种穷举法的计算量过大,程序运行时间长,产生的无用结果多。于是我们将穷举法加以改进。因为18,1000nX,限制了ix的取值范围为iaX,0,即:1701x1402x1103x1004x1005x906x907x808x809x8010x7011x7012x7013x7014x6015x6016x6017x5018x然后,结合FORTRAN语言以循环嵌套为主体编写程序(见附录)。通过程序运算,我们得到了下表中分子量、氨基酸组合方式、程序运行时间的数据:分子量解的个数运行时间10000.00020040.000300140.000400450.0005001580.0006005220.00070015080.00080042910.003900112490.0061000282680.1871100673390.45212001541430.73313003381581.60714007164813.011150014672215.3201600291573813.1351700563399023.89918001061149239.29719001951703575.161200035119056137.640接着,我们用MATLAB绘制了“N-X拟合曲线图”和“t-X拟合曲线图”。020040060080010001200140016001800200000.511.522.533.54x107N/个X0200400600800100012001400160018002000020406080100120140t/sX从曲线图中可以看出,氨基酸的组合个数与蛋白质分子量呈指数关系,程序运行时间与蛋白质分子量也呈指数关系。由于生物蛋白质的平均分子量

1 / 21
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功