疾病诊断数学模型1知识

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

姓名班级所在学院电话(手机)是否报名全国竞赛队长李召09070241理学院队员1黄波09070241理学院队员2秦建新10010642机电工程学院1疾病诊断数学模型摘要本文解决的是如何根据就诊者体内各元素含量判别某人是否患有某种疾病和确定哪些指标是影响人们患该疾病的关键因素的问题。通过分析可知此类问题为典型的分析判别,在此我们采用元素判别和Bayes判别并应用Excel和SAS软件来对某人是否患病进行判别,并通过主成分分析法来确定患该疾病的关键因素。对于问题一,我们采用元素判别和Bayes判别进行前60人是否患病的判别,并对其结果进行对比。对于元素判别,我们用Excel对化验结果数据进行统计并通过折线图得出其分界值,然后与是否患病的真实情况进行对比,得出其准确度为95%;对于Bayes判别,通过编写SAS程序来进行判别,并得出其准确度为93.33%;考虑到诊断的实际情况和简便性最终确定Bayes判别为本文所要使用的判别方法。对于问题二,我们利用问题一中建立的判别模型对表2中的15名就诊人员的化验结果进行检验,检验结果为:9个人为患病者,6个人为健康人员。对于问题三,为了确定影响人们患该病的关键或主要因素,我们选取表1中的数据作为样本,建立主成分分析模型,通过对表1中的数据进行标准化并确定相关系数矩阵,接着,求出相关矩阵的特征值和特征向量,然后通过前m个主成分的累计贡献率满足%8511pkkikk来确定主成分的个数,最后通过主成份载荷分析得出最能代表主成分的原指标即所要求的主要因素为Fe、Ca、Mg、Cu。在此基础上,得到去掉K、Na、Zn的化检结果的新样本,利用Bayes判别,再对表2中的15名就诊人员的化验结果进行判别,判别结果:9个人为患病者,6个人为健康人员。关键词:元素判别,Bayes判别,主成分分析法,Excel,SAS软件2一问题重述.人们到医院就诊时,通常要化验一些指标来协助医生诊断。一般初步判断某人是否患病是通过观察某人体内元素的含量。通过题目给出数据可以看出,其中1-30号病例是已经确诊为病人的化验结果;31-60号病例是已经确诊为健康人的结果。我们需解决的问题有:问题一:根据表1中的数据,提出一种简便的判别方法,判别属于患者或健康人的方法,并检验方法的正确性。问题二:按照问题一提出的方法,对表2中的15名就诊人员的化验结果进行判别,判定他们是患该种疾病的病人还是健康人。问题三:能否根据表1的数据特征,确定哪些指标是影响人们患该疾病的关键或主要因素,以便减少化验的指标。并根据给出的结果,重复2的工作。二问题的分析此题研究的是医院关于疾病确诊的数学建模问题。我们通过建立合理的数学模型,研究不同元素在人体含量的关系,确定就诊人员是否患病。我们通过对题目中所给的30组健康人和30组患者人体7种元素含量的数据分析处理,寻求好的判别方法,判别就诊人员是否患病。针对问题一:我们建立了元素判别和Bayes判别两种模型。我们首先想到患病者和健康人员体内的某种或几种元素含量必然存在差异,我们用Excel图表功能对化验结果的数据进行统计分析,找到其中的差别从而建立元素判别模型。其次,我们利用模式识别广泛应用的Bayes判别,通过对患者和健康人员这两组样本进行Bayes判别分析,得到后验分布,再基于后验分布进行各种统计推断判别,由此我们建立Bayes判别模型,达到判别效果。最后我们对这两个模型进行讨论比较,发现元素判别受外界因素影响较大,故对问题一最终确定Bayes判别模型。针对问题二:我们运用问题一中建立的最终模型,对表2中所给的15位就诊人员是否患病进行判别,我们运用SAS软件求得结果并以表格呈现。针对问题三:为了确定影响人们患该病的关键或主要因素,我们选取表1中的数据作为样本,建立主成分分析模型,通过对表1中的数据进行标准化并确定相关系数矩阵,接着,求出相关矩阵的特征值和特征向量,然后通过前m个主成分的累计贡献率满足%8511pkkikk来确定主成分的个数,最后通过主成份载荷分析得出最能代表主成分的原指标即所要求的主要因素为Fe、Ca、Mg、Cu。在此基础上,得到去掉K、Na、Zn后的化验结果的新样本,利用Bayes判别模型,再对表2中的15名就诊人员的化验结果进行判别。3三模型假设假设1:假设题目中所给的数据是从许多确诊病例中随机抽取的,没有特殊情况,属于一般规律,可认为服从正态分布;假设2:假设就诊人员在化验前没有吃含矿物质量较高的食物;假设3:假设题目中所给的数据都是真实可靠的,化验没有错误;假设4:题目中所给的样本只患该种疾病或者是健康人员,没有患其他疾病;四符号及变量说明k化检结果中元素的个数1,2,,iik就诊人员体内各元素的化验结果的集合x样品q样品x来自组的先验概率的标准差的期望2()dxx到的平方马氏距离()fx来自的x的概率密度(|)pxx属于的后验概率2()Dxx到的广义平方距离g1212ln12,0g若,,不全相等,,若h1212-2ln,,1,2,,01/qqqqhqqq若不全相等若4qS联合协方差矩阵12,,,kSSS组内协方差矩阵1,2,,jxjp(7)pp人体内7种元素的含量(1,2,;1,2,7)ijxinj60n样本的相应的观测值jx11njijixxn为因素j的平均数js21()/(1)njijjisxxn为因素j的标准差.*ijxijx的标准化值i特征值R相关系数矩阵ijppRr))(,,2,1(ipmmi单位特征向量ijl主成分载荷Z各主成分的得分五问题模型建立与求解5.1问题一的模型建立与求解对于问题一,我们建立了元素判别模型和Bayes判别模型来进行某人是否患病的判别,并通过与实际情况比较来进行检验。最终得出一种较为简便的方法。5.1.1元素判别模型的建立我们运用Excel的图表功能分别做出1-60号病人的Zn、Cu、Fe、Ca、Mg、K、Na的折线图:56图1通过对上面的患有疾病的病人和没有疾病的人的比对,我们可以很清楚的看出Ca元素的含量对该病的影响最大,且以1000为分界线。若某人的Ca含量大于1000则可判别其为健康,否则其可能患有该种疾病。5.1.2元素模型的求解通过以Ca元素为判断准则的判断结果如下表(1为患病,2为正常)表5.1病例号判断结果准确结果病例号判断结果准确结果1113122211322231133224113422511352261136227113722811382291139221011402211114122121142221311432214114422151145221611462217114722182148221921492220115022211151222211522223215322241154227251155222611562227115722281158222911592230116022通过对上表的观察可知,在1-30号病例中有3例为误判,分别是18、19、23号,在对31-60号病例的判断中没有误判。5.1.3Bayes判别模型的建立设有k个组,且,,2,1,0),,(N~ap,又设样品x来自组的先验概率为(1,2,,)q,满足等式:11q(5.27)x到的平方马氏距离是12()()()Txxxd(5.28)来自的x的概率密度为:2/21/2()(2)||exp0.5()pxfxd(5.29)利用贝叶斯理论,x属于的后验概率(即当样品x已知时,它属于的概率)为1()(|),1,2,,()qfxpxqfx(5.30)x到的广义平方距离定义为22()()1,2,,Dxdxgh(5.31)其中,1212ln||120g,若,不全相等,,,,,若(5.32)1212-2ln,,,,1,2,,0,1/qqqqhqqq若不全相等若(5.33)8由此可推出x属于的后验概率为:221exp[0.5()](|)1,2,,exp[0.5()]kDxPxaDx(5.34)可采用如下的判别规则11,min()TTjjjjjkxlxClxC若(5.35)它可以等价地表达为2211,()min()jjjkxDxDx若(5.36)如果12,,,k,121/kqqqk则广义平方距离将退化为上一节的平方马氏距离,即22()()Dxdx这时1,2,,ak,判别规则(5.36)式将等同于(5.37)式,即等同于1j1,()maxTTjjjjkxxxlClC若(5.37)实际应用中,以上各式的u和(1,2,,)ak一般是未知的,需要通过样本进行估计,12,,,kuuu可用(1)(2)(),,,kxxx来估计,1,2,,k的估计可分两种情况;当12,,,k可采用联合协方差矩阵PS进行估计;当1,2,,k不全相等时,可采用组内协方差矩阵12,,,kSSS分别进行估计。若对x来自那一组的先验信息一无所知,则可认为121/kqqqk。5.1.4Bayes判别模型的求解由假设知,这些数据服从正态分布,且符合一般规律,可认为12。利用procdiscrim过程(见附录),计算广义平方距离函数:12()()()ln||2ln,1,2,...,TaaaaaDxxxqak(5.38)并计算后验概率:221exp[0.5()](|),1,2,...exp[0.5()]aakaadxPxakdx(5.39)由SAS程序得出的图(见附录)看出,结果如下表:(设有病为“1”,健康为“2”)表5.29病例号判断结果准确结果病例号判断结果准确结果111312221132123113322411342251135226113622711372281138129113912101140221111412212114222131143221411442215114522161146221711472218114822191149222011502221115122221152222311532224115422251155222611562227115722281158222911592230116012通过对上表的观察可知,在1-30号病例中没有误判,在对31-60号病例的判断中存在误判,误判分别为32、38、39、60号。5.1.5问题一的检验与简单模型的选择综述以上两种判别方法,可以得到它们各自的正确率,如下表:表5.3元素判别Bayes判别30例病人的准确度90%100%1030例健康人的准确度100%86.67%总人数准确度95%93.33%从表中的结果可以明显看出元素判别教Bayes判别更为准确,但考虑到元素判别受环境影响较大不利于诊断,且元素判别中对确诊的病人存在误判,不利于及时治疗,而Bayes判别模型对确诊病人不存在误判,所以我们认为Bayes判别模型是这两种判别模型更为合理且简便的模型。5.2问题二的求解问题二要求我们运用问题一中提出的简便判别方法,判别15名就诊人员是否患有该种疾病。我们采用模型一中的Bayes判别法进行判别,运用SAS软件(代码详见附录四)处理这15名就诊人员的化验结果,得到结果(见附录五),再将结果整理如下:即患者共9人,健康者共6人。5.3问题三的模型建立与求解5.3.1主成分分析模型的建立在诊断病人是否患肾炎时,通常要化验人体内7种元素的含量,即问题进行主成分分析的原指标有)7(pp个,记为),2,1(pjxj

1 / 20
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功