肾炎诊断问题分析摘要本文解决的是如何根据就诊者体内各种元素的含量,判别就诊者是否患有肾炎,并找出影响人们患肾炎的主要因素,以便减少化验的指标,减少检查费用。为解决此问题,我们建立了加权马氏改进模型和模糊模式识别模型来判别就诊者是否患有肾炎,并用神经网络对这两个模型的检验结果进行验证;建立了fisher判别模型找出影响人们患肾炎的主要因素。对于问题一:我们建立了加权马氏距离判别模型和模糊模式识别模型来验证1-60号就诊人员的健康状况,然后与实际情况对比,得出这两种模型的准确度都达到了93.33%.对于问题二:我们用问题一中的两种方法对就诊人员进行判别。用加权马氏判别法得到14人患有肾炎,用模糊模式识别得到11人患有肾炎。两种判别方法都得出:病例号为61,62,64,65,66,67,68,69,72,73,76的就诊人员为肾炎患者,但对病例号为79,83,85的就诊人员判断不一致,用加权马氏判别模型判断,认为79,83,85号为患者,但用模糊模式识别模型判断这三位是健康的。对于问题三:我们通过fisher判别法得出每种元素对人们患肾炎的影响权重。发现将K,Zn,Fe三种元素剔除后,对结果的检验准确度仍能达到93.3%,将Na剔除以后准确度变为90.0%,所以我们认为Na,Mg,Cu,Ca的含量是影响人们患肾炎的关键因素。对于问题四:我们由第三问得到的结论,把影响人们患肾炎的关键元素作为主要指标,重复问题二的过程,得到的结果是61,62,64,65,66,67,68,69,72,73,76的就诊者为肾炎患者,病例号为79,83,85的就诊人员仍然不能确定。对于问题五:我们将问题二和问题四中的结果进行横向和纵向对比,发现加权马氏改进法和模糊模式识别在剔除了K,Zn,Fe三种元素后,对于待检验的61-90号就诊人员,患肾炎的病号和健康病号没有发生变化,说明我们对影响人们患肾炎的关键因素的判断很准确。关键词:加权马氏距离判别模糊模式识别fisher判别神经网络1.问题重述.人们到医院就诊时,通常要检测一些指标来协助医生诊断。我们判断人员是否患肾炎是通过分析人体内各种元素含量来确定的。对于就诊人员说而言不希望自己的病情被误判,所以我们应该确定精确的检测方法。本文我们就如何判断前来就诊人员是否患有肾炎,建立数学模型。有题目所给数据我们可以看出,60位已经诊断的病例号的体内元素含量,其中1-30号病例是已经确诊为肾炎病人的化验结果;31-60号病例是已经确诊为健康人的结果。另外还有61-90号为待检验的就诊患者。需要解决的问题有:问题一:根据表B.1中的数据,提出一种或多种简便的判别方法,判别就诊人员是属于患者或健康人,并检验你提出方法的正确性。问题二:按照1提出的方法,判断表B.2中的30名就诊人员的化验结果进行判别,判定他(她)们是肾炎病人还是健康人。问题三:能否根据表B.1的数据特征,确定哪些指标是影响人们患肾炎的关键或主因素,以便减少化验的指标。问题四:根据3的结果,重复2的工作。问题五:对2和4的结果作进一步的分析。2.问题假设(1)假设题目所给的数据合理正确(2)假设肾炎患者体内各种元素的含量受其他疾病的影响较小;(3)假设医院所用的仪器准确度很高,对各种元素在人体内的含量测得的值很准确;(4)假设用于判断肾炎患者的七种元素,不受人体内其他元素或化合物的影响。3.符号说明A1表示肾炎患者的模糊集合A2表示健康人体的模糊集合A1(xi)表示样本变量xi与A1的隶属度A2(xi)表示样本变量xi与A2的隶属度xii=(1,2…7)分别代表7种不同元素含量δ(xi,A1)表示xi与A1的格贴近度δ(xi,A2)表示xi与A2的格贴近度AB表示A与B的内积AB表示A与的B外积X样本L1(X,A1)样本X到A1的距离L2(X,A2)样本X到A2的距离u130个肾炎病人样本各元素的均值向量u230个健康人样本各元素的均值向量y0Fisher模型中求得的临界值1y肾炎患者这类样品的“重心”2y健康这类样品的“重心”1x肾炎患者样本各个元素的均值向量2x健康样本各个元素的均值向量4.问题分析此题研究的是如何判断就诊人员是否患有肾炎。在医院就诊时,一般情况下医生是通过就诊人员的尿液的化验结果来判断该就诊人员是否患有肾炎。本题中就是通过分析病人的尿液中各元素的含量来判断的,我们要对这些数据进行分析处理,寻求好的判别方法,判断前来就诊的人员是否患有肾炎。针对问题一,题目中已经给出30个肾炎患者与30个健康者体内7种元素的含量,现在所要做的是,如何根据这些数据提出一种合理的诊断方案。通过分析,我们确定两种比较好的方法来判别病例号是否患有肾炎。方法一:采用改进后的加权马氏距离判别法,即在马氏距离判别法的基础上,对每种不同的指标确定合适的权重从而提高准确度的方法,对实际问题进行判别。方法二:将数据划分为两类,分别用两个集合表示。一类为肾炎患者,一类为健康人体,使用模糊论中的模糊模式识别的方法建立模型,达到判别效果。针对问题二,表B.2中给出了30名就诊人员体内各种元素的含量,我们分别应用问题一中建立的加权马氏判别模型和模糊模式识别模型进行判断,然后将两种判断结果进行比较。得出61—90号就诊者的诊断结果。针对问题三,根据表B.1的数据,我们要得到哪些元素是该化验结果的关键指标,即哪些元素在诊断结果中起关键作用。我们重新建立了一个Fisher线性判别模型,求出Fisher系数,按照Fisher模型的理念,依次剔除Fisher系数小的元素,用Fisher判别法对题中给出的1—60号就诊者进行检验,得出正确率。根据正确率的改变,确定出起关键作用的元素。针对问题四,在问题三中我们已经剔除了对肾炎诊断结果起次要作用的元素,选出在诊断中起关键作用的元素。然后我们再运用问题一的加权马氏改进法和模糊模式识别,对61—90号的就诊人员进行判别是否患有肾炎。针对问题五,通过把问题二和问题四中分别运用加权马氏改进法和模糊识别法进行判断的结果进行比较、分析,剔除了次要元素后,61-90号就诊者患肾炎的人员是否发生变化。5.问题一的求解针对问题一,要求我们采用一种或多种方法对前来就诊的人员做初步的判断,我们运用加权马氏判别法(模型一)和模糊识别模型(模型二)寻求了两种判别方法。5.1判别方法一5.1.1模型一的分析对于本题,我们把病人体内含有的7种元素NaKMgCaFeCuZn,,,,,,作为化验结果的样本TxxxX)...,,(721检测的指标,把总体分为肾炎病人1A类和健康人2A类。60个人的化验结果是),...,(721iiiixxxX。我们定义),(11AXL为样本X到1A的距离,),(22AXL为样本X到样本2A的距离,通过比较),(11AXL与),(22AXL的大小来判别样品应该归属于1A类还是2A类。样品X到1A类和2A类的马氏距离分别为:')()(),(111111uXuXAXL')()(),(122222uXuXAXL其中,21,uu,1,2分别为总体1A和2A的均值和协方差。在实际问题中,这些指标往往在判断样本X属于A时,所起的作用不尽相同,其重要性存在差异。因此,马氏距离夸大了一些微小指标的作用。如果不对指标的重要性进行区别,在判定时,可能造成较大的误判,为了减小这种影响,在马氏距离的基础上,我们需要对重要指标加以区分,因此,我们增加了一个权重W,构造了加权马氏距离判别法。加权马氏距离判别法的原理:马氏距离判别法是用待判别样本TmxxxX),...,,(21到各总体tAAA...,,21的距离远近作为测量尺度来判别其归属的一种直观判别方法。为了提高这种方法对实际问题进行判别时的准确程度,在马氏距离判别法的基础上,对不同的指标加入不同的权重,合理的分配各种指标对问题的影响,这就是加权马氏距离判别法。5.1.2模型一的建立对原始指标数据的标准化我们采集7维随机向量TXXXX),...,(721)7,...,2,1)(,...,(721iXXXXiiii是题中给出的60个人的化验结果,607,所以我们构造样本阵,对样本进行如下标准化变换:jijijjXXZS1,2,...60;1,2,...7ij其中1nijijXXn,1)(212nXXSjijniJ,从而可以计算出Z.求标准化阵Z的相关系数矩阵加权马氏距离判别法对马氏距离判别法的改进主要取决于权重的选取,权重选取是否得当影响加权马氏距离判别法的准确度。在该实际问题中我们确定权重1TtZZWn,其中0EW。我们可以解这个样本相关矩阵W的特征方程0EW,得到7个特征根。确定加权的马氏距离根据我们所求得的权重W,可以确定加权后的马氏距离为:')()(),(11111uXWuXAXLT')()(),(122212uXWuXBXLT式中2112 ,,,uu分别是A和B的均值和协方差。5.1.3确定判别函数在马氏距离判别法中,我们一般通过比较),(11AXL与),(22AXL的大小来判别样品应该归属于1A类还是2A类。为了便于对结果进行直观的观察和统计,我们将判别函数y定义为),(11AXL与),(22AXL的差值。那么我们确定的判别函数为:),(),(2211AXLAXLy=)()()()(21221111uXWuXuXWuXTT0y说明样本到1A类的距离大于到2A类的距离所以应该属于1A类即肾炎患者;0y说明样本到1A类的距离小于到2A类的距离所以应该属于2A类即健康人。5.1.4运用模型一进行检验根据上述建立的加权马氏距离判别法,我们运用matlab软件(代码见附录二)对题目中给出的病例号为1—60的就诊人员进行检验,检验结果整理如下表(1):表(1):运用加权马氏距离判别法对1—60号进行检验的结果病例号实际检验结果1—30肾炎患者18,19号误判为健康31—60健康38,41号误判为肾炎5.1.5模型一的检验分析由表(1)中的检验结果可以看到在给出的60个病例号中,我们将18,19,38和41号判断错误,也就是说我们所建模型一对于该实际问题的检验准确度为:604100%93.33%.60既然我们所建立的模型有这么高的准确度,为什么这四个病例号会误判呢?我们对检验结果进行分析。运用excel分别求出1—30号和31—60号七种元素的平均值,并与18,19,38和41号就诊人员体内元素含量进行比较,见图(1)和图(2)。图(1):1—30号体内各元素含量与均值比较图(2):31—60号体内各元素含量与均值比较由图我们发现,19号体内Cu元素的含量为20.7接近健康人的体内Cu含量,但远高于肾炎病人体内的Cu含量;41号体内Cu元素的含量为8.00肾炎患者体内Cu含量很接近,但远低于健康人体内的Cu含量;18号体内Fe元素含量太低,而41号体Fe元素含量太高;这四个人体内Ca元素和Mg元素的含量都很异常,按照均值推断,正常情况应该是患者体内这两种元素的含量远远低于健康人体内的含量,但事实刚好相反。由此我们可以推断这七种元素对肾炎患者的诊断有主次区别,对于这四位误判的检验分析可以得出,Zn元素和K元素可能起次要作用。5.2判别方法二5.2.1模型二的分析先用excel对表B.1所给数据进行处理,处理结果见下表(2):表(2):1到60号的数据分析1—30平均置信区间31—60平均置信区间Zn143.1033[123.0587,163.1479]Zn186.6[175.51,197.68]Cu12.33433[10.0448,14.22]Cu21.92367[13.0534,30.7938]Fe23.06667[17.9325,28.201]Fe62.01167[33.7115,90.3078]Ca698.1667[597.27,799.0594]Ca2511.133[2036.30,2985.95]Mg113.3933[95.90,130.885]Mg29