血样的分组检验数学建模

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

问题一血样的分组检验摘要:本文以血样分组检验为原型,通过建立数学模型,利用概率统计,数学期望值等知识对如何分组检验以及什么情况下需要进行分组检验作出了合理的解释。关键词:血样分组检验,数学模型,概率统计,数学期望值具体问题在一个很大的人群中通过血样检测普查某种疾病,假定血样为阳性的先验概率为p(通常p很小)。为减少检验次数,将人群分组,一组人的血样混合在一起化验。当某组的混合血样为阴性时,即可不经检验就判断该组每个人的血样都为阴性;而当某组的混合血样为阳性时,则可判断该组至少有一人血样为阳性,于是需要对该组的每个人在做化验。(1)当p固定时(0.1%,…,1%,…)如何分组,即多少人一组,可使平均总检验数最少,与不分组的情况比较。(2)当p多大时不应分组检验。(3)当p固定时如何进行二次分组(即把混合血样呈阳性的组再分成小组检验,重复一次分组时的程序)。(4)讨论其他分组方式,如二分法(人群一分为二,阳性组在一分为二,继续下去),三分法等。分析问题本文对血样分组检验建立数学模型,目的就是要找到一种最佳的分组方案,对于一个数量固定的人群(假定人群数量为n人),我们在决定哪一种分组方案最好或者需不需要分组时,可以引入数学平均值。如果不分组,每个人都参加检验,则总共需要检验n次,每个人平均需要检验一次,如果分组后计算出每个人的平均检验次数小于1次,则认为分组比不分组好,需要分组,反之,则不需要分组;在众多组合的分组中,哪一种分组计算出来的每个人的平均检验次数最小,则认为这种分组时最优的分组方案。这也是数学概率模型的基本思路。在人群(数量很大)中进行血样检验,已知先验阳性率为p,为减少检验次数将人群分组。若k人一组,当k份血样混在一起时,只要一份呈阳性,这组血样就呈阳性,则该组需人人检验;若一组血样呈阴性,则该组不需检验。模型假设结合本问题的实际情况,对该模型作出如下合理的假设:1.人群数量总数为n人;2.先验概率P在检验中为一常量,保持不变;3.每个人检验一次是否阳性的概率相互独立,即每个人接受检验是互相独立事件,互不影响;4.每次分组时都能达到平均分配,能分成m组,即m=n/k,m为正整数。变量说明根据提出的问题和模型假设,给出如下变量:n----被检验人群的总数;m----人群被分成的组数;k----每组的人数;k1----第二次分组时每组的人数;p----先验阳性概率;q=1-p----先验阴性概率;----每个人需要检验的次数,为一随机变量;E----的期望值,每个人需要检验的平均次数。模型建立利用概率统计知识建立数学概率模型,由期望值知道,如果不分组,每个人都参加检验,每个人平均需要检验一次;如果分组,分组后计算出每个人的平均检验次数小于1次,则认为分组比不分组好,需要分组,反之,则不需要分组。在众多组合的分组中,比较哪一种分组计算出来的每个人的平均检验次数最小,平均检验次数最小的那种分组则认为这种分组时最优的分组方案。模型求解问题二:当p多大时,就不需要分组。在分组情况下,由模型假设知每组的人数为k(2kn);变量表示每人的检验次数;阳性的先验概率为p;阴性的先验概率pq1。如果一组检验为阴性,则表明该组中的每个人均不是病毒的感染者,又因为每个人是否是感染是相互独立的(模型假设),所以可以求得一组检验为阴性的概率为kq,即该组中的每个人平均检验次数为k1次(该组总共只检验了一次)。如果一组检验为阳性,则表明该组中有病毒感染者,因为一组检验为阴性的概率为kq,所以一组检验为阳性的概率为kq1(一组检验要么为阴性,要么为阳性),即该组中的每个人平均检验次数为k11次(除了该组检验了一次外,该组中的每个人又被逐个检验一次)。所以可以得到的分布律为:次数k1k11概率Pkqkq1由上表可求得的期望值E:111(1)(1)1kkkEqqqkkk即每个人的平均检验次数为11kqk次,人群(总共n个人)的平均检验次数为)11(kqnEnk次。由概率模型知,只有当1E时才需要分组,即分组检验要满足1E这个约束条件:由E11111111kkkkqqppkkkk即只有当满足约束条件11kpk才需要分组检验。因为k只能取整数,所以11kk是一个离散型变量,为了更形象地讨论问题,故引入与11kk变化趋势相同的连续性函数1()1xpxx,(2xn)对1()1xpxx进行求导,求导过程如下:'''11()(1)()xxpxxx设1xyx则'''1()()xpxyx对1xyx两边求对数有:1lnlnxyx,对1lnlnxyx两边求导有:1''''1111(ln)(ln)(ln())(ln)xxyxxxx即'22221111111ln()lnyxyxxxxxxx1'22222211111111111(ln)(ln)(ln)()xxyyxxxxxxxxxxx所以11'''2221111111()()(ln)()()(1ln)xxxpxyxxxxxxxx即1'211()()(1ln)xpxxxx由此可以看出,当ex时,'()0px,函数1()1xpxx单调递减,而2xe时(分组时每组至少要有2人,故有2x),'()0px,函数1()1xpxx单调递增,在ex时(自然对数e约等于2.71828),'()0px,函数1()1xpxx取得最大值,此时最大值111()11()0.3078eepeee,做出函数)(xp的图像,见下图:p(x)与x的变化关系曲线00.050.10.150.20.250.30.350246810121416xp(x)由于实际检验分组时每组的人数k只能取整数,不可能取自然对数e(自然对数e约等于2.71828),故算出接近最大值()pe的两个实际值:(2)0.292893p(3)0.306639p所以,1()1kpkk的最大值为0.306639,即只有当0.306639p时,通过调整k可以满足分组检验的约束条件11kpk,而当0.306639p时,无论怎么调整k都不能满足分组检验的约束条件11kpk,所以,当0.306639p时,就不需要分组。问题一:当p固定时,k多大可使检验次数最小情况一:当p固定时(0.1%,…,1%,…),并且当0.306639p时,此时不需要分组,即k=1时可使检验次数最小。情况二:当p固定时(0.1%,…,1%,…),并且当0.306639p时,此时需要分组,要使人群总的检验次数最小,只要使每个人检验次数的期望值:111(1)(1)1kkkEqqqkkk最小即可,因为k只能取整数,所以E是一个离散型变量,为了更形象地讨论问题,故引入与11kEqk变化趋势相同的连续性函数连续性函数1()1xfxqx,1()1xfxqx11(1),(2,01)xpxnpx2,2x注:分组时每组人数至少为人故对函数1()1(1),(2,01),xfxpxnpx求导可得:''211()(1(1))(1p)ln(1p)xxfxpxx因为此时p是给定的固定值,故ln(1p)0且ln(1p)为定值,1p0,由上式分析知,当x增大时,(1p)x减小,(1p)ln(1p)x增大,21x也增大,即'21()(1p)ln(1p)xfxx为增函数,即()fx的极值就是()fx的最小值所以'21()(1p)ln(1p)0xfxx的实数解x,就是函数1()1(1)xfxpx取的最小值时对应的x值,由数值解法(利用计算机编程迭代,让x从小到大依次代入等式,当误差在允许的范围内所取得的x值)可解出每一个给定的p所对应的'21()(1p)ln(1p)0xfxx时的实数解x,由于实际检验中每组的人数k只能为整数,所以要对计算出来的x取整(去掉后面的小数部分),取整后记作[x],再比较一下([])fx和([]1)fx,若([])fx([]1)fx,则k=[]x,若([])fx([]1)fx,则k=[]x+1,此时的k值即为每一个给定的p所对应的可使总检验总次数最少的每组人数。下面给出数值解法解出的对于不同的先验概率,相对应的最小检验次数的每组人数:pkpk0.001320.02080.002230.03060.003190.04060.004160.05050.005150.06050.006130.07040.007120.08040.008120.09040.009110.10040.010100.1104问题三:当p固定时如何进行二次分组二次分组是在检验为阳性的组中继续分组,按照假设的变量及另设表示两次分组时每人平均检验的次数,设每人检验一次呈阳性的概率为)1(pqq,若第一次分组时,一组的k个人均为阴性的概率为kq,此时每人平均检验了k1次;若为阳性,此时的概率为kq1,再次分组;第二次分组时,一组全为阴性的概率为1)1(kkqq,此时每个人的平均检验次数为111kk;若为阳性,此时的概率为)1)(1(1kkqq,每个人的平均检验次数为1111kk,由上所述,可得的分布概率为:k1111kk1111kkkq1)1(kkqq)1)(1(1kkqq由此可得:)111)(1)(1()11()1(11111kkqqkkqqkqEkkkkk经过化简得:)111)(1(111kkkqkkqkqE由实际情况知,此时的kk1。为使两次分组的情况优于一次分组的情况,只需EE。经过计算,可得1111kkp。此时发现两次分组的约束条件只是取值范围的不同,下面进行进一步的讨论:情况一:由于kk1时,第二次分组的约束条件在第一次分组的约束条件满足时是能够满足)4(1k,(即使当第一次分组时取使E最小的k值,取4,211kkk,而此条件满足二次分组的约束条件),故在大多数情况下能够进行一次分组时进行二次分组,一定能使检验总次数减少。见下图:假设给定阳性先检验概率为1.0p,油图可以看出在30k时,满足一次分组的约束条件,任意取小于30的值均可减少平均检验次数(相对于不分组情况),只要令151k或更小的值,但满足条件41k,由于此时亦满足两次分组的约束条件,故分量足可以比分一组的平均每人检验次数少。情况二:在一次分组时,取4,2kk时可知,代入到kk11里发现上述两值相等,故在分析情况一时没有考虑4k的情况,实际上,当4k时取21k,取先验概率2929.0p分别代入到分一次组和分两次组的平均每人检验次数的期望中可得1,1241kkEE。由此可见,只要所给的p值小于0.2929,分两次组就比分一次组要好。在此种情况下,还可以计算分两次组时平均每人检验次数的最小值,方法同分一次组时的情况一样,只要进行求导即可。所以不应再分组的先验概率的取值范围是3066.02929.0p。在3k时,经实验发现在p值大于0.28195时,有二次分组的平均化验次数大于一次分组的情况发生,所以当3k,且有306.028195.0p时,不宜在分组;当4,2kk,且有3066.02929.0p时,不宜在分组。问题四:讨论其他分组方式,如二分法、三分法等模型假设:发生概率:xiPi,...,2,1,检验次数:xiRi,...,2,1,患病人数(即血样检验为阳性的人):npz组的基数:每组需要检验的人数平均检验次数:xiiiRPN1阳性血样的分组模型:可分为x组,每组k人:xiirrr,...,,分组要满足的条件:zrrrrrrrrxx......321321当kz时,通过这样的分组模型可以使检

1 / 14
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功