止痛剂疗效评价预测

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1题目:止痛剂疗效评价预测摘要随着现代科学技术的发展,医学方面的技术也大步前进,给人们的带来了很多帮助,减轻了许多病痛。某医药公司本着减少病痛患者的疼痛研制了一种新的止痛药,现通过医药实验来预测其疗效。本文根据该公司的医药实验所提供的数据进行深究,以得出一种模型来预测对于不同服药剂量、不同性别以及不同血压的病人服用该药起作用所需要的时间。这是一个多元线性回归问题,通过对该题题意的探究,我们采用统计回归方法进行解决。我们先用软件画出图中所给数据的散点图,可以分析出需要采用2次项来建立模型,如图4.3.2。再根据对该问题的初步认识建立一个基本模型:2011223341yaaxaxaxax,用MATLAB软件解出模型,再通过残差图两次剔除数据并且回归,得到最终结果,其最佳模型为:2123155.81218.09627.13116.38680.4025yxxxx,虽然模型看起来可用,但是作为药物,其适用范围只有85.14%,因此再考虑模型改进。在改进模型中,我们对几组变量均采用了0—1变量,以增加精确度。和基本模型相同,我们所建立的改进后的模型为:2011223344516127138149231024yaaxaxaxaxaxaxxaxxaxxaxxaxx,还是采用MATLAB软件来解出模型,由于残差图中存在异常数据,剔除再回归,若还是有异常数据,再剔除,再回归。通过三次回归,得到的最终结果如表5.2.4,此时其适用范围可以达到99.45%,所以最佳模型为改进后的模型,即:212341121314232471.654412.42915.964711.43076.41840.66941.76612.21650.00131.57971.4122yxxxxxxxxxxxxxxx,对于该模型,只需要了解病人情况,获得1234,,,xxxx的值代入模型就可以知道其病痛开始减轻的时间了。本文具有一定的实用性和科学合理性,只要该公司所给数据是真实可信的,那么可以在新药推广中实践。关键词:多元线性回归统计回归方法残差图模型改进0-1变量2一、问题重述一个医药公司的新药研究部门为了掌握一种新止痛剂的疗效,设计了一个药物实验,给患有同种病痛的病人使用这种新止痛剂的以下4个剂量中的某一个:2g,5g,7g和10g,并记录每个病人病痛明显减轻的时间(以分钟计)。为了解新药的疗效与病人性别和血压有什么关系,试验过程中研究人员把病人按性别及血压得低,中,高三档平均分配来进行测试。通过比较每个人病人的血压历史数据,从低到高分成三组,分别计作0.25,0.50,0.75。实验结束后,公司的记录结果见下表(性别以0表示女,1表示男)。请你为公司建立一个模型,根据病人用药的剂量、性别和血压组别,预测出服药后病痛明显减轻的时间。病人序号病痛减轻时间/min用药剂量/g性别血压组别135200.25243200.50355200.75447210.25543210.50657210.75726500.25827500.50928500.751029510.251122510.501229510.751319700.251411700.501514700.751623710.251720710.501822710.7519131000.252081000.502131000.7522271010.2523261010.502451010.75二、基本假设31、假设病人没吃其他止痛药;2、假设题目所给的数据真实可信;3、假设题目所给的调查结果能够反映止痛药对所有病人的效果;4、假设服用止痛剂前后,病人未服用其他抑制止痛药效果的药物。三、符号说明符号含义单位备注y病痛减轻时间min1x用药剂量g2x性别女-0,男-13x血压组别4x随机误差ia待估计的回归系数0,1,,10i四、问题分析4.1问题背景随着现代科学技术的发展,医学方面的技术也大步前进,给人们的带来了很多帮助,减轻了许多病痛。医药公司在确定药物使用剂量之前,都要进行药物实验,以防剂量服用不当而产生副作用。根据药物实验所取得的数据要进行详细分析,得出不同性别和血压的人最佳服用时间、剂量,以保证病人的安全。4.2概念分析止痛药,部分或完全缓解疼痛的药物。根据疼痛程度、规律及首次有效止痛时间,应按时给予止痛药,以保持药物在血液中的浓度,将疼痛刺激控制在痛阈之下。根据实际需要,在确保安全的前提下,药物剂量由小到大,直到病人止痛为止。比如恨不得病马上好,擅自加大药量;或者不把吃药当回事,想起来吃点,想不起来就算了,或者两次药并成一次吃,都是不对的。4.3数据分析要对该题深入了解,首先是要先进行数据分析,以便确定模型方向。根据题中所给数据,画出的123,,yxyxyx散点图如下:1yx(图4.3.1):图4.3.1423456789100102030405060由上图可知:y对1x可用二次函数拟合,拟合后如图4.3.2。图4.3.22345678910010203040506052yx(图4.3.3):图4.3.300.10.20.30.40.50.60.70.80.9101020304050603yx(图4.3.4):图4.3.40.250.30.350.40.450.50.550.60.650.70.7501020304050606由以上散点图可以知道在模型建立中要采用2次项才能保证模型的可靠性。4.4问题分析本问题是一个在新药推广中,医药公司的新药研究部门设计了一种药物给患有同种疾病的病人使用后,根据病人的用药剂量、性别和血压组别,预测病痛时间减轻多少的统计回归问题。针对这个问题,我们采用了两种方法解答,并且用MATLAB软件的Regress求解。五、模型的建立与求解5.1问题的模型建立与求解根据题意需要,设201x,女,男根据散点图的分析,可以知道y对1x可用二次函数拟合,所以有:201121yaaxax,而y对2x、3x可用线性模型表示:012yaax和013yaax,所以y与123,,xxx之间的多元线性回归模型为:2011223341yaaxaxaxax用MATLAB求解得到数据如表5.1:表5.1.1参数参数估计值参数置信区间0a63.1291[48.717377.5409]1a-10.2706[-14.9243-5.6169]2a5.6667[-0.021311.3546]3a-1.5000[-15.432512.4325]4a0.5111[0.13190.8903]R2=0.8275F=22.7903P=0.0000S2=44.3109由表5.1可以看出,因变量y的82.75%由模型确定,拟合度不高,0.05p,F值远超临界值,所以模型整体来看是可用的,但23,aa的置信区间含有零点,7这两个个系数的解释是不可靠的。所以要对模型进行残差分析,首次回归所得图形如图5.1:图5.1.15101520-20-15-10-505101520ResidualCaseOrderPlotResidualsCaseNumber出现两个异常数据,剔除第3和第24个数据后再次回归,结果如表5.1.2:表5.1.2参数参数估计值参数置信区间0a58.3561[46.002870.7094]1a-9.6490[-13.7231-5.5748]2a8.1419[3.188813.0950]3a-1.6471[-14.139410.8453]4a0.5078[0.17650.8392]R2=0.8594F=25.9679P=0.0000S2=29.80023a的置信区间还是含有零点,再次进行残差分析,如图5.1.2:图5.1.28246810121416182022-15-10-5051015ResidualCaseOrderPlotResidualsCaseNumber剔除第五个异常数据再次回归,结果如表5.1.3:表5.1.3参数参数估计值参数置信区间0a55.8121[44.391867.2324]1a-8.0962[-12.0605-4.1320]2a7.1311[2.553911.7083]3a-6.3868[-18.53485.7612]4a0.4025[0.08690.7181]R2=0.8514F=22.9153P=0.0000S2=24.1056残差图见图5.1.3:图5.1.392468101214161820-15-10-5051015ResidualCaseOrderPlotResidualsCaseNumber此时,该模型在大程度上都有了提升,也无异常数据,模型基本可用。所以最佳模型为:2123155.81218.09627.13116.38680.4025yxxxx模型似乎可以使用了,但是为了得到更准确的模型,我们将对其进行改进。5.2模型的改进现对模型进行改进,在这里增加一个0—1变量:201x,女,男3.x1,血压高(075)0,其他4.x1,血压中(050)0,其他所以血压低(0.25)时可以用340,0xx表示,血压中用431,0xx表示,血压高用341,0xx表示。5.2.1线性回归假设用药剂量、性别、血压组别无交互作用,则10011223344yaaxaxaxax用MATLAB求得以下数据:参数参数估计值置信区间0a49.3652[39.730858.9996]1a-4.1373[-5.2888-2.9857]2a5.6667[-1.047912.3812]3a-0.7500[-8.97367.4736]4a-2.3750[-10.59865.8486]0.75962RF=15.0126p=0.000061.74952s由此可见:234,,aaa置信区间都包含零点,解释不可靠,而且2R明显偏低,2s又偏高,所以该线性模型不可用。5.2.2增加交互项假设方程:2011223344516127138149231024yaaxaxaxaxaxaxxaxxaxxaxxaxx首次回归,用MATLAB解得数据如表5.2.1:表5.2,1参数参数估计值参数置信区间0a56.2761[45.972166.5802]1a-9.2951[-12.2689-6.3213]2a2.2500[-6.939711.4397]3a24.3382[13.889934.7866]4a2.9706[-7.477813.4190]5a0.5111[0.28330.7389]6a1.0000[-0.17182.1718]7a-3.7647[-5.1999-2.3295]118a-0.6618[-2.09700.7734]9a-5.0000[-13.36853.3685]10a-2.7500[-11.11855.6185]R2=0.9600F=31.2308P=0.0000S2=15.0053由表5.4可以看出:由表二可以看出:2468910,,,,,aaaaaa置信区间都包含零点,再看残差图图5.2.1:图5.2.15101520-10-8-6-4-20246810ResidualCaseOrderPlotResidualsCaseNumber第1组和第23组数据出现异常,剔除后回归。再次回归,得到的数据见表5.2.2:表5.2.2参数参数估计值参数置信区间0a60.3492[47.554973.1435]1a-9.4786[-12.4356-6.5215]2a1.0011[-8.227710.2298]3a19.2994[9.344729.2541]124a2.1418[-9.101713.3853]5a0.4913[0.29850.6841]6a0.8599[-0.22921.9491]7a-3.2731[-4.4996-2.0466]8a-0.8718[-2.32190.5782]9

1 / 18
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功