脑卒中发病环境因素分析及干预模型(全国一等奖)

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1脑卒中发病环境因素分析及干预摘要目前,脑卒中(俗称脑中风)是威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。该病的诱发已被证实与环境因素,包括气压、气温和湿度之间存在密切的关系。本文旨在进行疾病的风险评估,对脑卒中高危人群及时采取干预措施,也让尚未得病的人了解自己得脑卒中的风险程度,做好预防。分析了脑卒中的发病环境因素;同时,通过建立数据模型,掌握该病发病率的变化规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。针对问题一,首先,根据处理附件中所给的数据统计不同性别的发病人数,绘制出发病人数的性别分布饼图,发现女性脑中风发病率低于男性;其次,将不同年龄段的发病人数统计出来,绘制出发病人数的年龄分布直方图,基本符合正态分布,表明患病人群的年龄主要集中于50~90岁,为高危发病人群;再次,将8类职业的发病人数统计出来,绘制出发病人数的职业分布直方图,显示发病人群中农民的发病率明显高于其他7类职业,为高危发病人群;最后,将2007~2010年的各月的发病人数统计出来,绘制出了各年发病人数随月份变化的折线图,直观显现各年发病率的变化趋势。针对问题二,首先,以2007年为例,分别绘制出该年各月的发病率和该月的平均气压、平均气温以及平均相对湿度的折线图,直观上得出发病率和气压、温度以及相对湿度的关系;再次,分别建立非标准化和标准化的面板数据(PanelData)回归模型,得到2007年发病率受气温、气压、相对湿度的影响程度依次递减;最后,利用MATLAB统计工具箱建立并比较3种多元二项式回归模型及多元线性回归模型,分别根据2007~2010年的数据建立剩余标准差最接近于0的多元二项式回归模型,依次为多元交叉二项式回归模型、完全二次多元二项式回归模型、完全二次多元二项式回归模型和纯二次多元二项式回归模型,显著性均比面板数据回归模型(即多元线性回归模型)好。针对问题三,我们充分运用各种资源查阅和搜集脑卒中高危人群的重要特征和关键指标,根据这些重要特征和关键指标,并结合问题一、二中所得结论,对高危人群提出了预警和干预的具体建议方案,以便预防和控制脑卒中的发生,抑制该疾病的不合理增长。关键词统计描述正态分布面板数据回归模型多元二项式回归模型MATLAB软件21问题重述脑卒中(俗称脑中风)是目前威胁人类生命的严重疾病之一,它的发生是一个漫长的过程,一旦得病就很难逆转。这种疾病的诱发已经被证实与环境因素,包括气温、气压和湿度之间存在密切的关系。对脑卒中的发病环境因素进行分析,其目的是为了进行疾病的风险评估,对脑卒中高危人群能够及时采取干预措施,也让尚未得病的健康人,或者亚健康人了解自己得脑卒中风险程度,进行自我保护。同时,通过数据模型的建立,掌握疾病发病率的规律,对于卫生行政部门和医疗机构合理调配医务力量、改善就诊治疗环境、配置床位和医疗药物等都具有实际的指导意义。数据(见Appendix-C1)来源于中国某城市各家医院2007年1月至2010年12月的脑卒中发病病例信息以及相应期间当地的逐日气象资料(Appendix-C2)。要求根据题目提供的数据,回答下列问题:问题一:根据病人基本信息,对发病人群进行统计描述。问题二:建立数学模型研究脑卒中发病率与气温、气压、相对湿度间的关系。问题三:查阅和搜集文献中有关脑卒中高危人群的重要特诊和关键指标,结合问题一、二中所得结论,对高危人群提出预警和干预的建议方案。2问题分析2.1问题一的分析从附件Appendix-C1中的数据表,可以看出:病人信息包括性别、年龄、职业、发病时间以及诊断报告时间。通过分析,诊断报告时间意义不是很大,因此只需对病人的性别、年龄、职业和发病时间进行统计描述即可。处理附件data1.xls、data2.xls、data3.xls以及data4.xls中的数据,将不同性别的发病人数统计出来,绘制出发病人数的性别分布饼图;将年龄划分为8个年龄段,将不同年龄段的发病人数统计出来,绘制出发病人数的年龄分布直方图;将每个职业的发病人数统计出来,绘制出发病人数的职业分布直方图;将2007~2010年的每个月的发病人数统计出来,绘制出每一年发病人数随月份变化的折线图。观察分布图,分析统计出来的各项数据是否服从正态分布。2.2问题二的分析问题一中,已经将2007~2010年每个月的发病人数统计出来了,再处理附件data5.xls中的数据,分别将2007~2010年的每个月的平均气压、平均气温、平均相对湿度统计出来。发病率计算方法如下:第i年第j月份的发病率=第i年第j月的发病人数÷第i年总的发病人数分别绘制出2007年各月的发病率和该年各月的平均气压、平均气温以及平均湿度的折线图,同理可以绘制出2008年、2009年和2010年的折线图。由此可以直观地看出发病率和气压、温度以及相对湿度的关系。建立三个模型,第一个模型:以第i年(i=2007~2010)的平均气压、平均气温和平均相对湿度作为自变量,第i年的发病率作为因变量,建立第i年的非标准化面板数据模型,求解模型可以得到第i年的发病率和该年的平均气压、平均温度以及平均相对湿度之间的多元线性回归关系;第二个模型:将平均气压、平均温度以及平均湿度分别3进行标准化,运用上述方法得到第i年的标准化面板数据模型;第三个模型:建立上述因变量和三个自变量的多元二次二项式回归模型。根据以上建立的三个模型,可以从数值理论上分析出脑卒中发病率和三个环境因素的之间的关系,并对得到的模型进行显著性检验。2.3问题三的分析充分运用各种资源查阅和搜集脑卒中高危人群的重要特征和关键指标,根据这些重要特征和关键指标,并结合问题一、二中所得结论,对高危人群提出预警和干预的建议方案。3模型假设假设1:忽略缺失数据和错误数据的影响;假设2:这里所有时间衡量以发病时间为准,不考虑诊断报告时间;假设3:某年某月的脑卒中发病率为该年该月的发病人数/该年全年的发病人数;假设4:每月的平均气压、平均气温、平均相对湿度是该月每天的气压、气温、相对湿度的平均值的平均;假设5:把发病人群分为8个年龄段:30岁以下、31~40岁、41~50岁、51~60岁、61~70岁、71~80岁、81~90岁和90岁以上。4符号说明符号说明发病人群按照年龄分布的均值发病人群按照年龄分布的标准y1212[,,...,]Tyyyy,jy表示某一年第j月的发病率1x11,11,21,12[,,...,]Txxxx,1,jx表示某一年第j月的平均气压2x22,12,22,12[,,...,]Txxxx,2,jx表示某一年第j月的平均气温3x33,13,23,12[,,...,]Txxxx,3,jx表示某一年第j月的平均相对湿度A0123[,,,]TAaaaa,ia表示非标准化面板模型的第i个回归系数y200712*1的矩阵,第i行表示2007年第i各月的发病率y200812*1的矩阵,第i行表示2008年第i各月的发病率2008年的发病率y200912*1的矩阵,第i行表示2009年第i各月的发病率2009年的发病率4y201012*1的矩阵,第i行表示2010年第i各月的发病率2010年的发病率R2回归模型统计量中的相关系数F回归模型统计量中的方程显著性检验α回归模型统计量中的显著性水平,本文默认值为0.05RMSE回归模型统计量中的均方误差y1212[,,...,]Tyyyy,jy表示某一年第j月标准化后的发病率1x11,11,21,12[,,...,]Txxxx,1,jx表示某一年第j月标准化后的平均气压2x22,12,22,12[,,...,]Txxxx,2,jx表示某一年第j月标准化后的平均气温3x33,13,23,12[,,...,]Txxxx,3,jx表示某一年第j月标准化后的平均相对湿度A0123[,,,]TAaaaa,ia表示非标准化面板模型的第i个回归系数yy数组的均值ixix的均值,其中,i=1,2,3ySy数组的标准差ixSix数组的标准差,其中,i=1,2,35模型的建立与求解5.1问题一的求解5.1.1按照性别对发病人群进行统计描述先用EXCEL处理附件data1.xls、data2.xls、data3.xls以及data4.xls中的数据,将发病人数按照男、女分别进行统计,得到数据见表1:表1男性和女性的发病人数(单位:人)性别男性女性发病人数3338528526再根据统计出来的数据,运用MATLAB软件编程(源程序代码见附录1)绘制出发5病人群按照性别分布的饼状图[1,2],如图1所示。图1发病人群的性别分布饼状图图2发病人群的职业分布直方图由此可见:脑卒中发病人群中,女性发病率低于男性。这与文献[3]中所给结论一致。5.1.2按照职业对发病人群进行统计描述运用EXCEL对附件Appendix-C1中的数据进行处理,将脑卒中发病人群按照8类职业(农民、工人、退休人员、教师、渔民、医务人员、职工、离退人员)进行统计,所得数据见表2:表28类职业的发病人数(单位:人)职业农民(1)工人(2)退休人员(3)教师(4)发病人数2974248476644216职业渔民(5)医务人员(6)职工(7)离退人员(8)发病人数66907351751根据表2,使用MATLAB软件(源程序代码见附录1)绘制出发病人数按照上述8类职业分布的统计直方图[1,2],如图2所示。图2直观地反映出,在所有发病人群中农民的发病率明显高于其他7类职业;退休人员的发病率仅次于农民,但约为农民工的1/4;工人的发病率稍低于退休人员;其他五类职业从业人员的发病率较低,从高至低依次为:离职人员-职工-教师-医务人员-渔民。农民的工作环境相对恶劣,加之发病率受环境因素(例如,空气质量)影响较大,因此农民的发病率很高。5.1.3按照年龄段对发病人群进行统计描述将发病人群的年龄分为8个年龄段:30岁以下、31~40岁、41~50岁、51~60岁、61~70岁、71~80岁、81~90岁和90岁以上。再运用EXCEL处理附件Appendix-C1中的数据,将脑卒中发病人群按照8个年龄段分别进行统计,所得数据见表3:表38个年龄段的发病人数(单位:人)年龄段30岁以下(1)31~40岁(2)41~50岁(3)51~60岁(4)发病人数51386130328427年龄段61~70岁(5)71~80岁(6)81~90岁(7)90岁以上(8)6发病人数142482035810295798根据表3,使用MATLAB软件(源程序代码见附录1)绘制出上述8类职业发病人数的分布直方图,如图3所示。然后使用MATLAB软件(源程序代码见附录1)将直方图的边界曲线使用四次多项式曲线拟合出来,如图4所示。观察图3和图4可以发现,第6年龄段(71~80岁)的发病人数最多,其次是第4、5、7年龄段(51~60岁、61~70岁,81~90岁),高危人群主要集中在51~90岁之间。发病人数以第6年龄段为中心,逐次向两边降低,在统计学上符合正态分布2(,)N。使用MATLAB软件命令mean和std可以求解出该正态分布的均值7316.5和标准差7339.1。由于标准差很大,说明数据分布波动剧烈,每个年龄段的发病人数差距较大。图3发病人群的年龄分布直方图图4发病人群年龄分布的拟合曲线5.1.4按照发病时间对发病人群进行统计描述按照病人的发病时间,使用EXCEL将2007~2010年每年每月的发病人数进行统计,所得数据见表4:表42007~2010年每年每月的发病人数(单位:人)年份/月份12345620079417321019106910721032200818241955191817541767148020098708478278608757922010176114881722169918821610年份/月份78910111220071016119712211375120813692008147813681275147113

1 / 23
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功