2012秋硕士研究生《医学统计学》试题姓名:学号:专业:成绩:答题要求:1、试题中用到的数据文件为真实数据,请勿用来发表论文,否则后果自负。2、试卷于2013年1月7日-1月8日,由各专业班长统一将作业收齐后,将A4打印的纸质版交到公共卫生学院流行病与卫生统计学研究所401A办公室。3、答案中如果有表格,则表格统一要整理成类似于论文所需的格式,并且要做必要的解释说明。不能将SPSS软件分析的结果直接粘贴为答案。4、请勿抄袭,谢谢!一、请参考数据文件“data1.sav”,完成以下作业。1、请比较四组病人在年龄、性别、细胞体积、细胞宽度、血小板、心直径1、心直径2、吸烟率有无差异。(要求:请列出统计表格(要求整理成论文需要的格式)、检验统计量、概率P以及标明两两比较结果。并在统计表下注明用什么统计方法)2、请完成细胞宽度与心厚度1、心厚度2、心直径1、心直径2间的相关分析。3、方差分析应用的重要条件之一就是要求数据要满足正态分布,请以血糖为例,检验血糖是否满足正态分布。4、将组别变量中的“0”看做对照组,1、2、3分别表示患病的严重程度,请问患病的严重程度与细胞宽度之间有无关系5、将组别中的第0组看做对照组,非0组看做病例组,请分析影响发病的危险因素是什么?二、请参考数据文件“data2.sav”,完成重复测量方差分析并根据参考文献,完成同组不同时间点两两比较和同时间点不同组两两比较并列出统计表格。(邱宏等,《用SPSS11.0实现对重复测量资料的方差分析》,数理医药学杂志,2006,19(2):162-165)三、请参考数据文件“data3.xls”,完成下列任务。1、将Excel文件转化为SPSS文件;2、请问不同化疗方案的分化程度有无差异,如果有差异,请做多重比较。四、请参考数据文件“data4.sav”(x表示年末人口数),完成下列作业1、请拟合恰当的曲线,并写出曲线方程以及评价曲线方程拟合效果的关键指标;2、利用上面建立的曲线方程,预测到2008年末该地区有多少人口数。五、有学者认为血清中低密度脂蛋白增高和高密度脂蛋白降低,是引起动脉硬化的一个重要原因。现测量了30名被怀疑患有动脉硬化的就诊患者的载脂蛋白AⅠ、载脂蛋白B、载脂蛋白E、载脂蛋白C、低密度脂蛋白中的胆固醇、高密度脂蛋白中的胆固醇含量,资料如下表17所示。表130名就诊患者血清中低、高密度脂蛋白中的胆固醇含量及载脂蛋白的测量结果序号载脂蛋白AⅠ载脂蛋白B载脂蛋白E载脂蛋白C低密度脂蛋白高密度脂蛋白(mg/dl)(mg/dl)(mg/dl)(mg/dl)(mg/dl)(mg/dl)X1X2X3X4Y1Y211731067.014.71376221391326.417.81624331981126.916.71348141181387.115.7188395139948.613.613851617516012.120.321565713115411.221.51714081581419.729.61484291581377.418.219756101321517.517.211337111621106.015.9145701214411310.142.88141131621377.220.718556141691298.516.715758151291386.310.1197471616614811.533.415649171851186.017.515669181551216.120.415457191751114.127.214474201361109.426.09039211531338.516.921565221101499.524.71844023160865.310.811857241121238.016.612734251471108.518.413754262041226.121.012672271311026.613.413051281701278.424.713562291731238.719.0188853013213113.829.212238(1)试分别求Y1,Y2对X1,X2,X3,X4的线性回归方程,并作分析。(2)用向前法、向后法和逐步回归法选择自变量看结果是否一致。(3)作Y2/Y1对X1,X2,X3,X4的逐步回归分析,并与前面的分析结果进行比较。(4)根据上面的分析,从专业上用文字扼要地叙述最后的分析结果。