第十三讲 统计分析的原则与方法

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第十讲统计分析的一般原则与方法第一节数据来源与录入数据分为观察性数据和实验性数据。观察性数据:国家法定卫生工作报表、例如传染病、职业病、医院工作报表。病历资料,分析时要注意其局限性。实验性数据:临床试验或大型调查研究,制定统一的数据采集标准,试验记录、病历和报表要规范、完整、准确、及时,保证质量。要重视对漏报、重报和错误检查,防止伪造和篡改科研资料。编号性别年龄民族体重身高冠心病糖尿病1F68汉56.4169有无2M70汉74.5172无可疑3F80回57.3170无无4F90汉65.6170无有……………………700M71汉66.4170无无表1某地2002年730例65岁以上老年人健康检查记录科研原始数据大多可用统一的数据结构表达,每一行称为一个record或一个case,每列为一个变量,称为数据矩阵。变量分为标识变量(编号)、反应变量和解释变量(分类变量或协变量)。标识变量:编号。其余为分析变量。nosexagenationalityweightheightcoronarydiabetes1168156.4169102070174.5172003180257.3170014190165.617000……………………700171166.417000表2原始数据录入格式第二节数据处理中的几个基本问题一、数据的质量控制软件录入、逻辑检查、统计描述、异常值检查二、变量设置连续变量和离散变量数据化三、缺失值处理缺失值来源于资料收集中的漏报和漏填。其数量不超过10%。缺失值不等于“0”。统计软件中,缺失值定义为“.”。考虑缺失值的填补方法。四、离群数据处理问题离群值是偏离数据主体分布过远,特大或特小值。分析离群值可用频数表或直方图、离箱图的P25或P75过远。若数据是正态分布,可考虑SX5.2第三节统计学方法选择的基本思路科研数据的统计分析,其方法的正确选择尤为重要,它是得到正确可靠统计结论的基本保证。统计方法选择依赖于研究方案的统计学设计,要求研究者根据研究目的确定研究因素、选择观察指标、确定研究对象的样本量,拟定研究实施方法及数据收集、整理、分析的模式,节省人、物、时间。统计方法选择,按照以下步骤进行:第一:反应变量是单、双、或多变量?第二:判断资料类型第三:判断设计方式第四:影响因素是单因素还是多因素?第五:资料是单样本、还是两组、多组样本;第六:判断资料是否符合拟采用的统计分析方法的应用条件一、单变量计量资料分析不满足不满足满足满足σ已知正态性非参数检验变量替换结论不满足单组资料大样本Z检验t检验满足不满足不满足满足满足σ已知正态性非参数检验变量替换结论不满足单组资料大样本Z检验t检验满足配对设计资料两样本均数比较方差齐性?成组t检验非参数检验不满足正态性?变量变换满足满足不满足变量变换t′检验结论多样本均数比较完全随机设计方差分析,见第8章秩和检验,见第11章YN正态性方差齐?多样本均数比较配伍组设计资料配伍组设计方差分析,见第8章FriedmanM秩和检验,见第11章配伍组设计资料其它资料分析方差分析,见第8章交叉设计资料析因设计(可分析交互作用)资料方差分析,见第8章重复测量设计资料重复测量资料的方差分析,见第8章二、单变量计数资料分析两个率总体与样本两个样本单样本Z检验/基于二项分布的确切概率法配对非配对配对χ2(McNemar)χ2/Fisher确切概率法/两样本率Z检验R×C表双向无序单向有序双向有序多样本率/构成比关联度卡方检验列联系数分组变量有序反应变量有序配对/配伍设计非配对/配伍设计卡方检验秩和检验McNemar秩相关分析/线性趋势检验分层计数资料分层卡方检验M-H/CMH检验三、单变量等级资料分析非配对两组比较两组比较配对完全随机设计随机区组设计Wilcoxon符号秩检验Wilcoxon符号秩和检验Mann-WhineyU检验Kruskal-Wallis检验Friedman秩和检验四、双变量资料分析双变量直线相关直线回归曲线回归X,Y服从二元正态分布X,Y不服从二元正态分布Y服从正态分布,X为控制变量X,Y服从双变量正态分布Pearson相关Spearman相关Ⅰ型回归Ⅱ型回归指,幂,对,Logistic,多项式回归

1 / 15
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功