2019/12/151重复测量资料的统计分析马金凤2014.10StatisticalAnalysisforRepeatedMeasurementData2019/12/152outlinePartⅠ:Introduction(简介)WhatarerepeatedmeasurementsHowaretheydifferentWhyaretheyimportantPartⅡ:Methods(统计分析方法)RepeatedmeasuresANOVA-GeneralLinearModelmixedeffectsmode1sgeneralizedlinearmodels,GLMs–GEEMultilevelModelsforRepeatedMeasurementData2019/12/153PartⅠ:Introduction重复测量资料(repeatedmeasurements)重复测量资料(repeatedmeasurements)重复测量设计-受试者内设计(within-subjectdesign)是指同一观察对象的某观察指标在相继的不同时间点上进行的多次观察。2019/12/154PartⅠ:Introduction重复测量的数据结构1固定重复时间t1t2t3t4t5t6ID1×××…××ID2×…××××ID3××…×××ID4××××……2019/12/155PartⅠ:Introduction重复测量的数据结构2不固定重复时间ID1t11t12t13t14t15t16ID2t21t22t23t24ID3t31t32ID4t41t42t43t44t45t46···········2019/12/156PartⅠ:Introduction重复测量资料的特点在相继的不同时间点上进行的多次观察不是随机确定的;重复测量值之间具有相关性-即数据是非独立的。独立?!非独立数据?!2019/12/157PartⅠ:Introduction重复测量资料的特点由于重复测量资料不同时点的测量值之间具有相关性,且随机误差分布于不同的层次,其不同于以往我们所熟悉的数据形式-独立数据结构。2019/12/158PartⅠ:Introduction重复测量概念的推广重复测量的概念不仅仅是时间上(temporal)的,也可以推广到空间(spatial)。例如:同一母鼠所生的仔鼠;同一家庭的不同成员;同一患者的两个不同膝关节;同一肿瘤患者的不同肿块;同一条河流的不同采样点。2019/12/159PartⅠ:Introduction非独立数据(non-independentdata)非独立的数据(non-independentdata),是指数据中某观察指标(某变量)在个体与个体之间、或同一个体的每次观察间不独立或不完全独立。非独立性的大小可以用组内相关(intra-classcorrelation)来度量。重复测量资料属于非独立数据中的一种。常见的非独立数据:纵向数据(Longitudinaldata)、多中心试验数据、遗传学数据等2019/12/1510PartⅠ:Introduction重复测量数据、非独立数据日益重要应用广泛2019/12/1511importantRandomizedControlledTrialNon-randomizedControlledTrialCohortStudyCross-sectional,case-controlstudyCaseSeriesCaseReportMostReliableLeastReliable2019/12/1512AnnualsearchesforkeywordlongitudinalinonlinecitationdatabasesWidelyUse2019/12/1513PartⅠ:Introduction重复测量数据、非独立数据组内相关结构等相关(exchangeable,compoundsymmetry)相邻相关(stationary1-dependence)自相关(autocorrelation)非确定相关(unstructured,generalstructure)2019/12/1514PartⅠ:Introduction相关结构-1等相关(exchangeable,compoundsymmetry)11R1112019/12/1515PartⅠ:Introduction相关结构-2相邻相关(stationary1-dependence)112233441000100R01000100011000100R01000100012019/12/1516PartⅠ:Introduction相关结构-3自相关(autocorrelation)23423223243211R111315121413252214231324353435441425152535411R111tttttttttttttttttttttttttttttttttttttttt2019/12/1517PartⅠ:Introduction相关结构-4非确定相关(unstructured,generalstructure)121314152123242531323435414243455152535411R1112019/12/1518PartⅡ:Method传统方法及其弊端对平衡的重复测量资料,分别在各时间点上进行分析。孤立地看待各时点数据,增加I型误差。将各个体的几次不同观察值相加,得到该个体的一个综合值,再进行比较分析(aggregatedanalysis)。人为地减少误差,它忽略了对不同来源的变异的分析;未考虑观察值在时间上的变化规律,也未考虑其他协变量与时间的交互作用对结果的影响。损失了很多信息。将n个患者的几次不同观察均作为因变量,时间以及其他变量作为自变量,样本含量为,拟合线性(或广义线性)模型。将非独立数据当做独立数据看待,增加假阳性。iNk2019/12/1519PartⅡ:Method目前常用的统计分析方法(一)重复测量资料的方差分析一般线性模型(generallinearmodel)前提条件:正态性方差齐独立性协方差阵满足球形条件不满足球形条件:Greenhouse-Geisser校正系数和Huynh-Feldt矫正系数,最小极限矫正系数。2019/12/1520表1某药两种不同剂型在血中的浓度(mlg/)剂型受试者服药后测定时间(j)(i)k1(0h)2(2h)3(4h)4(6h)5(8h)19.7354.6155.9146.8147.5625.5050.8779.9062.3755.0337.9623.4364.1056.0045.1542.3718.6573.1076.0560.8052.3755.2493.3565.4762.3766.5032.0873.4576.2760.2378.34132.1102.097.8392.83胶囊型i=181.805.4085.8073.9560.14114.6629.0048.8852.2431.6520.8425.0053.8044.2532.3830.6817.3464.5661.6055.8042.1414.1069.7766.6554.4352.3053.4073.8362.0057.3166.1725.8545.8053.2547.9572.4553.3058.8057.8071.10片剂型i=281.5844.0030.3070.2067.062019/12/15212019/12/1522表2方差分析表调整概率变异来源离均差平方和df均方FPG-G法H-F法对象间11799.3615组间(剂型)2635.8112635.814.030.0645误差9163.5514654.54对象内54380.6264组内(时间)41880.79410470.2050.770.0001.0001.0001剂型时间951.194237.801.150.34130.33120.3366误差11548.6456206.12合计66179.9879Greenhouse-Geisserˆ=0.5172,Huynh-Feldt=0.6517Mauchly球形性检验得:P=0.0015,,所以应采用G-G法或H-F法校正结果2019/12/1523PartⅡ:Method目前常用的统计分析方法(一)重复测量资料的方差分析该方法的弊端球形条件在很多临床试验中,一般不允许出现交互作用???不允许出现缺失值时间等距数据平衡不满足球性检验的资料,当结果与其他方法有差异时,下结论应慎重。2019/12/1524PartⅡ:Method目前常用的统计分析方法(一)重复测量资料的方差分析不等距重复测量资料的统计分析方法:如果将不等距重复测量设计资料按等距处理,不仅会损失数据中所蕴涵的关于重复测量因素的信息,而且会造成变化趋势分析结果的偏性,甚至会出现错误的分析结论。2019/12/1525PartⅡ:Method目前常用的统计分析方法(一)不等距重复测量资料的统计分析方法:应用spss程序GLMtime1…timeKBYtreat/WSFACTOR=timekPolynomial(t1…tk)/METHOD=SSTYPE(3)/PLOT=PROFILE(time*treat)PRINT=ETASQHOMOGENEITY/CRITERIA=ALPHA(.05)/WSDESIGN=time/DESIGN=treat2019/12/1526PartⅡ:Method目前常用的统计分析方法(一)重复测量资料的方差分析趋势分析(trendanalysis)一般采用正交多项式(polynomial)分析某处理因素的均数随时间的变化情况。正交多项式变换的对比方法:将两组资料转变为两条正交多项式曲线,检验这两条曲线的参数是否来自同一总体。2019/12/1527表10-12某药两种剂型血中浓度变化趋势(正交多项式比较)多项式(r)变异来源离均差平方和自由度均方FPrF线性平均值190078.611190078.61415.57〈0.0001(1)剂型1556.6911556.693.400.0863误差6403.5514457.40二次平均值16837.83116837.8339.36〈0.0001(2)剂型1581.5811581.583.700.0751误差5988.8814427.78三次平均值15913.02115913.02106.42〈0.0001(3)剂型445.111445.112.980.1065误差2093.3314149.52四次平均值5162.1115162.1123.180.0003(4)剂型311.611311.611.400.2566误差3117.8314222.70各时间点的平均值不等两种剂型血中浓度相同2019/12/1528PartⅡ:Method目前常用的统计分析方法(一)重复测量资料的方差分析趋势分析(trendanalysis)注意事项首先检查最高阶次的参数在两对比组之间是否具有统计学意义。如果组间差异具有统计学意义,则可以认为包括本阶次及其余各阶次之间都具有不同的趋势。否则,应继续对次高阶次的参数作评价。如果在任何阶次上差异都不具有