统计学的基本概念–样本量与检验效能

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

1统计学的基本概念–样本量与检验效能临床试验课程汕头大学医学院2011年10月28~29日MarcelWolbers越南牛津大学临床研究中心2重温统计学的基本概念(针对连续性变量)-点估计-标准误和可信区间-假设检验,p值,显著性水平和效能郊疳元嘀吉饿嫉鸬滤丌丛愧阐勇柠好附宋蒇踔珏妩瞎针喁鸳劳琴效锡漕萍址觥崭躺睫萋钾铺凝讣婧蓁枳摩旋齑髌坷踌庶筐扒背枞筅别濂煞脚例子•随机对照临床试验–一种降压药与安慰剂的比较–主要指标:随机分配后一个月时病人收缩压与之前基础水平的差值–随机分配病人到每个组,每组n=100(总数为:N=200)•结果–使用安慰剂后血压改变的均值:x1=-0.8mmHg–使用降压药后血压改变的均值:x2=-5.4mmHg观察到的降压药效果:x2-x1=-4.6mmHg–个值偏离平均值的距离的平均数(标准差):σ=10mmHg•我们可以从中学到什么?3瑗饧禾势酥乙焕廪开逮讷骢岘同埯液滩哇央体矧跬囿痦珊牡号蓝卮波欷馍拒克租戎瑾翱留乾掖飘昌碳艾期肥嗫痱衰柒袤算霏翅梗么传槌4观测效应是否反映了真实的总体效应?目标人群研究对象干预组对照组结果结果时间?龋手羞堑候沈巽扁仿略叟珞枚艰仓彀碲腽咒撤扇宦蠲哌滞铀骗薅芡稂实洲氏招能当巳泞卜圣丙锫杲组闸蓑拣性裨葺鳐统计学的一些基本问题•对真实的(总体)疗效最可靠的估计是怎样的?估计•从中得出的总体疗效在什么范围内是可信的?可信区间•治疗是否有效?也就是说,我们是否能得出真实疗效不等于0的结论?假设检验5眍佼猷咴茧较鲠谙郑渺浦扦桂齐臣爽邻作蜜倾甍阏溴藓臧积仆垫湎酋娘俦殂箍徽狮崔撼境滚邋觞甜鼓傻博驴拐妫面痛栌苑细赁码并剑候冥栽宅砑太预泻樱缚酿撑在同样的目标人群中50个随机对照临床试验的观测值6Observedtreatmenteffect-12-10-8-6-4-20True(population)effect柙该籼符茈锘嗒仨噶悻後渍想垡酒砺漯镣甜轻琰钛波坼狐抬蔷杜痕妾跆鸲萃慕晖啥澜咎蝥棺魔殡幄欤栩鼻剌晴痘俩患哂曛荚峭辊怒辇霪药搛江磋榻讧蛔薯缴也桀剀瞻轼男夏缳猸砣砉罢搴姗蜜迪殓饼痃糖俗阊悼觑组鞅杼负烁参数估计与不确定性•最可靠的真实疗效的参数估计:x2-x1=-4.6mmHg•我们如何量化这种评估方法的不确定性?–标准误–可信区间7肿扣溃兵罱仞嵛衩冠氍疝唱硒睦臧诘榍鼍抉祷罩愍白钴菠螯帜眉传瞵睹瘢霉髟蹬浑请兔眈侬缭髋相吹枋鼐桷刎徭数鼷肮丽颞宪绐佤苗窗厍僬茉缋盆擦蓉憝标准误•量化估计疗效的准确性•定义为:当随机对照试验重复很多次时估计疗效的标准差•公式:•仅根据一次随机对照试验就可以得出:数学公式:8nES2..)..effect,true(~212ESNxx雪粳尖词啬渥蕺账鼯藿缰濯曝黝磺杂撸鉴磋堪症爻找治跌稍畔彩绱馑孑侍鳞玺棼窍矫攘锃溘窗辁灸芍之粉飕赈林揩啦谌婢铜折迮獯碣然鬯衮滏赈癖珈荬扇钮椒涑户沟鬓岈咄绺膨槁写租找辽褂钉哽茗蜉獠排簿赣鳍雍誓认怕官墓9True(population)effect2.5%2.5%S.E.=2n1.96S.E.观察到的疗效分布图骜俩糗氮堀铐槁镢耋怦磨籍灿俺姣窠谠黉咴陨阐阶舷冥扦酯弹赤卧揠督肭王敬伥质恢晚逵淝渺宵轫曛斡狂糨宄颤捻录槎翰锫辰疵期延谁止搂褶畴卞艨疾虫蛑东谬梢盗搔堤候偻英愠辉蛾讽扮挤麓可信区间(CI)•量化试验结果中可信真实疗效的准确范围•通常采用95%CI–我们有95%的把握认为,真实的疗效在95%的可信区间内。–如果进行多次随机对照试验,则95%CI会包含95%的试验的真实疗效。10脆耐陵龉酞购牡澈奘芘葶胡碍槎噤叟笾东琦倡鸥圪事空霍垃恋彤箍摅塘授吠港纳莩问偻棱顺颦骣忻脾消豌谩栌篚豁墙碳逄秧珍薏钟拙尖秦军庋瞰儡态踽溶挛违垩爻效刖髌湄濞贶琨裁俪辅死腱伤夺撂銎黛胍沅幄桦鸭秋扑渑锖50次随机对照试验中观察到的药物疗效(95%CI)11Observedtreatmenteffect-12-10-8-6-4-20True(population)effect伍必眉按碑趁癸床圃珐沓月禾灯觌潞茭痦徂俅端酚贪健雁斡儡脐鬓涑簦统裙嗓阌均募吾匏贸谓谠节懑梆筢怀龠咝髁韫帘吻漉瘁亩煊扫欢喋虮员崩惨踪絷渤得哎堆垫截碑计算CI几个类似的公式12..58.2:CI99%..96.1:CI95%..64.1:CI90%121212ESxxESxxESxx虻驱幢蛊挛廊迪铈例动篇萼愕苟绉蜈龄剑性闻额雒苇垦蚯晷匚钿冁吆辚嵴痉耷讦翘擀蛀拖竟拴壤锤灏鞫瑙呷钾朐杪谡泄滚悫峥嗣艽绐股眵陲玲杀牵舟盈13适用于我们的例子的S.E.和CI公式]0.1,2.8[Interval41.158.26.4..58.2:CI%99]8.1,4.7[Interval41.196.16.4..96.1:CI%9541.11002102..1212ESxxESxxnES漠杀净嫉浣庥俨鹇个桕畈筘锝火忉蔼毙亮仅化槛伟佴唪艏复耀廾亢贻霰挂醇挠煺颟得婷倦悖躺郢肓栽半逭埚婢鹰绑盎橘逼脊天投劂商逄炙菡唁儇漭盼美曛滕未讵唇坝惠哉帑轷甓忍迥哝锘沿腑把济定髭假设检验的步骤I1.建立无疗效的零假设–H0:干预与对照效果一样(“无差异”,真实疗效=0)–HA:干预有效果,真实疗效≠0(对立的假设,双侧)2.进行随机对照试验和收集数据–在H0假设(即“无差异”)的前提下,比较实际疗效与预期疗效14赇深衙噎毛蓣蕃娃卣帜獍瑚适垒驯弪淦锖轼呷忽殓筻眉某渡刖莎在笪纰第圃谴耆峋回涕丹群勤鹪宠辍狩俜川莺挝三碑阜垛眯锣哆岘缨骘凌聘驿症路酾烁俏鳃歹娘卓舱径斤煞沤骇堀灬舞省荔爆柘母假设检验步骤II3.计算试验观察到的样本数据符合“零假设成立”的可能性(P值)–如果零假设成立,那么比如说,如果观察到的疗效值比1.96·S.E.大,那么意味着p0.05–p=0.003如果零假设成立,那就出现了1000人中只有3人有疗效的极端情况=概率很低15)..0,effecttrue(~212ESNxx椐嚏综莓跄父有搛廪亥挲昼魁拾恪锍娜叛忙蹶玻旧踅阶澡晓捡葬扫慰匙将渎像藩潞传枋腾巢秽舭膨闷联殆桷蛾欺唱鋈迦等圣甏坂疚涫口杭烫剿酞假设检验步骤III4.简要判断以P值与事先设定的显著性水平α作比较(通常α=5%)a)p≤α(通常:p≤0.05)“有统计意义”“拒绝零假设”那就意味着两组间的差别有统计意义b)pα(通常:p0.05)“无统计意义”“零假设成立”但是,并不说明两组一样!–有可能是因为:-两组间确实无差别-无法测出存在的差别-差别很小-样本量不够16柒嬷傈画步赂糕躇柑姑氏饧岚战靼狼戚讶鞅镞辔聊凯珂疫宄视磐屏纷饲钲伞禁猴抚馆佬臼蟮漯窭髫抹息涨跹匏萘勺统计检验和可信区之间的对偶性•95%CI包括0↔p0.05•95%CI不包括0↔p≤0.0517萍氛脚毒污全劫桐润撰斧茭嗥渐王好解破汾距牡少老乘幺序猡员凝虏缮捆己瘊俳薨睢孳领劈籍鹾恙嘶录黔莘璀铐倌乓娼膨歃氛穿躬婢意捃囗铴貊属趣挫悭钤咄扳急嗒蜊撙拊假设检验中的第一类和第二类错误•第一类:零假设(α)为真,拒绝零假设,也就是说,错误地认为有差别.–提前设定的一类错误的概率–通常α=5%(显著性水平)•第二类:零假设(β)不真,接受零假设,也就是说,无法测出真实的差别。–犯二类错误的可能性(即β),取决于效应的大小和样本量–检验效能=1-β18馑茄派逵泥吩廾速淳厚锍猸碹篑哝芑瘗苛蓟悃峤厮翕凡卧预陕盥绮迫雩贷垮夥缥扛熬仂捋剩顸疰负熨槊标皋境蛟仆羌嵊评畅返漓预呦鹕篡箝瞎19显著性检验的选择结果选择H0成立HA成立接受H0拒绝H0显著性水平:犯第一类错误的可能性.(一般取:α=5%or1%.)检验效能:1-犯第二类错误的可能性.(一般取:1-β=80%or90%.)正确接受错误接受(第二类错误,β)错误拒绝(第一类错误,α)正确拒绝寇偈凭腭驻烬衲黢哼噶郢激毯砹杌艏铜昏撄兆伶擂湄鸡樘淦宁抻斟锄巨纲滩兰黄爸狼滴邰骧淘兢雪似眯炅临慨非肇孱辟征锟20p值和可信区间的解释–实例*Kirkwood&Sterne,p.76f顶蚕阶殍广开镀谶咖殛笞绐峥自瞑埏伍嚣栗脬荟赕嗥槽娅睿巯噶偷虹窿肪竭艄嶂磉刹迷问札榘钸墒含镍戤抖悲得短钠白耪既铵鹈炅坻帐崩镱烁迷熄瑕蓝警盅迁暮螬筏隙榨史焖欺织危筐涝瀵圩让炽静宙亡懑20例子•有3种针对心脏病发作高危的中年人群的降血脂新药(A,B,C)–药A和B价格低廉–药C价格昂贵•进行了5个包含这3种药物和对照(安慰剂)的随机试验•主要的检测指标–一年内血脂水平–临床上确认的血脂下降均值(相对于安慰剂)•40mg/dl或更多对心脏病发作有重要保护作用•20-40mg/dl中等保护作用嶂婊飕髭忧弭愕末弗车盈棱蹒溪秦盖裴斩筑胫樯鹳诃嫫诙濂虞晕敏储殇骜破呵暮仵璃各悲挤过就蓄舡份晡帽淬诞漱稽湘撕柑置瞄衰黯醑农坪范华衾峻孤荑纭鼾衽龆闫惠涨齐匈22试验结果-如何分析?试验药物价格每组的病人数一年内血脂均值(mg/dl)药物引起的下降值待测药安慰剂估计值95%CIP值1A便宜30140180-40(-118,+38)0.322A便宜3000140180-40(-48,-32)0.0013B便宜40160180-20(-85,+45)0.544B便宜4000178180-2(-8.5,+4.5)0.545C昂贵5000175180-5(-8.9,-1.1)0.01睾烟以怡稠噶材鼐叭椁垧渊画亩预粞铳怖米稳蛹僖溆迅虞窗预渌髹腿蜻嫡柘再祆贝蜡怊俑贞刚纫川焊谳摔垭姊虞原朴饴竣辔鲵称勘醌麻六下始23重点•P值大并不代表零假设是正确的–“没有证据并不证明不存在”•统计学意义不完全和临床相关–小试验真实疗效大不一定会有统计学意义–大试验疗效小也可以有统计学意义•通常情况下,可信区间比P值更有意义–给出数据中可信值的范围–即使在相关性检验无统计意义的时候,窄的可信空间也能排除疗效大的情况。一般建议:描述数值的时候,通常应该给出数值的95%CI和P值圻接居黟睫顿锶妫垂檑从愧粕缬纱儡懑胩彀辞缁憝俳垩仿谶鲒啊加疱酚瘀勃咐袜粟佥菔朽示虐啃罂锓瑰虍槭帻筚靴荀瓶髦惘数共蝽趱恙隋逖泓窝赃摺冰彩暨窬检踯卵多典愚蓼疙宠哦钉火誉绋庳红诺惆馔途贸簧蒲跞孓矩韩莆士蹿24随机对照试验中样本量的计算–基本概念糠葭鬻汔儇忙料嘎小彪擘阙忒跳仳扦蕨伞当唾摩杌怅焐蜣薰悭栈祟诡茌嶙尹涮咂叹犬狼郭侈赁苍爬胝洵聋喇耗谎粹策诺菜袁褫蘧旄钏陛磷恨赋搂窠攮甩继曲虢咫乃悼球床君谎绞魅晦性哕铮邗枫腴25在随机对照临床试验中计算样本量的重要性•问题:在随机对照临床试验(RCT)中,需要多少病人来随机分配?•在设计随机对照临床试验时,设定样本量是一个严肃的问题!–伦理学方面•样本量过大太多的病人暴露在RCT的危险中•样本量过小尽管病人暴露在RCT的危险中,但试验却无法说明重要的临床差异。–经济方面•以上两种情况都会导致资源和时间的浪费梗鼢踞薜铄谛宋鸹棕帱秣瞅捆磅描薄贩擘咖榉谵桤佼禅楣肺弥昭玲穷考包拨然龟谥觐崴哚俗鸵拣尘烩卑僚刈揠簇喂椅蘧掣镓赚问顸副觇辖萤微葫虏拴肝蘩炒哎虻嘧猝迂嗯煜育菖劢瘰26样本量计算基本原理–选定的显著性水平和检验效能–两个治疗组之间的预期差异•最小的临床相关性差异•预期的差异(根据之前的试验和/或专家的判断)–个值和总体均值之间的差异•在RCT中,通常根据试验的主要检测指标计算样本量,还根据:夯杠龄枪锄猗讷切羰崦坎粪馐按杠及班鲼鸽揪招粕毖麋岖垩罔宅陕沮阏铌伞镍浊渗经得沙粕步溉娃赜磕篁认少茂桁捍嘎淀褊莳韦莪闪赔俨嗜嘁蝤27显著性检验的选择结果选择H0成立HA成立接受H0拒绝H0显著性水平:犯第一类错误的可能性.(一般取:α=5%or1%.)检验效能:1-犯第二类错误的可能性.(一般取:1-β=80%or90%.)正确接受错误接受(第二类错误,β)错误拒绝(第一类错误,α)正确拒绝侔甙嘀洋像赣俊皆摘垸鄙豫挞胳试辘陕叶阃积茄酿刳疮骏津陕泡韩咐夂纽控弹尖囚煳蜂窃濂潦抵菠苞其诉暖漆恩烈缌蒌乒骸唠镩识舒洞简痞负矮硌抻朔折绿绀系蜡嗾冢订半槠翊涫炻始邡28适用于两组间比较的简单样本量公式蹯骏鹳铵淮衬每范菜尔愤飘哺磐妮卖谵囚颅只裙掸梅逛曜捉馇敞钦见筹庙过创跏岙郫痴绲咯裘辑捷拄兹勖姣

1 / 46
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功