流行病学原理与方法、偏倚控制、筛检试验与诊断试验、医学统计学流行病学原理与方法一、流行病学研究的基本原则:1、群体原则2、现场原则3、对比原则(核心)4、代表性原则记忆:一群(群体)人在现场(现场)对比(对比)当代表(代表)二、流行病学的研究方法:1、描述流行病学2、分析流行病学3、实验流行病学4、理论流行病学三、疾病的分布与影响因素1、疾病的分布是指疾病在:地区、时间、人群的发生发展的规律注:三间:时间、空间、人间2、疾病分布的测量指标(1)发病率:定义:新发病的病例、不包括原有部分、一定为新发生的病历、原有的不算(2)患病率:定义:目前所有新老病人患病人数病的总和、常统计慢性病、包括新发与原有部分的总和例如:2015年检查1000人、检查出200个高血压、2016年查1000人查出210个高血压、则发病率:10/1000=1%、患病率:210/1000=21%(3)罹患率:定义:局部范围、短时间、传染病的发病率、为患病率中的特殊部分(4)死亡率:定义:一年内死亡的人数(5)病死率:定义:得病而导致死亡的人数注:前提必须为患病导致死亡四、疾病的流行强度1、散发:发病率与历年相似、没有传染关系2、流行:发病率超过散发水平、至少3倍以上3、大流行:疾病迅速发展、一定为短时间跨省、跨国4、爆发:短时间、小范围突发大量病例五、流行病的研究方法1、现况研究(横段面研究、患病率研究):主要用于不明原因得病后的研究(1)普查:普查主要为“患病率”(2)抽样调查①随机抽样调查:现况研究中最基本的调查②系统抽样调查:先编号在抽取③分层抽样调查:先分类在抽取(3)现况研究无需设置对照组、不分组2、病例对照研究(1)分组分为:患病组、未患病组(2)研究方向:现在患病找以前的发病因素、由果到因、研究病因(3)最有价值的指标:OR比值比=暴露比/未暴露比(4)OR值的意义①OR值1:提示正关联、是危险因素②OR值1:提示负关联、是保护因素③OR值=1:提示无任何关联如:第一组为90名老年男性肺癌患者、其中60人吸烟另一组为90名健康老年男性、其中40人吸烟暴露因素(危险因素)为:吸烟OR比值比=暴露比(患病暴露60/未患病暴露40)/未暴露比(患病未暴露30/未患病未暴露50)=(3/2)/(3/5)=2.53、对列研究(1)分组分为:暴露组、未暴露组(2)研究方向:通过危险因素来追踪将来是否得病、由因到果(3)最有意义的指标①相对危险度RRA、特点:某因素与某疾病联系程度、评价暴露因素强度的最佳指标、B、相对危险度RR=暴露组发病率/未暴露组发病率、为发病率之比、如:1000人在化工厂上班工人、20肺癌1000人学校上班的老师、4人肺癌相对危险对RR=(20/1000)/(4/1000)=5②归因危险度PAR:又称为特异危险度A、特点:评价暴露因素危险度的最佳指标B、归因危险度PAR=暴露组之比(发病率)-非暴露组之比(发病率)如:暴露组200人、30人高血压非暴露组150人、15人高血压归因危险度PAR=30/200-15/150=1/20=0.054、临床试验:临床给药(1)单盲:医生知情、患者不知情(2)双盲:医生与患者均布知情(3)全盲:实验者、医生、患者均不知情偏倚控制一、定义:研究结果偏离正常值二、分类1、选择性偏倚:如:测量高血压时选择人群均为70岁以上的老人则出现误差2、信息偏倚:信息出现误差影响结果、包括:报告、测量、诊断、3、混合偏倚:在试验设计阶段通过限制与匹配方法来控制注:无回忆偏倚筛检试验与诊断试验特点:筛检试验与诊断试验为目前公认诊断疾病最可靠的方法筛检试验的指标一、灵敏度:实际有病被筛选为有病的病例、又称为真阳性如:100人患有肝癌、经过肝脏穿刺活检AFP发现98人肝癌、灵敏度为:98%、余下的2人为假阴性二、特异度:实际无病被筛选为无病的病例、又称为真阴性如:100人无病、经过检查无病的人数为87、特异度为:87%、余下的13人为假阳性三、约登指数:约登指数=灵敏度+特异度-1如:某工厂进行前列腺癌筛选其中PSA阳性100人、73人确诊前列腺癌、灵敏度为73%其中PSA阴性50人、43确诊无前列腺癌、特异度为:86%约登指数=灵敏度+特异度-1=73%+86%-1=159%-1=59%=0.59四、符合率(粗一致性)=(灵敏度人数+特异度人数)/总人数注:用于测定试验可靠性指标如:进行乳腺癌筛查100个乳腺癌患者、其中检查确诊80人患有乳腺癌、灵敏度人数:80人100个健康人无乳腺癌、其中检查确诊90人无乳腺癌、特异度人数:90人符合率(粗一致性)=(灵敏度人数+特异度人数)/总人数=(80+90)/100+100=170/200=85%医学统计学一、基本概念1、总体:全部研究对象2、样本:总体的最有代表性的一部分、总体包括样本3、均数:总体均数:μ、样本均数:X-4、概率:总体概率:π、样本概率:P5、偏差:总体标准差:δ、样本标准差:S二、概率1、概率定义:随机事件发生可能性的大小、总体概率π、样本概率:P2、概率的范围:0-100%(0-1)3、概率分类(1)小概率事件:P样本概率5%(0.05)的事件为小概率事件(2)大概率事件:例如:明日太阳从东边升起为大概率事件,概率为100%三、统计工作的基本步骤:1、设计:统计过程中最重要、最关键、决定成败的步骤2、收集3、整理4、分析四、数字变量(又称为:计量资料)1、集中趋势:指标包括:均数(算术平均数)、几何平均数、中位数注:反应集中趋势指标一定带有“数”字(1)均数(算术品均数):总数/个体数、反映集中趋势的正态分布(2)几何平均数:反映集中趋势的倍增分布(倍数、等比)、一般用于统计:抗体浓度、药物浓度等(3)中位数:中间位置数字,反映集中趋势的偏态分布、用于判断一端无确切数值、如传染病的潜伏期等注:奇数个取中间位置数值、偶数个取两个数取中间位置两个数字之和除以二总结:集中趋势看均数、算术几何中位数、算术均数正态分布、几何均数倍增分布、中位数偏态分布2、离散趋势:指标包括:全距、四分位数间距Q、方差、标准差注:反应离散趋势指标一定带有“差”“距”字(1)标准差:反应离散趋势的正态分布的为标准差、为离散趋势最准确、最重要指标注:方差,标准差只用于正态分布(2)四分位数间距Q:反应离散趋势的偏态分布的为四分位数间距(?、(3)标准误SX-:反应离散趋势的抽样误差为标准误SX-①计算公式:SX-=标准差/√样本个数②随机抽样时:X-≠μ说明存在抽样误差记忆:离散二距方标差、正态标准数最佳、偏态四分数间距、抽样误差标准误3、变异系数CV:统计学需要比较时出现“单位不同”或“均数相差悬殊”选用变异系数CV进行比较4、反应正态分布特点①总体均数μ=0、总体标准差δ=1②当总体均数μ恒定时、总体标准差S曲线将变胖五、假设检验1、定义:针对总体的特征进行某种假设2、计算方法(1)无效假设:零假设、用h0表示、h0:μ=μ0(2)研究假设:备择假设、用h1表示、h1:μ≠μ0(3)P0.05统计无效、P0.05接受h1、拒绝h0有统计学意义注:进行统计前是首选要进行无效假设、默认为无效假设等于实际情况、调查后若出现零假设概率P5%(大概率事件、不可能)无意义、假设研究后的研究假设结果概率P小于5%、则拒绝h0、接受h1六、检验方法:X2卡方检验、U检验、T检验1、X2卡方检验(1)用于“率”的比较或用于“构成比”的比较、如:血型的比较、发病频率、常用程度的指标注:“率”为发病频率、严重程度的重要指标(2)特殊:四个样本的自由度、特例:四个样本=(行数-1)x(列数-1)=(2-1)x(2-1)=1注:自由度=样本-12、用于比较两个样本所属总体均数是否相等:U检验(样本数大于50)、T检验(样本数小于50)3、分用于总体类型不知(未知)时用于分等级的检验:秩和检验记忆:比较均数用UT、大于50要选U、小于50要选T、率的检验选X2、分级检验用秩和4、频数分布:在总体分组的基础行再归并排列、又称为分布数列、常分为8-15组、100以上的病例常以10组为宜七、统计图1、线图:看变化、统计XX变化、最好的线条图为:半对数线图2、直方图:看分布、统计XX分布3、直条图:比大小、比高低、统计XX大小、XX高低4、散点图:回归变数、统计XX回归数、两个连续变量之间的关系5、百分条图、圆图:看构成、看比重、统计XX构成、统计XX比重