1. 医学统计学绪论

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

医学统计学绪论什么是统计学“统而计”汇总群体的数据,计算并发现其中的规律的一门学科。是一门处理数据中变异性的科学与艺术从变异、看似杂乱的数据中发现必然规律什么是医学统计学运用概率论和数理统计的原理和方法,结合医学实际来,研究医学数据资料的搜集、整理、分析与推断的一门学科。医学统计学的基本概念(一)同质和变异1.同质(homogeneity):根据研究目的确定的观察单位性质相同同一个班级的学生中国人地球的生物同质相对性,根据研究的内容和尺度而定同质性群体是统计分析的基本单元2.变异(variation):被观察个体(或单位)之间的差异被称作变异,亦称做个体变异。其一,个体与个体间的差别(真实差异);其二,同一个体重复测量值间的差别(测量差异);没有变异就没有统计学。例1调查2003年杭州市7岁男童的身高和体重同质:2003年杭州市、7岁男童变异:身高和体重各不相同例2研究某降压药的疗效同质:高血压患者、用某药治疗变异:疗效各不相同(二)变量和变量值变量(variable):观察单位的某项特征或指标为变量年龄、性别、身高、体重等变量值(valueofvariable):变量的观察值或测定值,亦称数据(data)(三)总体与样本1.总体(population):根据研究目的确定的同质观察单位的全体,具体而言是观察个体某一特征值的集合。分有限总体与无限总体。有限总体:研究单位数是有限的,有确定的时间、空间限制。如:调查杭州市2008年正常成年男性的红细胞数无限总体:研究单位数是无限的,没有时间、空间限制。如:高血压患者←无时间、空间限制。2.样本(sample):从总体中随机抽取的部分个体。从总体抽取部分个体的过程叫做抽样样本中所包含的个体数称为样本含量。总体N=10000样本n=20举例调查杭州市2008年正常成年男性的红细胞数,从中随机抽取20名进行测量。总体:杭州市所有正常成年男性红细胞数样本:20名男性的红细胞数为什么要抽样?总体太庞大,工作量太大实际工作中总是从总体随机抽取一定含量的样本,目的是根据样本所提供的信息推断总体的特征。13参数(parameter):根据总体中全部个体值计算出来的描述总体特征的指标。参数一般用希腊字母表示,如总体均数μ、总体率π等。(一般是未知的,固定的)统计量(statistic):根据样本中个体值计算出来的描述样本特征的指标。统计量用拉丁字母表示,如样本均数x、样本率p。(四)参数与统计量jjXS167.41,2.74165.56,6.57168.20,5.36┆165.69,5.09nj=10100个=167.7cm=5.3cmX1,X2,X3,Xi,某市18岁男生身高N(167.7,5.32)的抽样示意图举例:总体样本随机抽取部分观察单位μ?推断inferenceX定义:实际观察值与真实值之差,样本指标(统计量)与总体指标(参数)之间的差别。分为:系统误差、随机测量误差和抽样误差三类。随机测量误差和抽样误差属于随机误差。(五)误差系统误差、随机测量误差和抽样误差的区别误差产生原因对观察值的影响处理方法系统误差仪器或试剂未校正、观测者的感官偏差观察值不是分布在真值两侧,而是有方向性、系统性或周期性地偏离真值通过试验设计的完善和技术措施的改进使之消除或减少随机测量误差排除系统误差后,其他多种不确定因素,如实验人员操作技术不稳定,环境因素改变等观察值随机地而不是倾向性地偏离真值。该误差变量一般具有统计学规律可通过技术培训、改善试验条件等措施加以控制抽样误差个体差异、样本含量大小统计量不是按方向性、系统性而是随机地偏离参数不可避免,增加样本量使其控制在适当范围频率(frequency):样本的实际发生率。设在相同条件下,独立重复进行n次试验,事件A出现m次,则事件A出现的比例f=m/n称为频率。如:抽样人群的发病率、患病率、病死率、治愈率都是频率。概率(probability):反应某一随机事件发生可能性的大小。用大写的P表示;取值[0,1]。概率越接近于1,表示事件发生的可能性越大;越接近于0,表示可能性越小(六)频率与概率P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。小概率事件则意味着决策的风险较小,可以作为决定的依据(举例:冒险群体、正常群体、保守群体)。小概率事件必然事件P=1随机事件0P1不可能事件P=0概率划分和小概率事件医学统计资料的基本类型(一)定量资料又称计量资料或数值变量资料,视为测定每个观测单位某项指标的大小而获得的数据,其变量值可以衡量高低水平,一般有度量单位分为离散型和连续型身高、体重、年龄、BMI指数(二)定性资料又称计数资料或无序分类变量资料,是将观察单位按某种属性或类别分组计数、汇总各组观察单位数后得到的数据。阴性/阳性;男/女;A/B/O/AB二分类:两种定性变量值多分类:多种定性变量值(三)等级资料又称半定量资料或有序分类资料是将观察单位按照某种属性的不同程度分为等级后分组计数,分类汇总各组观察单位数而得到的资料。变量值具有量化的等级性,无量纲疗效:无效/好转/显效/治愈/化验:-/+-/+/++/+++住院号年龄身高体重住院天数文化程度性别分娩方式妊娠结局20256552716571.55中学女顺产足月20256532216074.05小学女助产足月20258302515868.06大学女顺产足月20225432316169.05中学女剖宫产足月20224662515962.011中学女剖宫产足月20245352715768.02小学女顺产早产20258342015866.04中学女助产早产20194642415870.53中学女助产足月20257832915457.07中学女剖宫产足月请说出以下数据的类型?举例:测得5人的WBC(个/m3)数如下:300060005000800012000定量资料若按正常3人,异常2人分组→定性资料若按过低1人,正常3人,过高1人分组→等级资料注意:数据的转换通常会损失部分信息数据可以转换医学统计工作的基本内容实验设计搜集资料整理资料分析资料(一)实验设计(design)最关键的步骤包括专业设计和统计设计专业设计主要考虑专业方面的需要,如:研究对象的选择,实验技术和方法的确定等。统计设计的内容包括资料搜集、整理和分析全过程总的设想和安排。举例:研究浙中大研究生的吸烟行为研究目的?确定研究对象,观察单位,变量值如何抽样,样本量?如何调查?调查表?如何分析?(二)收集资料(datacollection)统计资料主要来源:统计报告表:法定传染病报表,职业病报表,医院工作报表等这是国家规定的报表登记或报告卡(单):出生报告单和出生登记、死亡报告单和死亡登记卡。日常工作记录:门诊、住院病历、卫生检测记录、健康检查记录等。要做到登记的完整、准确。专题调查或实验统计年鉴和统计数据专辑搜集资料强调资料的完整、准确、及时。(三)整理资料资料整理(datasorting)目的是将搜集到的原始资料系统化、条理化,便于进一步计算统计指标和深入分析。资料整理前要对资料再次检查与核对,发现缺项或错项较多的调查表,须补查或剔除。审查无误后,设计分组。(四)分析资料(dataanalysis)分析资料为根据研究设计的目的、要求、资料的类型和分布特征选择正确的统计方法进行统计分析。常常从两个方面分析:一是描述性统计,即计算统计指标,如平均值、发病率等;统计图、统计表等方法,对资料的数量特征及其分布规律进行测定和描述。二是分析性统计,即推断总体的特征1.推断总体均数、总体率及其可信区间2.推断两个或几个总体指标之间是否相等或推断某个总体统计指标是否等于某个常数。课程设置简单讲解基础统计学1/2个课程多因素方差分析、重复测量方差分析多重线性回归、logistic回归、生存分析判别、聚类分析、主成分因子分析量表设计和分析theEndoftheChapter

1 / 35
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功