方积乾卫生统计第一章绪论笔记

整理文档很辛苦,赏杯茶钱您下走!

免费阅读已结束,点击下载阅读编辑剩下 ...

阅读已结束,您可以下载文档离线阅读编辑

资源描述

第三节统计学的若干概念一、总体与样本总体(population):是指根据研究目的所确定的同质观察单位的全体,更确切地说,是同质的所有观察单位某项观察值的集合。分为有限总体和无限总体两类。样本(sample):是指从总体中随机抽取部分观察单位某项观察值的集合。由于直接研究总体通常是不可能的,故一般采用抽样研究。抽样必须遵循随机化原则。二、同质与变异同质(consistency):一个总体内部所具有的共同的基本特征或共性,同质性(homogeneity)同一总体内的个体之间的差异。变异(variation):统计学的任务就是认识事物的变异规律,把握同一总体的同质性,鉴别不同总体的异质性(heterogeneity),以及产生异质性的原因。例:调查2003年长沙市7岁男童的身高和体重同质:2003年、长沙市、7岁男童变异:身高和体重各不相同统计学的任务就是在变异的背景上描述同一总体的同质性,揭示不同总体的异质三、变量的类型变量(variable)就是专业上所称的观察指标(indicator)。定量变量(quantitativevariable)离散型变量(discretevariable)只能取整数值或连续型变量(continuousvariable)取实数轴上的任何值.通常有度量衡单位。如:一月中的手术病人数,体重,身高定性变量(qualitativevariable)1.无序分类(unorderedcategory)变量:疾病分类(1)二分类变量(dichotomousvariable):性别(2)多分类变量(polychotomousvariable):血型2.有序分类(ordinalcategory)变量:痊愈,好转,进步,无效。数据类型1.计量资料用仪器、工具等测量(measure)方法获得的数据,即为计量资料measurmentdata。也叫定量数据Quantitativedata特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)2.计数资料先按某种属性分类,然后清点每类的数据,称计数资料(countdata)或enumerationdata。也叫定性数据Qualitativedata特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)3.等级资料半定性或半定量的观察结果。有大小顺序,所以也叫有序分类资料(ordinalcategorydata)。①癌症分期:早、中、晚。②药物疗效:治愈、好转、无效、死亡。③尿蛋白:,,,++,+++及以上4.三类资料间关系四、参数与统计量参数(parameter):根据总体中全部个体值计算出来的描述总体特征的指标。参数一般用希腊字母表示,如总体均数μ、总体率π等。统计量(statistic):根据样本中个体值计算出来的描述样本特征的指标。统计量用拉丁字母表示,如样本均数x、样本率p。五、概率和频率概率(probability):某事件出现可能性大小的定量描述。1.概率的范围在0与1之间2.概率的加法律3.概率的乘法律4.条件概率设疾病A和条件B,P(A)示疾病A发生的无条件概率,P(A|B)表示在条件B存在的情况下,疾病A发生的条件概率。是否有P(A|B)=P(A)?频率(frequency):是概率的具体表现。概率是理论参数,频率是概率的估计值当观察例数越来越多时,频率越来越接近概率。如出生性比例。小概率事件:统计学上把概率P≤0.05的事件称为小概率事件。六、统计工作的基本步骤一、研究设计(researchdesign)二、资料收集(datacollection)三、资料整理(datasorting)四、统计分析(statisticalanalysis)专业英语NomenclatureHealthstatistics卫生统计学biostatisrics生物统计学population总体individual,unit个体sample样本homogeneity同质性heterogeneity异质性variation变异accuracy准确度reliability可靠度variable变量Nomenclaturequalitativevariable定性变量categoricalvariable分类变量binaryvariable二项分类变量polytomousvariable多项分类变量quantitativevariable定量变量discretevariable离散型变量continuousvariable连续型变量parameter参数statistic统计量probability概率frequency频率正态分布:一种理想的分布模型。偏态分布:与正态分布对应,是普遍存在的情况。常用中位数或百分位数作为统计量。参数型与非参数型:由是否确知其理论上的总体分布来判断。假设检验:1、原理:概率论、正态分布、小概率事件是不太可能发生的(反之亦然)、数学反证法、先假设后对假设进行检验。2、步骤:①确定检验模型(如T检验);②设定检验水准α(=0.05,0.01);③建立零假设H0:μ=0(差异没有统计学意义);④计算统计量(T);⑤比较ABS(T)与界值Uα,确定P值并进行推断:P≥α接受H0,Pα拒绝H0。常用检验方法:参数型检验:前者如t检验或u检验,统计量为均数或率,要求总体服从正态分布或近似正态分布,检验效能较高。非参数型检验:如秩和检验,统计量为中位数等,对总体不作要求,但检验效能较低。方差分析:属于参数型检验,对两组以上均数的统计学检验。主要用于实验设计。有随机区组设计、拉丁方设计、正交设计及析因实验等。两类错误:第一类:假阳性或误诊(拒绝真实的0假设,概率为α,已知),第二类:假阴性或漏诊(接受不真实的0假设,概率为β,未知)。保障随机性、扩大样本量、提高实验或调查数据的准确性等可减少两类错误的发生。单因素分析与多因素分析:对资料进行分析的一般步骤。先进行单因素分析,对有统计学意义的因素再进行多因素分析。这样做的结果可使结构清晰,层次分明,收到意想不到的效果。相关:指两随机变量之间存在关系,用相关系数描述其关系密切的程度。回归:进一步若两变量存在函数关系(也称因果关系),且该函数关系经统计学检验是有意义的,则称两变量存在回归关系,该回归关系称为回归方程。多元回归,线性与非线性回归,Logistic模型,Cox模型。

1 / 5
下载文档,编辑使用

©2015-2020 m.777doc.com 三七文档.

备案号:鲁ICP备2024069028号-1 客服联系 QQ:2149211541

×
保存成功