医学统计学(MedicalStatistics)第一节统计学中的几个基本概念一、总体与样本populationandsample总体:根据研究目的确定的同质研究对象的全体(集合)。分有限总体与无限总体样本:从总体中随机抽取的部分观察单位2.同质与变异homogeneityandvariation同质:影响被研究指标的非实验因素相同称为同质。变异:指同质基础上的个体差异。3.参数与统计量parameterandstatistic参数:总体的统计指标,如总体均数、标准差,采用希腊字母分别记为μ、σ。固定的常数统计量:样本的统计指标,如样本均数、标准差,采用拉丁字母分别记为。参数附近波动的随机变量SX、4.误差error误差:实际观察值与客观真实值之差(1)系统误差(2)随机误差1)系统误差systematicerror在实际观测过程中,由受试对象、研究者、仪器设备、研究方法、非实验因素影响等原因造成的有一定倾向性或规律性的误差。流行病学称之为偏倚(bias)。特点:观察值有系统性、方向性、周期性的偏离真值。可以通过严格的实验设计和技术措施消除。(2)随机误差randomerror排除上述误差后尚存的误差,受多种无法控制的因素的影响。特点:大小方向不一的随机变化。随机测量误差(randommeasurementerror)——提高操作者熟练程度可以减少这种误差随机抽样误差(randomsamplingerror):由抽样造成的样本统计量和总体参数间的差异。不可避免,但有一定的分布规律,可估计。5.概率probability确定性现象:在一定条件下,一定会发生或一定不会发生的现象。其表现结果为两种事件:肯定发生某种结果的叫必然事件;肯定不发生某种结果的叫不可能事件。随机现象:在同样条件下可能会出现两种或多种结果,究竟会发生哪种结果,事先不能确定。其表现结果称为随机事件。随机事件的特征:①随机性;②规律性:每次发生的可能性的大小是确定的。概率:随机事件发生的可能性大小,用大写的P表示;取值[0,1]。小概率事件必然事件P=1不可能事件P=0随机事件0P1P≤0.05(5%)或P≤0.01(1%)称为小概率事件(习惯),统计学上认为不大可能发生。6、变量及变量值观察对象的特征或指标称为变量(variable)。对变量进行测量的结果称为变量值或观察值。第二节统计资料的类型1.计量资料2.计数资料3.等级资料4.三类资料间关系1.计量资料对每一个观察单位用定量的方法测量其某项指标的大小所获得的数据,即为计量资料measurmentdata。也叫定量数据Quantitativedata特点:有计量单位,如患者的身高(cm)、体重(kg)、血压(mmHg)、脉搏(次/分)、红细胞计数(1012/L)2.计数资料把观察单位按某种属性或类别分组,然后清点每组的个数所获得的数据,称计数资料(countdata)或enumerationdata。也叫定性数据Qualitativedata特点:无固有计量单位,如肤色(黑、白)、血型(ABO)、职业(工农兵)、性别(男女)3.等级资料Rankdata把观察单位按某种属性或类别的不同程度分组,然后清点每组的个数所获得的数据。有大小顺序,所以也叫有序分类资料(ordinalcategorydata)。①癌症分期:早、中、晚。②药物疗效:治愈、好转、无效、死亡。③尿蛋白:,,,++,+++及以上胆管癌患者部分指标编号性别年龄(岁)部位分化程度分期肝转移PCNA指数生存时间(月)(1)(2)(3)(4)(5)(6)(7)(8)(9)1男61上低分化Ⅰ阳性52142女58中高分化Ⅱ阴性89203女63上高分化Ⅳ阴性93194女71下中分化Ⅱ阳性7855男59上高分化Ⅲ阴性8535………………………体重指数身高班制劳动强度紧张程度心率嗜肥肉史收缩压舒张压中风家族史(1)(2)(3)(4)(5)(6)(7)(8)(9)(10)12.241.6211370114690有16.471.6331372011070无15.191.6412272010070无15.591.6311384111470无12.601.6431368111668无…………………………第三节统计工作的基本步骤1.统计设计:包括调查、实验设计。2.收集资料:取得准确可靠的原始资料3.整理资料:对资料进行清理、改错,数量化4.分析资料:统计描述、统计推断