医学统计学考试重点

bikachao
1 ℃
2020-02-25

整理文档很辛苦，赏杯茶钱您下走！

还剩 ... 页未读，继续阅读 >>

免费阅读已结束，点击下载阅读编辑剩下 ... 页

阅读已结束，您可以下载文档离线阅读编辑

资源描述

变量：在确定总体之后，研究者则应对每个观察单位的某项特征进行测量和观察，这种特征称为变量。变异：同质基本上的个体差异称为变异。同质：指对研究指标影响较大的，可以控制的主要因素尽可能相同。定量资料：亦称计量资料，是对每个观察对象的观察指标用定量方法测定其数值大小所得的资料，一般用度量衡单位。计数资料：是先将观察对象的观察指标按性质或类别进行分组，然后计数各组该观察指标的数目所得的资料。有序资料：变量的观测值是定性的，表现为互不相容的类别或属性。总体：是同质的所有观察单位某种观察值（变量值）的集合。样本：是总体中随机抽取部分观察单位，其实测值的集合。随机误差：指那些除了系统误差以后尚存的误差。系统误差：由于仪器未校正，测得者感观的某种偏差，使医生掌握疗效指标偏高或偏低。抽样误差：由个体变异产生的，随机抽样引起的样本统计量与总体参数间的差异称为抽样误差。随机抽样：就是按随机化原则（即总体中每一个观察单位都有同等的机会被选入到样本中来）获取样本，以避免误差和偏倚对研究结果有所影响。概率：是描述随机事件发生的可能性大小的数值，常用P表示。参数：是根据总体分布的特征而计算的总体统计指标。统计量：由总体中随机抽取样本而计算相应样本指标。频数：不同组别内的观察值个数称为频数，表示观察值在各组内出现的频繁程。频数分布表：将分组标志和相应的频数列表，即为频数分布表，简称频数表。集中趋势：是指一组数据向某一个位置聚集或集中的倾向。离散程度：是指一组数据的分散性或变异度。标准正态分布：若X服从正态分布N（u，б2），经变换后，u服从均数为0，标准差为1的正态分布，这种正态分布称为标准正态分布。对称分布：是指集中位置在中间，左右两侧的频数基本对称。偏态分布：是指频数分布不对称，集中位置偏向一侧。平均数：是一类描述计量资料集中位置或平均水平的统计指标，在医学领域中常用的平均数有算术均数、几何均数及中位数。算术均数：简称均数，描述一组同质计量资料的平均水平。统计学中常用希腊字母μ表示总体均数，用x表演示样本均数。几何均数：对于原始观察值呈偏态分布，但经过对数变换后呈正态分布或近似正态分布的资料，如血清抗体滴度、细菌计数等，宜采用几何均数描述其集中趋势。中位数：是将一组观察值按大小顺序排列后位次居中的观察值。极差：亦称全距，即全部观察值中最大值与最小值之差，用符号R表示。极差大，说明变异程度大；反之，说明变异程度小。百分位数：是指将观察值从小到大排列后处于第x百分位置上的数值。变异系数：（简记为CV），亦称离散系数，为标准差与均数之比。医学参考值：是指包括绝大多数正常人的人体形态、功能和代谢产物等各种生理及生化指标常数，也称正常值。医学参考值范围：由于存在着个体差异，生物医学数据并非常数，而是在一定范围内波动。标准误：样本均数的标准差称为标准误。参数估计：用样本统计量估计总体参数称为参数估计，是统计推断的一个重要方面。可信区间：亦称置信区间，指按预先给定的概率估计未知总体均数的可能范围。检验水准：亦称显著性水准，用α表示，是预先规定的概率值，在实际工作中一般取α=0.05。Ⅰ型错误：指拒绝了实际上成立的H0，即“弃真”的错误。Ⅰ型错误的概率用а表示，若确立检验水准为а=0.05，则犯第一类错误的概率为0.05。Ⅱ型错误：指接受了实际上不成立的H0，即“存伪”的错误。Ⅱ型错误的概率用β表示。P值：是指在H0所规定的总体中随机抽样，获得等于及大于（或等于及小于）现有样本统计量的概率。随机变量：取值不能事先确定的观察结果，其不能用一个常数来表示，每个变量取值服从特定的概率分布。相对数：是两个有关联的指标之比，是分类变量常用的描述性统计指标，如率、构成比、相对比。率：是指某现象实际发生数与可能发生某现象总数之比，用以说明某现象发生的频率或强度，又称频率指标。常用百分率、千分率、万分率或十万分率等表示。构成比：是指事物内部某一部分观察单位数与事物内部各部分观察单位的总数之比，说明事物内部各部分所占的比重。常用百分数表示。相对比：是指两个有关指标之比，简称比，用以说明一个指标是另一个指标的几倍或几分之几。两个指标可以是绝对数、相对数或平均数；或以性质相同，也可以性质不同。参数检验：以特定的总体分布（如正态分布）作为前提，对总体参数进行假设检验，这类检验方法称为参数检验。非参数检验：不依赖于总体分布类型、不针对总体参数的检验方法，如假设两总体分布相同检验统计量基于变量的秩等，这类检验方法称为非参数检验。参数统计：本样所来源于的总体分布类型已知，而对其中未知的参数进行估计和检验称非参数统计：总体分布型未知，统计时不依赖于总体分布型而进行计算，它检验的是分布而不是参数，非参数统计不需对总体分布作出特殊假设。秩次：变量值按照从小到大顺序所编秩序号，叫秩次。秩和：各组秩次的合计，叫秩和，是非参数统计的基本统计量。率的标准误：指用以衡量由于抽样引起的样本率与总体率之间的误差的统计量。总变异：样本中全部实验单位差异叫总变异。组内变异：处理组内每个观察值之间的差异来源于同一总体内的个体变异和测量误差.组间变异：不同处理组样本均数之间的差异称为组间变异。医学统计学：应用概率论和数理统计的基本原理和方法，研究医学领域中数据的收集、整理和分析的一门科学。医学参考值范围：Z=（X-X）/S。P（？X？）=P（X-X1/SZX-X2/S）=P（？Z？）=（1-Φ？）-Φ？=？。90%双：X+-1.64S；单：+1.28S。④95%双：+-1.96S；单：+1.64S。⑤99%双：+-2.58S；单：+2.33S。T检验：（1）建立检验假设，确定检验水准：H0：μ=μ0，H1：μ≠μ0（2）计算检验统计量。（3）根据P值，做出推断结论。单样本t检验：t=X-μ0/SX=（X-μ0）/（S/√n）。μ0总体均数，S样本均数的标准差，SX标准误。配对样本均数：非独立样本均数。T=d/Sd/=d/(Sd/√n)。Sd差值样本标准差（1）~H0：μd=0，H1：μd≠0。（2）~。（3）~，自由度v=n-1，查表得t0.05/2,v=?，有无统计学意义，H0和H1状态，结论。两独立样本，t=|X1-X2|/SX1-X2。V=n1+n2-2。Sc2为合并方差，SX1-X2为差值的标准误。（1）~H0：μ1=μ2，H1：μ1≠μ2。（2）~（3）V，t0.05/2，v=？，t？t0.05/2，v，p？0.05，按ɑ=0.05的水准判断H0和H1，差异有统计学意义，可以认为。。。或尚不能认为。。。④（方差不齐两样本均数的t检验）方差齐性检验（F检验），要求服从正态分布。（1）~H0：σ12=σ22，H1：σ12≠σ22（2）F=S12/S22。V=n-1。（3）V1=？V2=？，F0.05/2，（V1，V2）≈？，FF0.05/2，（V1，V2）故p0.05，差别有统计学意义，按ɑ=0.05的水准判断H0和H1。故认为两组总体方差不齐，不可直接用两独立样本均数t检验，要用t’检验。卡方检验：X2检验。1、四格表资料：（1）H0：π1=π2，H1：π1≠π2，（2）~（3）v=（行数-1）（列数-1），P0.05，按ɑ=0.05的水准判断H0和H1，可以认为...既...。通用公式：X2=∑(a-T)2/T，T=ni×nj/n，ni和nj表示周边合计数。专用公式：X2=（ad-bc）2n/(a+b)(c+d)(a+c)(b+d)。校正公式：X2=∑(|A-T|-0.5)2/T=（|ad-bc|-n/2）2n/(a+b)(c+d)(a+c)(b+d)。④确切概率法：P=(a+b)!(c+d)!(a+c)!(b+d)!/a!b!c!d!n!。n≥40时,且所有T≥5时用；n≥40但有1≤T5，用；n40，或T1时用④。2、配对四格表资料：X2=（b-c）2/b+c，v=1。X2=（|b-c|-1）2/b+c。（b-c）≥40用，（b-c）40用。（1）H0：B=C，H1：B≠C。（2）~（3）查X2界值表得P值，按ɑ=0.05的水准判断H0和H1和结论。3、R×C列联表资料：X2=n{（Aij2/ni×nj）-1}，v=(R-1)(C-1)。（1）~（2）~（3）查界值表得P值，按ɑ=0.05的水准判断H0和H1和结论。4、多个样本率间多重比较：两两比较，算出X2值和P值，三组间比较，检验水准ɑ’=0.0166。（1）H0：πA=πB，H1：πA≠πB（2）~~（3）按检验水准ɑ’=0.0166，得V=1的X2界值在5.03~6.63之间，X0.0166,12≈5.97，两两相比，判断H0和H1和有无差异，最后说明那个更好。1、医学统计学的主要作用是：由样本数据获得的结果，需要对其进行统计描述和统计推断，统计描述可以使数据更容易理解，统计推断则可以使用概率的方式给出结论，两者的重要作用在于能够透过偶然现象来探测具有变异性的医学规律，使研究结论具有科学性。2、医学统计学的基本内容：医学统计学的基本内容包括统计设计、数据整理、统计描述和统计推断。统计设计能够提高研究效率，并使结果更加准确和可靠，数据整理主要是对数据进行归类，检查数据质量，以及是否符合特定的统计分析方法要求等。统计描述用来描述及总结数据的重要特征，统计推断指由样本数据的特征推断总体特征的方法，包括参数估计和假设检验。3、统计描述和统计推断的主要特点是：统计描述结果的表达方式主要是通过统计指标、统计表和统计图，统计推断主要是计算参数估计的可信区间、假设检验的P值得出相互比较是否有差别的结论。4、统计量和参数的差别是：统计量是描述样本特征的指标，“全体”数据算出。5、常见的三类误差是什么？应采取什么措施和方法加以控制：系统误差、随机测量误差、抽样误差。系统误差由一些固定因素产生，随机测量误差是生物体的自然变异和各种不可预知因素产生的误差，抽样误差是由于抽样而引起的样本统计量与总体参数间的差异。6、线性回归与相关的区别：相关系数的计算只适用于两个数值变量都服从正态分布的情形，而在回归分析中，应变量是随机变量，自变量既可以是随机变量也可以是给定的量。线性相关表示两个变量之间的相互关系是双向的，线性回归则反映两个变量至今啊单向的依存关系，更适合分析因果关系的数量变化。7、线性回归与相关的联系：对同意资料进行相关于回归分析，相关系数r与回归方程中的b正负号相同，r和b为正，说明X与Y的数量变化的方向是一致的，X增大，Y也增大，符号相反说明方向相反。对用一样笨可以dehumidifierr与b相互转化的公式，两种假设检验完全等价。由于r的假设检验可以直接查表，较为简单，所以也可以用其代替对b的假设检验。相关与回归可以相互解释。R的平方成为绝对系数，表示为越接近1，回归效果越好。